当前位置:首页 > 热点 > 财经观察:提升人机交互效率 多模态大模型易用性进一步推进

财经观察:提升人机交互效率 多模态大模型易用性进一步推进

2024-11-01 16:31:04 [时尚] 来源:兰州市某某设备经销部

人民网北京5月14日电 (焦磊、财经实习生张泊洋)陪人聊天、观察帮助分析工作中的提升态上海市某某电气维修站问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,人机聊天机器人“Samantha”用充满智慧和幽默的交互进回答展示出高度的智能性和适应性。当下,效率性进这些来自过去的多模科幻想象正加速照入现实中。

北京时间5月14日凌晨,模型美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。易用据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,步推GPT-4o可以接收文本、财经上海市某某电气维修站音频和图像的观察任意组合作为输入,并实时生成文本、提升态音频和图像的人机任意组合进行输出,其中“o”代表“omni全能”。交互进

一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。

模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务。

作为面向未来人机交互范式的全新大模型,GPT-4o具有文本、语音、图像三种模态的理解力,并可以综合对话者语气和所处环境空间等因素进行回答,展现出了高度智能性。

发布会上,GPT-4o展示了多项多模态交互能力。在进行实时语音交流时,其响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”

此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,此次GPT-4o的发布,将促使多模态综合交互成为生成式AI的重点发展方向,进而提升人机交互效率,逐渐向AGI方向迈进。

国盛证券研报分析,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化。

多模态大模型包含的图文、音频、视频内容数据量巨大,进而引发人们对算力供应的关注。业内分析认为,未来AI的发展对算力的需求将会是几何式增长,算力限制可能是影响生成式AI应用开放使用的重要因素,而算力的可获取性以及成本将是挑战之一。此外,多模态大模型还将带来更严峻的安全挑战。

米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。

据介绍,用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

OpenAI CEO山姆·奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。

(责任编辑:知识)

推荐文章
  • 巴西总统头带缝线伤疤出席活动

    巴西总统头带缝线伤疤出席活动   10月25日,79岁巴西总统卢拉在头部意外受伤后首次出席活动 ,缝线和伤疤清晰可见。19日,卢拉在浴室剪脚趾甲摔倒割伤后脑勺,缝了五针。由于此次意外,卢拉不得不以视频方式参加金砖峰会,并取消联合国 ...[详细]
  • 中新健康丨两部门:确保2024年底前将符合条件的村卫生室纳入医保定点管理

    中新健康丨两部门:确保2024年底前将符合条件的村卫生室纳入医保定点管理 中新健康丨两部门:确保2024年底前将符合条件的村卫生室纳入医保定点管理2024-07-31 09:53:23 来源:中国新闻网 ...[详细]
  • 考研英语拿80分是什么水平?!

    考研英语拿80分是什么水平?! ‍关于考研英语,小研最近看到很多小伙伴问,“我底子很差,四级都没过,英语过复试线会不会太难了?”、“考研英语上80是什么水平,很难吗?”,关于这些问题,今天就来给大家一个集中回答!01考研英语80分是 ...[详细]
  • OpenAI突然更新!GPT

    OpenAI突然更新!GPT 作者 | 香草编辑 | 李水青GPT-4o的高级语音功能,终于不再是“期货”了!智东西7月31日消息,今天凌晨,OpenAI宣布开始向一小部分ChatGPT Plus用户推出高级语音模式,基于GPT- ...[详细]
  • 打虎!张效廉被查

    打虎!张效廉被查   来源:新京报  中央纪委国家监委网站10月21日消息,十三届全国政协经济委员会副主任张效廉涉嫌严重违纪违法,目前正接受中央纪委国家监委纪律审查和监察调查。张效廉资料图)  公开简历显示,张效廉出生 ...[详细]
  • 首批港澳非中国籍永久性居民来往内地通行证发放

    首批港澳非中国籍永久性居民来往内地通行证发放   据央视新闻客户端消息,7月31日,首批申办往来内地通行证的港澳永久性居民中的非中国籍人员获发证件。根据相关规定,持证人在证件5年有效期内可以多次来往内地,每次停留不超过90日。此外,持证人在口岸履 ...[详细]
  • 董志豪晋级巴黎奥运会男子200米蛙泳决赛

    董志豪晋级巴黎奥运会男子200米蛙泳决赛 董志豪晋级巴黎奥运会男子200米蛙泳决赛 来源:视频综合) 北京时间7月31日,巴黎奥运会男子200米蛙泳半决赛,中国选手董志豪、覃海洋出战。最终,董志豪以2分08秒99顺利晋级,覃海洋无缘 ...[详细]
  • 苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替

    苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替 克雷西 发自 凹非寺量子位 | 公众号 QbitAI它来了它来了,苹果的Apple Intelligence终于与果粉见面了!随着iOS 18.1 Beta版的上线,注册开发者从即日起就能体验到苹果A ...[详细]
  • 全新设计/轴距加长 全新大众探岳L预计11月4日亮相

    全新设计/轴距加长 全新大众探岳L预计11月4日亮相 版权声明:本文版权为网易汽车所有,转载请注明出处。网易汽车10月24日报道目前据我们获悉,一汽-大众全新探岳参数丨图片)L预计将于11月4日正式亮相。新车定位中型SUV,采用大众最新的家族化设计风格, ...[详细]
  • 19个新职业、28个新工种信息正式发布

    19个新职业、28个新工种信息正式发布   为健全符合我国国情的现代职业分类体系,大力发展新业态、新模式,开发新的就业增长点,2019年人力资源社会保障部建立完善新职业信息发布制度,实施职业分类动态调整,此后每年发布1至2批新职业信息。   ...[详细]