找回密码
 立即注册
搜索

科幻电影场景或成为现实 OpenAI发布“全能”人工智能模型

参考消息网5月15日报道 据法新社5月13日报道,美国开放人工智能研究中心(OpenAI)13日发布了性能更佳、更像人类的人工智能(AI)模型,该技术是其流行的聊天生成预训练转换器(ChatGPT)的基础,并向所有注册用户免费开放。

OpenAI旗舰产品发布更新的时间恰好在搜索引擎巨头谷歌预计将发布关于“双子座”人工智能模型(Gemini)公告的前一天,谷歌正利用这一人工智能工具与OpenAI展开正面竞争。

OpenAI首席技术官米拉·穆拉蒂在备受期待的旧金山发布会上说:“能把GPT-4o带给所有的免费用户,我们感到非常非常兴奋。”

OpenAI表示,新模型GPT-4o(其中的英文小写字母o代表omni,意为“全能、全面的”)将在未来几周更新到OpenAI的各个产品中,付费用户可以无限制地使用该工具。

OpenAI表示,该模型可以生成内容或理解语音、文本或图像形式的命令。

灵感来源是《她》

OpenAI首席执行官萨姆·奥尔特曼在一篇博客文章中说:“新的语音(和视频)模式是我用过的最好的电脑界面。感觉就像电影里的人工智能。”

奥尔特曼之前曾表示,美国科幻电影《她》中由斯嘉丽·约翰逊配音的人工智能角色是他的灵感来源,他希望与人工智能的互动能变得像电影中那样。

他补充说:“我过去与电脑交谈从来都不觉得很自然;但现在感到很自然。”

穆拉蒂和OpenAI的工程师在线上直播的发布会中展示了GPT-4o的新功能,他们给增强版的ChatGPT聊天机器人提出各种挑战。

在演示中,OpenAI的工作人员主要向语音版本的ChatGPT提出问题,ChatGPT则以笑话和类似人类的谈笑来回应。

这款人工智能可以把英语翻译成意大利语,理解人的面部表情,并协助用户一步一步地解决很难的代数问题。

OpenAI表示,GPT-4o在文本、推理和编码智能方面与之前的版本具有相同的功能,并在多语言对话、音频和视觉方面设定了新的行业标准。

在一次演示中,ChatGPT成功地通过智能手机摄像头解读了一名OpenAI员工周围的环境,用一种友好、女性化的声音说话,与电影《她》中的人工智能机器人没什么不同。

与人类更相似

13日的发布会只是人工智能竞赛的最新一幕,OpenAI背后的微软公司已经超越苹果公司,成为全球按市值计算最大的公司。

OpenAI和微软正与谷歌展开激烈竞争,双方都想成为生成式人工智能的最主要参与者,而脸书网站的母公司元宇宙平台公司和新贵Anthropic公司也在采取重大举措参与竞争。

向所有用户开放新模型可能会引发对OpenAI盈利途径的质疑,因为人们怀疑普通用户是否准备好支付订阅费用。

到目前为止,OpenAI或谷歌的聊天机器人只有性能较低的版本可以免费提供给用户。

奥尔特曼在博客中说:“我们是一家企业,会找到很多可收费的地方。”

另据美国消费者新闻与商业频道网站5月13日报道,OpenAI周一发布了一个新的人工智能模型和ChatGPT桌面版,同时更新了用户界面。这是该公司为扩大其热门聊天机器人的使用范围所做的最新努力。

OpenAI技术部门负责人穆拉蒂在直播活动中说,这次更新使得所有OpenAI用户都能使用GPT-4。新模型GPT-4o“速度快得多”,文字、视频和音频能力均有所提高。OpenAI称,它计划最终使用户能与ChatGPT进行视频聊天。

穆拉蒂说,新模型使ChatGPT能以更快的速度、更好的质量处理50种不同的语言。

她还说,GPT-4o的速度是GPT-4 Turbo的两倍,价格则是后者的一半。

OpenAI的团队成员展示了新模型的音频能力。OpenAI的研究人员马克·陈说,该模型能够“感知你的情绪”。它可以分析用户的面部表情,并说出此人可能正在经历的情绪。

OpenAI还称,这个新模型最快能“在232毫秒内”对用户给出的语音提示做出反应,而“平均反应时间为320毫秒,与人类在交谈中的反应时间类似”。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册