OpenAI发布会回顾:最新旗舰模型免费用 ChatGPT进入实时互动纪元
访问量:027

财联社5月14北京时间周二凌晨1点,自年初“文生视频模型” Sora后许久未给市场带来惊喜的OpenAI举行春季发布会。公司首席技术官Mira Murati向外界展现了多项与ChatGPT有关的更新。

简要来说,OpenAI的发布会主要干了两件事情:首先是发布最新GPT-4o多模态大模型,相较于GPT-4 Trubo速度更快、价格也更便宜。

通过响应速度的大幅提升,该模型在语音模式下已经可以达到“实时”响应的状态。用户可以与ChatGPT像真人一样聊天——在机器人回应的过程中打断它,提出更多的要求,再也不需要等待机器人完成上一个问题的回复后,再提出新的问题。

山姆·奥尔特曼在博客中表示,AI达到人类级别的响应时间和表现力证明是一个很大的改变,这个新东西在感受上是完全不同的。它快速、聪明、有趣、自然且有帮助。

第二件事情就是宣布,ChatGPT的免费用户也能用上最新发布的GPT-4o模型,来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。这也意味着GPT应用商店的开发者,将面对海量的新增用户。

当然,付费用户将会获得更高的消息限额。当免费用户用完消息数量后,ChatGPT将自动切换到 GPT-3.5。另外,OpenAI将在未来1个月左右向Plus用户推出基于GPT-4o改进的语音体验,目前GPT-4o的API并不包含语音功能。

最后,苹果电脑用户将迎来一款为macOS设计的ChatGPT桌面应用,用户可以通过快捷键“拍摄”桌面并向ChatGP提问,OpenAI表示,Windows版本将在今年晚些时候推出。

----发布会全程回顾----

01点00分:倒计时结束,直播正式开始。首席技术官Mira Murati登场。

01点01分:Mira Murati表示,今天她将谈论3件事情:1)为什么一个可以免费、广泛使用的工具对于OpenAI非常重要?2)如何减少摩擦,让每个人都能使用ChatGPT,公司将发布桌面版的ChatGPT;3)公司将在今日发布最新的旗舰大模型,叫做GPT-4o。

这里的“o”指的是“全方位”的意思——指的是GPT-4o的多模态特性。

01点05分:对于桌面版的ChatGPT,OpenAI表示重新对UI进行了设计。

01点08分:GPT-4o具备GPT-4同等的智能,但运行速度更快,兼具文字、音频和视频能力。这是OpenAI历史上第一次在“便于使用”这个目标上实现了飞跃的进步。

01点13分:直到今天之前,在语音模式下,OpenAI仍需要调用三个模型——转写、智能和文生语音功能,这也造成了体验上的巨大延迟。而GPT-4o可以自然地在图片、文字和声音上进行推理。

01点17分:通过效率的提升,也使得OpenAI可以向免费用户提供GPT-4级别的智能。

01点19分:Murati重申,由于GPT-4o带来的效率提升,现在OpenAI可以让所有人都能使用上工具。

01点20分:目前GPT Store里已经有超过100万个GPTs。伴随着免费开放,GPTs的开发者将获得更大的用户基数。

01点22分:免费用户也将能够上传图片、进行分析、使用“浏览器”功能搜索实时信息。同时GPT-4o也将支持记忆功能。GPT-4o也将支持API,供开发者调用。相较于GPT-4 Turbo,GPT-4o快两倍、便宜50%,速率限制高出5倍。

01点25分:两名研究主管Mark Chen和Barret Zoph登台,他们将演示一系列新功能。

01点26分:Mark Chen正在与ChatGPT寒暄,机器人能够从急促的喘气声中理解“紧张”的含义,并且指导他进行深呼吸。

01点28分:Chen表示,他的演示是为了说明,在目前的语音模式下,不需要再与机器进行机械的一问一答,可以进行实时的沟通交流。实时交流中不需要再每次“尴尬地等待2-3秒”。

01点30分:实时演示中,主持们不断要求ChatGPT变换语调,包括夸张的语气、机器人的预期和使用“唱腔”讲故事。

01点35分:Barret Zoph启动摄像头,要求ChatGPT实时帮助他解决一个一元方程题。

01点37分:除了图像识别和解题能力外,ChatGPT展现了实时根据影像变化,与Barret实时互动的能力。

01点40分:Barret进一步展示了ChatGPT桌面版对代码和电脑桌面进行实时解读的能力。

01点42分:Murati和Mark Chen展示ChatGPT进行意大利语、英语的实时交传翻译。

发布会结束,OpenAI表示今天的发布会主要聚焦于免费用户,这些功能将在未来几周内逐步向所有用户推送。

根据OpenAI的官网公告显示,GPT-4o将同时向付费的Plus、Team用户,以及免费用户推出。Plus用户的消息限制数量将是免费用户的5倍,Team和Enterprise用户的可用消息数量还会更高一些。当免费用户的使用量达到限制后,ChatGPT将自动切换到GPT-3.5,以便继续进行对话。