一位热力学专业的博士手绘了一张“太空AI数据中心”草图,但不知道散热板要建多大,于是他把草图和问题一起输入进ChatGPT。10秒钟后,“正式版”o1模型给出了回复:242万平方米。这名博士补充道:“这大概是2%旧金山土地的面积。”在他旁边,OpenAI创始人、CEO山姆·奥特曼歪了歪头,“看上去还行。”
这是北京时间12月6日凌晨,OpenAI一场直播上山姆·奥特曼和OpenAI公司研究员的互动内容,从这天起,OpenAI将连续12个工作日进行直播,展示新发布内容。在第一场直播上,OpenAI展示了正式版o1模型的各项新晋能力:支持图片+文字同时输入、更快地响应时间、针对难度不同的问题给出不同的响应速度等。
值得注意的是,本次OpenAI还推出了比o1能力更强的o1“pro”版模型,该模型收费高达200美元/月,创造了大模型月付费的新高。
OpenAI创始人、CEO山姆·奥特曼与公司研究员一起直播。图/OpenAI官网
O1模型从预览版正式“转正” 思考速度提升 响应更快
今年9月,OpenAI发布了o1系列模型的预览版“o1-preview”,而本次直播,o1正式“转正”。据介绍,该模型改进了推理和逻辑能力,能够提高回答的准确性和实用性。
在奥特曼展示的能力对比图中,o1模型解答美国数学竞赛试题的准确率达到83.3%,相比之下预览版准确率为56.7%,gpt4o的准确率则只有13.4%。编码能力上o1模型与gtp4o的差距更是拉大到了89分与11分。差距相对较小的则是在解决博士级别科研问题上,o1的准确率反而比o1预览版略低,二者分别为78%与78.3%,相比之下gpt4o的准确率为56.1%,而人类专家的准确率是69.7%。
o1与o1预览版、gtp4o在计算、编码、回答博士级别问题的表现对比。图/OpenAI官网
此前,o1模型预览版在用户试用时总被诟病的一点是模型回答问题的准确率虽然有所提升,但响应时间慢了很多。对此,奥特曼表示o1模型将可以更迅速地回答简单问题,只在面对复杂问题时需要较长的响应时间。
同时,对于复杂问题的响应速度,o1模型也比o1预览版大大加快。在演示中,研究人员向o1模型提了一个问题:列出罗马帝国在公元2世纪的统治者,包含其在位时间和成就。o1模型花了将近18秒来回答这个问题,虽然仍比gtp4o低,但比o1预览版的速度提高了约60%。
此外,o1还引入了多模态能力,如上文提到的,OpenAI一名拥有热力学博士学位的亚裔研究员通过向o1模型中输入手绘草图+文字提问的方式,获得了“在太空建设数据中心如何散热”这一问题的回答。贝壳财经记者注意到,o1模型在回答该科学问题时,不仅详细列出了思考步骤,还在回答中列出了计算公式。
o1-Pro费用每月订阅费用200美元
值得注意的是,就像苹果、华为等推出旗舰手机时往往还会推出一个“pro”版本,本次奥特曼也不仅介绍了o1正式版模型,还介绍了该模型的“pro”加强版本,并直言pro版本o1模型的订阅费用为每月200美元。
奥特曼表示,o1模型是“世界上最智能的语言模型”,除了o1“pro”版本,他在列出的一项数据中表示,o1-pro模型对博士水平科学问题的解答准确率为79.3%,解答美国数学竞赛试题的准确率则为85.8%,已经超越了o1模型。
根据OpenAI提供的资料,o1-pro模型最大的亮点在于其推理的可靠性,模型对每个问题都将进行四次尝试,只有四次尝试都正确,才会认为一个问题已经解决。
目前,用户已经可以在ChatGPT的套餐中选择o1模型,价格为每月20美元,而pro版本是该价格的十倍。对此,有不少网友吐槽“谁能用得起这么贵的模型。”
对此,奥特曼于直播后在个人社交平台回应,“一小部分用户希望频繁使用 ChatGPT,甚至达到了使用频率限制,他们希望支付更多费用来解决真正复杂的问题。每月200美元的订阅等级非常适合他们。”
新京报贝壳财经记者 罗亦丹 编辑 王进雨 校对 柳宝庆