OpenAI 发布 GPT-4.5:迄今为止最友好的模型,价格为 1300%

CN
Decrypt
关注
8小时前

OpenAI在周四发布了GPT-4.5,恰好是在Anthropic推出Claude 3.7 Sonnet的前一天,以及xAI的Grok-3首次亮相和DeepSeek宣布即将推出新模型的一周之后。

而“昂贵”是这里的关键词。OpenAI的新模型的API价格高达$75每百万输入令牌,输出令牌则为每百万$150。

这似乎是AI竞赛中的一个新竞争阶段,各公司争相推出越来越强大——也越来越昂贵——的模型。

作为对比,这比Claude 3.7 Sonnet贵了十倍,这可能对许多希望在该技术上构建的开发者和初创公司来说是一个障碍。

GPT-4o(其前身)的输入成本为每百万令牌$2.50,输出为每百万令牌$10.00——这使得GPT-4.5的输入成本增加了2900%,响应成本增加了1300%。

OpenAI的首席执行官Sam Altman在发布会上毫不避讳地承认该模型的巨大资源需求。“坏消息:这是一个巨型、昂贵的模型,”他说。

“提醒一下:这不是一个推理模型,不会打破基准。这是一种不同类型的智能,”Altman说。“其中有一种我从未感受过的魔力。”

这似乎是关键。用户支付1300%的费用并不是为了获得一个更智能的模型,而是为了获得一个感觉更人性化的模型。

例如,根据OpenAI的说法,GPT-4.5的一个亮点在于他们所称的“氛围”,本质上是模型的情商、温暖和协作感。

该公司创建了一个“氛围测试集”,用于测量创造性智能和对话质量,GPT-4.5在该测试集上的表现据称优于其他模型。

在演示中分享的示例并没有引入任何新内容。

第一个演示的提示字面上是:“天哪!我的朋友又取消了我的计划!!!发一条短信告诉他们我讨厌他们!!!”这显然不是你会使用一个合格的大型语言模型的场景。

在随后的演示中,研究人员将GPT-4.5与OpenAI的o1模型进行比较,要求两个AI解释AI对齐的必要性,并帮助撰写一条给取消计划的朋友的消息。

尽管GPT-4.5在某些细微之处显示出改进,但其响应似乎并不革命性。区别在于语气。

在另一个例子中,研究团队询问强大的GPT-4.5为什么海水是咸的。

新模型使用了更简单的术语作答——“因为雨、河流和岩石”——相比于之前的模型。

GPT-4-Turbo给出了更全面和详细的回答,研究团队对此并不满意,认为“你会感觉它想让你知道它有多聪明。”

演示中的一个有趣细节是一个彩蛋,暗示可能的GPT-6,查询内容为:“GPT-6训练所需的GPU数量。”

也许当那个模型到来时,演示会更加令人印象深刻。

所呈现的基准结果显示出复杂的局面。GPT-4.5在GPQA(科学评估)中得分71.4%,而GPT-4o为53.6%。

然而,它仍然落后于OpenAI的o3-mini模型,该模型通过推理能力得分为79.7%。

在其他基准测试中也出现了类似的模式。在AIME '24数学评估中,GPT-4.5得分为36.7%,超过了GPT-4o的9.3%,但仍远远落后于o3-mini的87.3%。

在编码任务中,GPT-4.5在SWE-Lancer Diamond基准测试中表现优于其前身和o3-mini,但在SWE-Bench Verified中相比于以推理为重点的模型则表现不佳。

Altman用几乎神秘的语言描述了该模型,称其为“第一个让人感觉像是在与一个深思熟虑的人交谈的模型。”

他补充道:“我有好几次坐在椅子上,惊讶于从AI那里获得了真正好的建议。”

在模型的演示中,OpenAI的研究人员解释了公司通过两种不同的方法推动AI的发展:无监督学习和推理。

推理教会模型“在回应之前思考”,而无监督学习则有助于提高“词汇模型的准确性和直觉”。GPT-4.5在后者上加大了力度。

“GPT-4.5是我们在扩大无监督学习、增加世界知识、直觉并减少幻觉方面的下一步,”一位OpenAI的研究负责人在演示中解释道。

根据团队的说法,开发GPT-4.5需要巨大的技术创新。他们必须构建新的推理系统,以高效地服务如此大型的模型,使用低精度训练以最大化GPU的使用,甚至在多个数据中心同时进行训练。

此次发布正值消费者对AI的期望值高涨,竞争也在加剧。GPT-4.5的“不同类型的智能”和改进的“氛围”是否能证明其巨大的资源需求和高昂的定价,仍有待观察。

目前,GPT-4.5对每月支付200美元的Pro用户开放。每月支付20美元的Plus用户将在下周获得该模型的访问权限。

编辑:Sebastian Sinclair

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接