关于GPT-5.6的传闻升温,用户发誓ChatGPT突然变得更聪明。

CN
Decrypt
關注
3 小時前

这一周,ChatGPT感到有些不同—很多人立刻注意到了这一点。


在X平台上,测试者们在过去两天交换了屏幕截图和秒表时间,所有的线索指向一个理论:OpenAI正在悄悄地在ChatGPT内部进行GPT-5.6的A/B测试,部分选择GPT-5.5 Pro的用户被替换。


开发者Anshu Chimala 周四发布了一段横向对比视频,比较了一次性着陆页面,并附注:“好吧好吧好吧,我是幸运人士之一,早期获得了GPT-5.6 Pro的访问权限。”



开发者Dobroslav Radosavljevič 在X上发布表示他在Codex中运行的任何东西,“感觉和[5.5模型]完全不同。”下面的回复分为信 believers和称其为安慰剂的人。


帖子中最清晰的模式是时间。Conor Dart是众多在X上放大这些谣言的用户之一,他测试了一款一次性提示的3D浏览器游戏—包括物理和相机控制—生成时间超过一个小时,而GPT-5.5 Pro的通常生成时间为10分钟。


“并不完美,但作为一次性提示的人工智能游戏开发测试,这真的令人印象深刻,”Dart写道。



人工智能内部人士Chetas Lua 报告了在测试一种机器人模拟时的类似减慢,他也很确信他的结果来自OpenAI的新模型:“GPT 5.6 Pro在3D测试中继续击败[Anthropic的Fable 5],”他写道。“也在调整一次性提示的游戏。”


在一篇单独的帖子中,他注意到响应时间延长到20或40分钟,他说这种速度自GPT-5.5发布前就没有出现过。



并非每一个比较都对这个传闻中的模型表示赞赏。在X上的AI基准测试者Chris给两个模型同样的航天器建造提示—可疑的GPT-5.6 Pro运行了87分钟,而GPT-5.5 Extra High则为34分钟42秒。


“正如我之前所说,基于权威的消息,GPT-5.6将是对GPT-5.5的一次渐进式/实质性改进,而不是Fable的杀手,”他写道,并指出Fable 5在航天器的核心几何上仍然击败了两个模型。“我粗略的预期是,它将在一些基准测试中与Fable 5展开竞赛,可能在某些类别中胜出一半,但总体上没有明显超过。”





一篇归因于泄密者Pankaj Kumar的单独帖子详细描述了更深入的泄漏:知识截止日期推迟到2025年12月,一些测试者称“Juice Value”的推理努力设置 allegedly 从768提高到960,SVG和3D设计生成能力足够强大,可以在某些任务上打败Fable 5。


这些信息都没有来自OpenAI—但各个账户之间的细节是一致的:更强的推理能力、未完成的前端和一个被称为Kindle-Alpha的候选版本。


一位名为Leo的人工智能影响者引用匿名来源,在一条线程中写道,可疑模型“现在在选择ChatGPT的5.5 Pro时进行隐秘测试,”至少对于一些Pro账户,计划于下周四6月25日公开发布。



在所有这些中,最接近OpenAI指纹的可能是一份备忘录,而不是推文。首席科学家Jakub Pachocki据报道告诉员工,下一个模型是对GPT-5.5的显著改进,根据《信息》的一份报告。这仍然不是对A/B测试、发布日期或任何在X上流传的规格的确认,但确实确认了一个新模型正在酝酿中。


Decrypt联系OpenAI询问GPT-5.6是否正在ChatGPT内部测试,但在发布日期时公司没有回复。


为何OpenAI可能急于推出新产品


如果OpenAI正在急于推出一款新的旗舰模型,那也有其原因。中国的开源模型GLM-5.2在FrontierSWE上仅比Claude Opus 4.8低一分,这是一项通过占主导地位的速度对人工智能代理进行多小时、开放式工程项目评分的基准测试—同时在同一测试中直接超越了GPT-5.5。


与此同时,Anthropic也在处理自己造成的损害。公司的旗舰产品Mythos 5和Fable 5模型仍然在美国出口管制指令下被解除,这一指令是在6月12日针对一个有争议的越狱漏洞,留出了市场最高端的空白,让GLM-5.2和假想的GPT-5.6都处于填补这一空白的位置。


如果Anthropic首席执行官Dario Amodei与总统特朗普达成和解,那么Fable 5将比现在可用的任何其他模型更加强大,Anthropic的顶级模型和OpenAI之间的质量差距将变得更大。


桌上还有钱可赚。根据《华尔街日报》的报道,OpenAI正在考虑降低价格,以应对开发者和企业的代币收费,因为双方都在为即将到来的IPO做准备。


OpenAI是否会推出实际的GPT-5.6只有其自己能够确认,而在一周的泄密检查点和隐秘测试声明中,该公司保持了沉默。不过,Polymarket的交易者们并没有等着—6月22日至6月28日间的发射合同本周的价格已高达89%。


免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接