GPT-5会成为夏季的惊喜之作吗?以下是期待的内容

CN
Decrypt
关注
7小时前

小心——OpenAI的GPT-5预计将在这个夏天发布。它会成为人工智能的热门产品吗?

萨姆·阿尔特曼在6月的公司首次播客节目中确认了这一计划,随意提到这个模型——他表示,它将融合之前模型的能力——“可能在这个夏天的某个时候”到来。

一些OpenAI观察者预测它将在接下来的几周内发布。一项分析指出,GPT-4于2023年3月发布,GPT-4-Turbo(为ChatGPT提供动力)则在2023年11月发布。GPT-4o,一个更快的多模态模型,于2024年5月推出。这意味着OpenAI正在更快地完善和迭代模型。

但对于快速变化且竞争激烈的人工智能市场来说,这还不够快。在2月,当被问及GPT-5何时发布时,阿尔特曼在X上表示“几周/几个月”。几周确实变成了几个月,而与此同时,竞争对手们迅速缩小了差距,过去10天内Meta花费了数十亿美元挖走了一些OpenAI的顶尖科学家。

根据Menlo Ventures的报告,OpenAI的企业市场份额暴跌从50%降至34%,而Anthropic则从12%翻倍至24%。谷歌的Gemini 2.5 Pro在数学推理方面绝对摧毁了竞争对手,DeepSeek R-1成为“革命性”的代名词——击败了闭源替代品——甚至xAI的Grok(之前仅因其“趣味模式”配置而闻名)也开始在程序员中受到重视。


图片来源:Menlo Ventures

对GPT-5的期待

根据阿尔特曼的说法,未来的GPT模型将有效地是一个统治所有模型的模型

预计GPT-5将统一OpenAI的各种模型和工具为一个单一系统,消除“模型选择器”的需要。用户将不再需要在不同的专业模型之间进行选择——一个系统将处理文本、图像、音频,甚至可能的视频。

到目前为止,这些任务分布在GPT-4.1、Dall-E、GPT-4o、o3、Advanced Voice、Vision和Sora之间。将所有内容集中到一个真正的多模态模型中是一个相当大的成就。

技术规格看起来也很雄心勃勃。预计该模型将具有显著扩展的上下文窗口,可能超过100万个标记,一些报告甚至推测它将达到200万个标记。作为对比,GPT-4o的最大标记数为128,000。这是处理一个章节与消化整本书之间的区别。

OpenAI在2024年开始在GPT-4-Turbo中推出实验性记忆功能,使助手能够记住用户的姓名、语气偏好和正在进行的项目等细节。用户可以查看、更新或删除这些记忆,这些记忆是随着时间逐渐建立的,而不是基于单次交互。

在GPT-5中,记忆预计将变得更加深度集成和无缝——毕竟,该模型将能够处理近100倍于你的信息,可能达到200万个标记,而不是80,000个。这将使模型能够在几周后回忆起对话,随着时间的推移建立上下文知识,并提供更像个性化数字助手的连续性。

推理方面的改进同样雄心勃勃。预计这一进展将表现为向“结构化思维链”处理的转变,使模型能够将复杂问题分解为逻辑的多步骤序列,反映人类的深思熟虑过程。

至于参数,流传的共识谣言从10万亿到50万亿不等,甚至有引人注目的一千万亿。然而,正如阿尔特曼自己所说,“参数扩展的时代已经结束”,因为人工智能训练技术的重点从数量转向质量,采用更好的学习方法使得较小的模型变得极其强大。

这对OpenAI来说是另一个根本性问题:它正在耗尽互联网数据进行训练。解决方案?让人工智能生成自己的训练数据,这可能标志着人工智能训练的新纪元


图片来源:Sequoia Capital via YouTube

专家观点

“下一个飞跃将在可验证领域的合成数据生成上,”链上人工智能代理Recall的首席执行官安德鲁·希尔告诉Decrypt。“我们在互联网规模的数据上遇到了瓶颈,但推理突破表明,当你有验证机制时,模型可以生成高质量的训练数据。最简单的例子是数学问题,你可以检查答案是否正确,以及代码,你可以运行单元测试。”

希尔认为这具有变革性:“这个飞跃是关于创造新的数据,这些数据实际上比人类生成的数据更好,因为它通过验证循环进行迭代优化,并且生成速度快得多。”

基准测试是另一个战场:人工智能专家和教育者大卫·夏皮罗预计该模型在MMLU上将达到95%,在SWEBench上从32%激增至82%——基本上是一个神级的人工智能模型。如果即使只有一半是真的,GPT-5也将成为头条新闻。而在内部,确实有很大的信心,甚至一些OpenAI的研究人员在发布前就对该模型进行了炒作。

不要相信炒作

Decrypt采访的专家警告说,任何期待GPT-5达到AGI能力水平的人都应该控制他们的热情。希尔表示,他预计这是一个“伪装成革命的渐进步骤”。

西雅图AI咨询公司Northwest AI Consulting的首席执行官怀亚特·梅汉进一步预测,GPT-5可能会“是一个有意义的飞跃,而不是一个渐进的飞跃”,并补充说:“我预计会有更长的上下文窗口,更原生的多模态性,以及代理的行为和推理方式的变化。我并不指望有一个灵丹妙药,但我确实认为GPT-5应该扩展我们可以自信地交付给用户的工具类型。”

梅汉表示,每前进一步就会后退一步:“每个主要版本解决了上一代最明显的局限性,同时引入了新的局限性。”

GPT-4修复了GPT-3的推理缺陷,但遇到了数据瓶颈。推理模型(o3)修复了逻辑思维,但成本高且速度慢。

Intellectia AI的首席技术官托尼·汤(Tony Tong)——一个为投资者提供人工智能洞察的平台——也持谨慎态度,期待一个更好的模型,但并不认为会有许多人工智能热衷者所说的那样改变世界。“我认为GPT-5将结合更深层次的多模态推理,更好的工具或记忆基础,以及在对齐和代理行为控制方面的重大进展,”汤告诉Decrypt。“想想:更可控、更可靠和更适应。”

帕特里斯·威廉姆斯-林多(Patrice Williams-Lindo),Career Nomad的首席执行官,预测GPT-5不会比“渐进革命”更进一步。然而,她怀疑这可能对日常人工智能用户特别有利,而不是企业应用。

“可靠性、上下文记忆、多模态性和更低错误率的复合效应可能会改变人们每天实际信任和使用这些系统的方式。仅这一点就可能是一个巨大的胜利,”威廉姆斯-林多说。

一些专家对GPT-5或任何其他大型语言模型(LLM)是否会被人们铭记持怀疑态度。

人工智能研究员加里·马库斯(Gary Marcus)对纯粹的扩展方法(更好的模型需要更多参数)持批评态度,他在他通常的预测中写道:“在2025年,可能仍然没有‘GPT-5级’模型(意味着根据社区共识判断的巨大、全面的量子飞跃)。”

马库斯更看好升级公告,而不是全新的基础模型。也就是说,这是他低信心的猜测之一。

十亿美元的人才流失

马克·扎克伯格对OpenAI智囊团的袭击是否会延迟GPT-5的发布,谁也无法预测,尽管

“这肯定在减缓他们的努力,”去中心化人工智能网络Morpheus的首席代码维护者大卫·A·约翰斯顿(David A. Johnston)告诉Decrypt。约翰斯顿认为,除了资金外,顶尖人才在道德上更倾向于参与像Llama这样的开源项目,而不是像ChatGPT或Claude这样的闭源替代品。

尽管如此,一些专家认为该项目已经发展得如此成熟,以至于人才流失不会影响它。

梅汉表示:“2025年7月的发布看起来是现实的。即使一些关键人才转移到Meta,我认为OpenAI仍然似乎在正轨上。他们保留了核心领导层,并调整了薪酬,所以看起来他们正在稳住。”

威廉姆斯-林多补充道:“OpenAI的势头和资金管道都很强大。更具影响力的不是谁离开了,而是留下的人如何重新调整优先事项——特别是如果他们加倍致力于产品化或暂停以应对安全或法律压力。”

如果历史可以作为指导,世界将很快迎来GPT-5的揭晓,以及一系列头条新闻、热议和“这就是全部吗?”的时刻。然后,就这样,整个行业将开始询问下一个重要问题:GPT-6何时发布?

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

ad
Bitget: 注册返10%, 赢6200USDT大礼包
广告
分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接