内部人士表示,DeepSeek V4将在编码方面超越Claude和ChatGPT,预计几周内发布。

CN
Decrypt
关注
12小时前

DeepSeek 据报道计划在 2 月中旬发布其 V4 模型,如果内部测试有任何迹象,硅谷的人工智能巨头们应该感到紧张。

这家总部位于杭州的人工智能初创公司可能会在 2 月 17 日——农历新年,自然——发布一款专门为编码任务设计的模型,根据《信息》的报道。知情人士称,V4 在内部基准测试中超越了 Anthropic 的 Claude 和 OpenAI 的 GPT 系列,特别是在处理极长的代码提示时。

当然,没有任何基准或关于该模型的信息被公开分享,因此无法直接验证这些说法。DeepSeek 也没有确认这些传闻。

尽管如此,开发者社区并没有等待官方消息。Reddit 的 r/DeepSeek 和 r/LocalLLaMA 已经热闹起来,用户们正在囤积 API 额度,而 X 上的爱好者们也迅速分享了他们的预测,认为 V4 可能会巩固 DeepSeek 作为拒绝遵循硅谷十亿美元规则的顽强黑马的地位。

这并不是 DeepSeek 的第一次颠覆。当该公司在 2025 年 1 月发布其 R1 推理模型时,触发了全球市场的$1 万亿抛售

原因是什么?DeepSeek 的 R1 在数学和推理基准测试中与 OpenAI 的 o1 模型相匹配,尽管据报道开发成本仅为 600 万美元——大约是竞争对手支出的 68 倍。其 V3 模型后来在 MATH-500 基准测试中达到了 90.2%,远超 Claude 的 78.3%,最近的更新“V3.2 Speciale”进一步提升了其性能。


图片:DeepSeek

V4 的编码重点将是一个战略转变。虽然 R1 强调纯推理——逻辑、数学、形式证明——V4 是一个混合模型(推理和非推理任务),目标是企业开发者市场,在那里高精度的代码生成直接转化为收入。

要声称主导地位,V4 需要超越 Claude Opus 4.5,目前在 SWE-bench Verified 记录中保持 80.9%。但如果 DeepSeek 过去的发布可以作为指导,那么即使面对中国人工智能实验室的所有限制,这也可能不是不可能实现的。

不那么秘密的秘诀

假设传闻属实,这家小实验室如何能实现这样的壮举?

该公司的秘密武器可能包含在其 1 月 1 日的研究论文中:流形约束超连接(Manifold-Constrained Hyper-Connections,简称 mHC)。该论文由创始人梁文峰共同撰写,这种新的训练方法解决了扩展大型语言模型的一个基本问题——如何在不使模型在训练过程中变得不稳定或爆炸的情况下扩展模型的容量。

传统的人工智能架构将所有信息强制通过单一狭窄的通道。mHC 将该通道扩展为多个可以交换信息的流,而不会导致训练崩溃。


图片:DeepSeek

Counterpoint Research 的人工智能首席分析师魏孙在接受《商业内幕》采访时称 mHC 是一个“引人注目的突破”。她表示,这项技术表明 DeepSeek 可以“绕过计算瓶颈,解锁智能的飞跃”,即使由于美国出口限制而对先进芯片的访问有限。

Omdia 的首席分析师苏连杰指出,DeepSeek 愿意公开其方法表明了“中国人工智能行业的新信心”。该公司的开源方法使其成为开发者的宠儿,他们认为这体现了 OpenAI 曾经的样子,在其转向封闭模型和十亿美元融资轮之前。

并不是所有人都信服。一些 Reddit 上的开发者抱怨 DeepSeek 的推理模型在简单任务上浪费计算资源,而批评者则认为该公司的基准测试并未反映现实世界的复杂性。一篇标题为“DeepSeek 糟糕——我不再假装它不是”的 Medium 文章在 2025 年 4 月迅速传播,指责这些模型生成“带有错误的模板废话”和“虚构的库”。

DeepSeek 也背负着包袱。隐私问题困扰着该公司,一些政府禁止使用 DeepSeek 的本地应用。该公司与中国的关系以及其模型中的审查问题为技术辩论增添了地缘政治摩擦

尽管如此,势头是不可否认的。DeepSeek 在亚洲被广泛采用,如果 V4 能兑现其编码承诺,那么西方的企业采用也可能随之而来。


图片:微软

还有时机。根据路透社的报道,DeepSeek 原本计划在 2025 年 5 月发布其 R2 模型,但在创始人梁对其性能感到不满后延长了时间。现在,V4 据报道瞄准 2 月发布,而 R2 可能在 8 月跟进,该公司以一种表明紧迫感或信心的速度在推进,也许两者兼而有之。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接