美国的开源人工智能策略:两个实验室,一个问题——美国能否竞争?

CN
Decrypt
关注
1小时前

本周,两家美国人工智能实验室发布了开源模型,各自采取了截然不同的方法来应对同一个问题:如何与中国在公开可访问的人工智能系统中的主导地位竞争。

Deep Cogito 发布了 Cogito v2.1,这是一个庞大的6710亿参数模型,其创始人 Drishan Arora 称其为“美国公司中最好的开放权重 LLM”。

不过,艾伦人工智能研究所反驳道,他们刚刚发布的 Olmo 3 被宣传为“最好的完全开放基础模型”。Olmo 3 拥有完全的透明度,包括其训练数据和代码。

具有讽刺意味的是,Deep Cognito 的旗舰模型是基于一个 中国基础模型 构建的。Arora 在 X 上承认,Cogito v2.1 “是从2024年11月的开放许可 Deepseek 基础模型分叉而来的”。

这引发了一些批评,甚至关于微调中国模型是否算作美国人工智能进步的辩论,或者这是否只是证明美国实验室已经落后了多远。

无论如何,Cogito 在效率上的提升是显而易见的。

Deep Cognito 声称,Cogito v2.1 的推理链比 DeepSeek R1 短60%,同时保持竞争力的性能。

通过 Arora 所称的“迭代蒸馏和放大”——教导模型通过自我改进循环来发展更好的直觉——这家初创公司在 RunPod 和 Nebius 的基础设施上仅用75天就训练了其模型。

如果基准测试属实,这将是目前由美国团队维护的最强大的开源 LLM。

为什么这很重要

到目前为止,中国在开源人工智能领域一直在引领潮流,美国公司越来越依赖——无论是默默地还是公开地——中国基础模型以保持竞争力。

这种动态是有风险的。如果中国实验室成为全球开放人工智能的默认基础设施,美国初创公司将失去技术独立性、议价能力和塑造行业标准的能力。

开放权重人工智能决定了谁控制着每个下游产品所依赖的原始模型。

目前,中国的开源模型(DeepSeek、Qwen、Kimi、MiniMax)在全球采用中 占据主导地位,因为它们便宜、快速、高效,并且不断更新。


图片来源:Artificialanalysis.ai

许多美国初创公司已经在这些模型上构建,即使它们 公开避免承认

这意味着美国公司正在基于外国知识产权、外国训练管道和外国硬件优化来建立业务。从战略上讲,这使美国处于与半导体制造曾经面临的相同境地:越来越依赖他人的供应链。

Deep Cogito 的方法——从 DeepSeek 分叉开始——展示了其优势(快速迭代)和劣势(依赖性)。

艾伦研究所的方法——以完全透明的方式构建 Olmo 3——展示了另一种选择:如果美国想要在开放人工智能领域保持领导地位,就必须从数据到训练配方再到检查点,自己重建整个堆栈。这是劳动密集型且缓慢的,但它保留了对基础技术的主权。

理论上,如果你已经喜欢 DeepSeek 并在线使用它,Cogito 大多数时候会给你更好的答案。如果你通过 API 使用它,你会更加满意,因为得益于其效率提升,你将花更少的钱来生成良好的回复。

艾伦研究所采取了相反的策略。整个 Olmo 3 模型系列配备了 Dolma 3,这是一个从零开始构建的5.9万亿标记的训练数据集,以及来自每个训练阶段的完整代码、配方和检查点。

该非营利组织发布了三个模型变体——Base、Think 和 Instruct,参数分别为70亿和320亿。

“人工智能的真正开放不仅仅是关于访问——它还涉及信任、问责和共同进步,”该研究所写道。

Olmo 3-Think 32B 是第一个在该规模上完全开放推理的模型,训练所用的标记大约是类似模型(如 Qwen 3)的六分之一,同时实现了竞争力的性能。


图片来源:Ai2

Deep Cognito 在8月获得了由 Benchmark 领投的 $1300万 种子融资。该初创公司计划发布高达6710亿参数的前沿模型,训练所需的计算能力“显著更多,数据集更好”。

与此同时,Nvidia 支持 Olmo 3 的开发,副总裁 Kari Briski 称其为 “开发者使用开放的、美国构建的模型扩展人工智能的关键”。

该研究所使用 Google Cloud 的 H100 GPU 集群进行训练,计算需求比 Meta 的 Llama 3.1 8B 低2.5倍。

Cogito v2.1 可在 这里 免费在线测试。该模型可以在 这里 下载,但请注意:运行它需要非常强大的显卡。

Olmo 可在 这里 进行测试。模型可以在 这里 下载。这些模型更适合消费者,具体取决于你选择的版本。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接