美国人工智能巨头如何应对DeepSeek的颠覆

CN
Decrypt
關注
1 天前

一家小型中国初创公司刚刚迫使美国最大的科技公司重新思考他们如何构建人工智能。

DeepSeek的R1模式发布,据报道其能力与美国构建的AI系统相匹配或超越,且成本仅为其一小部分,这引发了科技股的大规模抛售,仅Nvidia的市值就蒸发了近6000亿美元。

震荡波冲击了美国科技行业,行业领袖们急于分析DeepSeek是如何取得如此成果的。

尽管仍有一些未解之谜,但在分析了开源代码后,目前的共识是,中国开发者在构建高效模型方面更具优势。AI科技巨头们面带微笑,看到积极的一面,接受了任何AI进步对行业都是有利的观点。

OpenAI的山姆·阿尔特曼承认该模型的出色表现,同时承诺加速发布“更好的模型”。

Meta的马克·扎克伯格表示,他的公司已经组建了多个“战情室”,里面充满了工程师,专注于分析DeepSeek的技术并制定Meta的应对策略。

与此同时,唐纳德·特朗普总统从不放过新闻周期,将DeepSeek的突破形容为对美国科技的“警钟”和“积极”发展,“因为你不必花这么多钱。”

DeepSeek后时代

好吧,让我们忽略他们所说的,考虑他们最有可能如何回应DeepSeek的突破。

事实证明,几家大型闭源公司已经悄悄将DeepSeek的方法纳入他们的操作手册——他们只是不愿意在借鉴竞争对手的事情上大肆宣传。

例如,Perplexity已经在其搜索引擎上实施了该模型,而Groq也使其能够以创纪录的速度进行推理。

美国AI领域的大多数知名公司,包括Meta,正在适应DeepSeek或考虑如何利用其技术。

随着初始市场恐慌的减退——Nvidia的股票今天反弹了9%——科技领袖们指出一个反直觉的经济原则,表明DeepSeek的效率突破可能会推动对AI硬件的需求。

被称为Jevons悖论,这个概念解释了为什么技术效率往往会扩大使用而不是减少消费。

“随着AI变得更加高效和可获取,我们将看到其使用量激增,变成我们无法满足的商品,”微软首席执行官萨提亚·纳德拉说,OpenAI的最大投资者。

尽管遭遇华尔街市值单日最大跌幅,Nvidia仍将DeepSeek的突破视为机会。

“蛋糕变得更大、更快了。”Nvidia首席研究员吉姆·范周一在推特上写道。“我们作为一个人类,正朝着普遍AGI更快地迈进。”

换句话说,如果Jevons悖论适用,DeepSeek展示了高质量AI模型可以用最少的计算资源构建,这并不意味着我们总体上会使用更少的GPU。相反,大公司将变得更大。

在另一端,随着准入门槛的降低,涌现出大量新的开发者和公司将投入到人工智能开发中。

总项目的激增可能会将计算和芯片需求推向前所未有的水平。当然,对于AI来说,并非所有芯片都是相同的,市场显然已经决定,在这个新世界中,苹果的芯片可能在某种程度上优于Nvidia的芯片。

这就是为什么AAPL本周上涨了8%,尽管其消费级的“苹果智能”被嘲讽为矛盾修辞

论点是,苹果芯片更具能效,设计用于本地使用,而不是使用Nvidia芯片的大型服务器农场,并且具有“统一内存架构”,这意味着CPU、GPU和神经引擎共享一个超快内存池。

这消除了在不同组件之间进行数据传输的需要,减少了延迟并提高了AI工作负载的效率。对于像DeepSeek这样的模型,它们依赖于快速内存访问来进行复杂操作,UMA据说显著提高了性能。

显然,在创新者的困境中,Nvidia不太可能改变其战略——考虑到他们是AI硬件的主导供应商,得益于他们对CUDA架构的垄断,这是运行和开发目前大多数可用AI模型的关键。

DeepSeek并没有挑战这一垄断——但中国正在努力推动华为Ascend系列芯片的采用。

目前,微软似乎并不太担心作为基础设施提供商改变其商业战略。

然而,OpenAI确实对用户的期望做了一些小调整,给Plus用户(每月支付20美元的用户)提供了一些之前仅对Pro用户(每月支付200美元的用户)可用的功能,以留住客户。

另一家在这场游戏中投入颇深的公司是Meta,开发了Llama——全球最大和最受欢迎的开源LLM家族。

Meta已经承诺在今年投资$650亿用于AI基础设施

该公司的首席AI科学家Yann LeCun也看到了被一家小型中国初创公司“脱裤子”的积极面:“对于那些看到DeepSeek的表现并认为:‘中国在AI上超越美国’的人。

“你们的理解是错误的;正确的理解是:‘开源模型正在超越专有模型,’”LeCun在LinkedIn上发布

如果Meta采用DeepSeek的方法来增强Llama-4,大家也不要感到惊讶:“因为他们的工作是公开和开源的,每个人都可以从中受益——这就是开放研究和开源的力量,”LeCun写道。

在其第四季度财报电话会议中,首席执行官扎克伯格表示,Meta计划分配十倍于用于训练Llama-3的资源来开发Llama-4。

该公司可能会减少支出并应用DeepSeek的技术——或者在保持支出的同时应用这些技术,推出一个更强大的模型。

AI的未来可能不依赖于更好的AI

无论DeepSeek的推理模型多么出色,最终,AI仍然对两样东西有着贪婪的需求:电力(服务器农场)和数据(用于训练和学习)。

行业分析师预测,今年对GPU的需求将激增30%,而全球AI计算成本在未来五年内可能会增长10倍

这些成本如何转嫁给企业和消费者仍然是一个悬而未决的问题。

与此同时,像DeepSeek这样的开源AI模型正在变得如此优秀,以至于人们开始质疑专有代码公司收取的高额费用是否合理。

当你可以免费获得时,谁会愿意每月支付20美元来使用OpenAI的消费级产品——更不用说每月200美元的高端模型了?

“越来越多的公司正在构建开源替代品来取代高端AI工具,创造出有利于[中小企业]的竞争,”去中心化AI模型网络Mira的首席执行官兼联合创始人Karan Sirdesai告诉Decrypt。“这种朝向可访问解决方案的自然演变反映了其他技术如何通过市场动态而非监管实现民主化。”

对Sirdesai来说,像DeepSeek这样的模型和其他开源倡议推动了行业的发展,因为它们为开发者提供了工具,使他们能够在看似将完全被寡头和少数大型公司主导的市场中占据一席之地。

然而,事实证明,“去中心化基础设施和开源开发已经在为高端AI工具创造竞争替代品,”他说。

Blackstraw.ai的首席执行官兼创始人Atul Arya表示,开源AI的更大好处在于,它将帮助世界避免AI拥有者和没有者之间可能出现的差距。

“免费版和付费版之间的区别通常集中在速度和规模上,而不是基本功能,确保核心功能对更广泛的公众保持可访问性,”他告诉Decrypt。

Arya认为,像DeepSeek这样的开源开发有助于平衡市场规模,并在像AI行业这样狂野的市场中创造更公平的条件。

“民主化访问的真正驱动力是开源社区,它正在迅速追赶,”他说。

编辑:Sebastian SinclairJosh Quittner

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接