Anthropic CEO Dario Amodei(达里奥·阿莫代):指数增长的终点与「数据中心里的天才国度」

CN
3 小時前

撰文:Techub News 整理

近日,Anthropic 联合创始人兼 CEO Dario Amodei(达里奥·阿莫代)在知名播客节目 Dwarkesh Podcast 中,进行了一场长达 142 分钟的深度对话。作为 OpenAI 前研究副总裁、当今最受关注的 AI 公司之一的掌舵人,Amodei 的思考代表了 AI 前沿最核心的认知演进。在这场信息密度极高的访谈中,他不仅重申了其著名的「计算大块假设」,更直言我们正「接近指数增长的终点」,并对 AGI 的到来时间、经济影响乃至地缘政治格局做出了大胆预测。

指数增长的终点与 AGI 时间线

当被问及过去三年最大的变化时,Dario Amodei(达里奥·阿莫代)坦言,技术本身的指数级进展大致符合他三年前的预期。从 GPT-1 到如今 Claude 3.5 Sonnet 所展现的能力,模型正沿着从「聪明高中生」到「聪明大学生」,再到开始从事博士和专业工作的轨迹稳步前进。代码能力甚至已超越这一轨迹。

真正让他感到「绝对疯狂」的,是公众对「我们离指数增长终点有多近」这一事实的普遍缺乏认知。他认为,当世界仍在争论那些老生常谈的政治议题时,一场根本性的技术变革已迫在眉睫。

对于 AGI 的时间线,Amodei 给出了清晰的概率判断。他认为,在未来十年内实现他所谓的「数据中心里的天才国度」,其概率高达 90%。「很难超过 90%,因为世界太不可预测了,」他补充道,剩下的 10% 风险来自诸如公司内部动荡、台海冲突导致晶圆厂被毁等「不可简化的不确定性」。对于可验证的领域(如代码生成),他更加乐观,认为排除极端不确定性,一两年内就能达到目标。

他区分了能力的「光谱」:从 AI 编写 90% 的代码行数,到完成 100% 的端到端软件工程任务,再到最终导致对软件工程师需求减少 90%。他强调,这些是不同的里程碑,但我们正「极其快速地」通过这些阶段。他承认,目前 AI 带来的更多是「生产力提升」,而非软件创作的「文艺复兴」,但坚信这种提升将很快转化为巨大的经济价值。

「计算大块假设」与 RL 的扩展定律

Amodei 重申了他自 2017 年以来持有的核心假设——「计算大块假设」。该假设认为,真正重要的是少数几个根本因素:原始计算量、数据量、数据质量与分布、训练时长、一个可无限扩展的目标函数(如预训练目标或 RL 目标),以及确保数值稳定的归一化或条件化技术。他坚信,所有「聪明」的技巧和方法论在巨大的计算和数据面前都显得无关紧要。

针对主持人提出的「强化学习(RL)是否缺乏公开的扩展定律」这一疑问,Amodei 给出了否定的答案。他认为,RL 的扩展规律与预训练并无本质不同。就像预训练从狭窄的文本分布(如同人小说)扩展到整个互联网抓取数据后,才获得了强大的泛化能力一样,RL 也正经历类似的轨迹:从数学竞赛等简单任务开始,逐渐扩展到编码等更广泛的任务,并开始展现出泛化能力。

他驳斥了「RL 需要特定环境来教授特定技能,证明我们缺乏人类核心学习算法」的观点。他认为,这混淆了几个不同的问题。模型在预训练阶段吸收了海量数据,其过程更像是介于人类「进化」和「终身学习」之间。而上下文学习(in-context learning)则介于人类的长期学习和短期学习之间。模型从零开始学习确实需要比人类更多的数据(样本效率低),但一旦训练完成,它们在长上下文窗口内的学习和适应能力非常强。

「目标不是通过 RL 教会模型每一项可能的技能,就像我们不会在预训练中试图让模型接触每一种可能的词语组合方式一样,」Amodei 解释道,「模型在大量事物上训练,然后达到泛化。」

经济扩散:快,但非无限快

一个核心争议点在于 AI 能力转化为实际经济影响的速率。Amodei 承认存在「经济扩散」的延迟,但他强烈反对将其视为一种「应对说辞」。他以 Anthropic 自身的增长为例:公司收入从 2023 年的零增长到 1 亿美元,2024 年达到 10 亿美元,2025 年预计将达到 90-100 亿美元,甚至在 2026 年 1 月又增加了数十亿美元。「这条曲线不可能永远持续,GDP 只有这么大,」他说,「但我敢打赌,即使规模扩大到整个经济体,它仍将保持相当快的速度。」

他描绘了一个「中间世界」:模型能力呈快速指数增长,其经济扩散也是快速的(远快于以往任何技术),但并非无限快。企业采用新技术需要时间,需要走法律流程、安全合规审查、内部推广等步骤。即使是 Claude Code 这样极具吸引力的产品,大型企业的采用速度也会比个人开发者或初创公司慢几个月。

「我认为我们应该思考这样一个中间世界:事情极快,但并非瞬间完成,因为它们需要时间进行经济扩散,需要时间『闭环』。」Amodei 总结道。这意味着,即使「数据中心里的天才国度」在技术上在一两年内实现,其产生的数万亿美元收入也可能需要再花一两年甚至更长时间才能完全显现。

当被问及「编辑视频」这类需要长期积累上下文和偏好的工作时,Amodei 预测,当「数据中心里的天才国度」实现时,AI 将能胜任此类工作。这依赖于模型在计算机使用上达到「真正精通」的水平。他透露,Anthropic 的模型在计算机使用基准测试(如 OSWorld)上的得分,已从一年前的约 15% 提升到了 65-70%。

地缘政治与「AI 铁幕」

访谈的后半部分转向了 AI 的地缘政治影响。Amodei 直言,AI 将「极大地加剧」大国间的竞争,尤其是中美之间的竞争。他认为,拥有强大 AI 能力的国家将获得巨大的军事和经济优势,这种「赢家通吃」的动态可能导致世界分裂成两个技术阵营。

「我认为我们不会向中国出售数据中心或芯片,以及制造芯片的能力,」Amodei 明确表示。他承认这会在一定程度上牺牲经济互利,但强调在 AI 时代,增长和经济价值将「几乎快于我们所能承受的速度」到来,而真正的难题在于「利益分配、财富分配和政治自由」。

他提出了一个更激进的可能性:能否开发出某种技术或基于 AI 构建的系统,创造一个均衡,使得威权国家「无法在保持权力的同时,拒绝让其人民私人使用这项技术的好处」?他设想,或许每个人都能拥有一个保护其免受监控的 AI 模型,这可能会从内部瓦解威权结构。他承认这带有理想主义色彩,互联网和社交媒体的历史教训也表明其困难重重,但认为「值得一试」。

对于发展中国家,Amodei 认为传统的「追赶式增长」模式(依靠未充分利用的劳动力和外来资本技术)在 AI 时代可能失效,因为劳动力不再是制约因素。他建议,可以将数据中心建在非洲(只要不被中国控制),并推动 AI 驱动的生物技术等新兴产业在发展中国家落地,让当地人类在过渡期参与其中并分享增长红利。

宪法、对齐与公司文化

谈及 Anthropic 著名的「宪法」方法时,Amodei 区分了两个层面:一是「规则与原则」的权衡,二是「可修正性与内在动机」的权衡。实践证明,教导模型学习原则(而非死板的规则列表),其行为更一致、更易覆盖边缘情况、也更可能做人类希望它做的事。在可修正性方面,Anthropic 的模型更偏向于「大部分情况下听从人类指令」,而非拥有强烈内在动机、自行其是的实体。

关于宪法原则的制定,Amodei 提出了「三层循环」:1) Anthropic 内部迭代;2) 不同公司推出不同宪法,通过市场竞争和公众反馈形成软性激励;3) 更广泛的社会参与,例如通过集体智慧项目征集意见,甚至未来可能由代议制政府提供输入(尽管他目前对此持谨慎态度)。他认为最终的方案必然是这三者的混合。

最后,作为一位以撰写长篇思想性备忘录著称的 CEO,Amodei 分享了他如何构建与这种「知识分子型」CEO 角色兼容的公司文化。他每周花大量时间确保公司文化健康,每两周向全公司进行长达一小时的「Dario Vision Quest」分享,内容涵盖内部动态、模型进展、行业观察和地缘政治。他强调在内部沟通中保持「完全不加过滤」的诚实,避免公司官僚用语,以此建立信任,让每个人对使命保持一致,并围绕如何最好地实现使命进行辩论和讨论。他认为,这是 Anthropic 能够凝聚 2500 名员工、应对巨大商业和安全压力的关键优势。

在访谈的最后,Amodei 感慨道,回顾这段指数增长的历史,未来的人们最难体会的将是「身处其中的人当时并不认为这一切是必然的」。当世界距离剧变仅一两年之遥时,「街上的普通人却一无所知」。这种认知与现实的脱节,以及一切都在同时发生的「绝对速度」,构成了我们这个时代最独特的挑战与机遇。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接