埃隆·马斯克表示,他的新人工智能聊天机器人“聪明得令人害怕”——将在几周内推出

CN
Decrypt
关注
2小时前

埃隆·马斯克宣布,他公司下一代AI聊天机器人Grok可能在几周内发布,称其为“令人恐惧的聪明”,并声称在测试中已经超越了所有其他AI模型。

xAI首席执行官在2月13日的迪拜世界政府峰会上发表了这些言论。

“有时,我觉得Grok-3有点令人恐惧的聪明,”马斯克说。“它提出的解决方案是你根本无法预料的——你知道的,那些并不明显的解决方案。”

聊天机器人开发者为Grok-3采用了独特的训练方法。与ChatGPT使用真实世界数据不同,Grok-3依赖于合成数据,并采用自我纠正机制以保持逻辑一致性。马斯克声称,它的准确性如此之高,以至于即使遇到错误信息,系统也会反思数据并删除与现实不符的内容。

训练Grok-3的计算需求巨大。专家计算它需要2亿GPU小时,远超其中国竞争对手DeepSeek-V3的270万小时。它在xAI的Colossus超级集群上运行,配备了10万块Nvidia H100 GPU——计算能力是其前身的十倍。即使没有微调,马斯克声称基础模型的表现也优于Grok-2。

Grok-3与马斯克的社交媒体平台X的集成,使其能够实时抓取社交媒体应用的数据,而不是依赖于浏览网页。该系统可以从X中提取实时数据,并具有公司所称的“失控模式”——根据xAI自己的常见问题解答,这是“旨在引起反感、不当和冒犯的”。

不过,该系统尚未完全准备好投入使用。马斯克将剩余的工作比作完成一座房子:“最后的5%是做干墙、涂漆和修边——尽管这不是很多工作,但它会改变整座房子。”

然而,它可能会比OpenAI的GPT-4.5更早发布,至少,山姆·阿尔特曼表示GPT-4.5可能在几周或几个月内发布。

“可能(Grok-3)在一两周内发布,”埃隆说。他没有澄清新版本是否会公开提供,还是像Grok-2最初那样需要订阅。

AI领域的竞争加剧。尽管ChatGPT在2024年占据了市场份额,但中国的开源模型DeepSeek-V3作为一个严肃的竞争者出现,尽管使用的资源远少于GPT-4o和Meta的Llama 3.1,但表现超越了它们。

Grok最初在X Premium上提供,这大大限制了其可用性。后来,它被免费提供给马斯克社交媒体平台的所有用户,并且现在有一个新的独立网站供其他人使用。


图片:Grok.com

xAI进入推理AI战斗

主要的AI参与者正在将重点转向推理模型,开发能够反思特定问题并在经过长时间和广泛的思考推理后找到解决方案的AI模型。

这个想法最早是由马特·舒默提出的,当时反思70b被宣布。该模型经过训练以纳入思维链推理,尽管只是一个Llama 70b的微调,但应该能够在复杂任务中超越Claude 3.5 Sonnet。

这并没有成功,但就在几周后,OpenAI宣布了其“OpenAI o1”推理模型,有效地应用了同样的概念。该模型在AI模型所能展现的逻辑能力方面树立了新的标准,被视为OpenAI在AI行业中占据主导地位的护城河。

DeepSeek的发布颠覆了整个世界。一组中国研究人员构建了一个比o1更好的模型,成本却低得多——并且还将其开源。

自那时起,OpenAI宣布其未来的模型将合并为一个万用AI, 抛弃传统的GPT架构,并首先专注于深度推理。

xAI似乎在跟随市场。

“Grok-3具有非常强大的推理能力,”埃隆·马斯克说。

他没有透露关于模型结构的更多信息。目前版本的Grok-2在LLM Arena中排名第18,远低于GPT、Claude、Gemini、Qwen或DeepSeek等竞争对手。

展望未来,xAI计划将其计算基础设施扩展到100万GPU,以支持未来具有“万亿参数”的模型。根据马斯克的说法,最终目标是通过越来越复杂的模型向人工通用智能迈进。

编辑:安德鲁·海沃德

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接