中国的Z.AI发布首个不使用美国芯片训练的重大AI图像生成模型

中国人工智能公司Z.AI于周三发布了一款完全基于华为处理器训练的开源图像生成模型，这标志着一个主要AI模型首次在没有依赖美国硬件的情况下完成其完整的训练周期。

这一举措突显了对Nvidia在AI芯片领域主导地位的潜在长期挑战，因为它表明中国顶尖的AI公司之一可以在不依赖美国制造的GPU的情况下训练大型模型。

该模型已在Hugging Face上提供下载，在美学和连贯文本方面产生了良好的结果——尽管按今天的标准来看并不算出色，并且根据我们的首次快速测试显示出卓越的空间意识。

使用Z.AI的新模型生成的图像。

这家总部位于北京的公司在上周的香港IPO中筹集了5.58亿美元，使用华为的Ascend Atlas 800T A2服务器和MindSpore框架训练了名为GLM-Image的模型。

Z.AI在与《南华早报》分享的声明中表示：“我们希望这能为社区探索国内计算能力的潜力提供有价值的参考。”

GLM-Image结合了自回归和扩散技术，采用了一个具有160亿个参数的混合架构。自回归组件基于Z.AI的GLM-4语言模型，负责指令理解和图像构图，而扩散解码器则细化细节。这种方法与OpenAI最新的图像生成模型gpt-image-1.5所使用的技术相似，后者在文本渲染和提示遵循方面表现优于像Stable Diffusion这样的纯扩散模型。

扩散模型通过从随机视觉噪声开始，逐渐将其精炼成图像，而自回归模型则逐步构建图像，根据之前的内容预测每个部分。扩散在整体真实感方面表现出色，但在文本或布局等精确细节上可能会遇到困难，而自回归模型在结构和遵循指令方面表现优异。目前，扩散是开源AI图像生成器中的主流技术。

新的混合系统结合了这两种方法，使用自回归生成来规划图像，并使用扩散来打磨最终结果。

图像：Z.AI

这一发布对Z.AI来说意义重大，该公司在2025年因涉嫌与中国军方有联系而被华盛顿列入黑名单。这一身份使公司无法使用Nvidia的H100和A100处理器。现在，Z.AI已证明被列入黑名单的公司仍然可以使用国内硬件生产具有竞争力的AI系统，这是北京长期以来希望展示的发展。

就在Z.AI宣布之后，路透社报道称，中国海关当局已指示代理商阻止Nvidia H200芯片进入该国。政府官员召集科技公司开会，告知他们除非必要，否则不要购买这些芯片。根据消息人士的说法，措辞严厉到足以构成“基本上是暂时禁令”。

北京似乎在发出信号，表明中国的AI实验室可以在没有美国硅芯片的情况下构建有能力的模型，从而减少中国公司囤积Nvidia硬件的紧迫性。H200的性能大约是北京去年八月已封锁的 H20芯片的六倍，已从中国公司获得超过200万台的订单，每台售价27,000美元。

乔治城大学安全与新兴技术中心的分析师指出，中国的芯片战略依赖于通过大规模集群的华为处理器来弥补单个芯片性能较低的不足。这种方法有效，但需要更多的硬件、更多的电力和更多的工程努力。

“这一战略的一个关键限制是中国在国内生产足够芯片的能力，以弥补和跟上能力差距，”高级研究分析师汉娜·多门在11月对CNBC表示。

根据华为自己的路线图，其下一代芯片在2026年在原始性能方面实际上将不如当前的旗舰产品。但这样的评估可能低估了中国实验室通过算法效率所能实现的成就，正如DeepSeek所展示的，通过汇编级GPU优化训练出竞争力模型，使用的芯片更少。

来源：外交关系委员会

根据公司的技术报告，Z.AI的GLM-Image在开源模型中实现了文本渲染和汉字生成的行业领先基准分数。没有合适硬件的人也可以通过API访问在线尝试，每生成一张图像的费用为0.014美元，或通过Z.AI维护的免费Hugging Face Space。

Z.AI成为中国“AI虎”中的第一家上市公司，这些初创公司正在构建大型语言模型以与OpenAI和Anthropic竞争。自上市以来，其股价已上涨约80%，投资者对中国AI公司如DeepSeek或阿里巴巴的热情高涨，尤其是在中国国内芯片雄心的背景下。

与此同时，华为正准备在今年大幅增加其Ascend处理器的生产。随着华为试图将自己定位为不再依赖圣克拉拉的国家AI基础设施的支柱，其在中国各地AI会议上的展位存在感也日益增强。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

中国的Z.AI发布首个不使用美国芯片训练的重大AI图像生成模型

Decrypt的精选文章

目录

相关文章