K线
数据链上
VIP
市值
API
排行
CoinOSNew
CoinClaw🦞
语言
  • 简体中文
  • 繁体中文
  • English
全球行情数据应用领跑者,致力于更高效地提供有价值的信息。

功能

  • 实时行情
  • 特色功能
  • AI网格

服务

  • 资讯内容
  • 开放数据(API)
  • 机构服务

软件下载

  • PC版
  • Android版
  • iOS版

联系我们

  • 聊天室
  • 商务邮箱
  • 官方邮箱
  • 官方验证通道

加入社区

  • Telegram
  • Twitter
  • Discord

© Copyright 2013-2026. All rights reserved.

简体繁體English
|旧版

高盛深度报告:即将到来的拐点——解码 AI 智能体经济

CN
Foresight News
关注
1小时前
AI 总结,5秒速览全文
底层算力成本的下降速度已超过 token 定价的降幅,超大规模云厂商和大模型提供商的毛利率拐点或将在未来 3 至 12 个月内到来。

撰文:卜淑情

来源:华尔街见闻

智能体 AI(Agentic AI)正在将人工智能行业从成本叙事转向利润叙事。高盛认为,随着 token 消耗量即将出现跃升式增长,而底层算力成本的下降速度已超过 token 定价的降幅,超大规模云厂商和大模型提供商的毛利率拐点或将在未来 3 至 12 个月内到来。

据追风交易台,高盛 5 月 5 日发布报告称,该行预计到 2030 年,消费端和企业端 AI 代理合计将推动全球 token 消耗量较 2026 年水平增长 24 倍,达到每月约 120 千万亿个 token;若以 2040 年企业端代理达到峰值采用率计算,这一数字将进一步扩大至 55 倍。

与此同时,高盛的推断价格与成本曲线显示,主流大模型 token 定价已从此前每年约 40% 的降幅趋于稳定甚至小幅回升,而英伟达、AMD、谷歌 TPU 及 Trainium 等芯片驱动的每 token 算力成本仍在以每年 60% 至 70% 的速度持续下降,两条曲线的剪刀差正在为行业打开利润空间。AI 基础设施的大规模资本开支,或将因利润率改善而获得更可持续的经济支撑。

Token 经济学拐点:成本下降快于价格,利润空间正在打开

高盛报告的核心论点在于,AI 行业正从「推理经济不确定、可能摊薄利润」的阶段,迈向「token 增量以具吸引力的边际利润落袋」的新阶段。

在 AI 周期的第一阶段,投资者普遍将算力和 token 视为成本驱动因素——更多使用意味着更多推理负载、更多加速器、更多电力和更高资本开支。但高盛的推断价格与成本曲线表明,这一逻辑正在发生转变。

主流大模型 token 定价虽已大幅下降,但目前已趋于稳定,部分情形下甚至出现回升;与此同时,英伟达、谷歌 TPU(博通)、AMD 和 Trainium(Marvell)的每 token 全成本仍在快速且持续地下降。若 token 定价稳定在高于 token 成本的水平,则智能体 AI 采用率的提升将带来正向利润扩张,而非仅仅是收入增长。

高盛进一步指出,智能体 AI 可能形成自我强化的经济飞轮:更低的每 token 算力成本催生更丰富、更复杂的代理;更丰富的代理通过更长的上下文、更多循环、更多验证和持续监控消耗更多 token;更高的利用率改善 AI 基础设施的经济性,进而支持提供商持续投入模型质量和分发能力。高盛认为,这一飞轮与市场上「AI 使用将带来不可持续成本负担」的主流叙事截然不同。

不过,高盛也提示风险:并非所有 AI 工作负载都能保证实现正向利润拐点。对于商品化程度较高的纯文本聊天机器人,竞争仍可能迫使 token 定价的下降速度快于算力成本。

消费端代理:从碎片化对话到「常驻」助手,token 消耗将增 12 倍

高盛估计,到 2030 年消费端 AI 代理可将全球 token 消耗量提升 12 倍,每月新增约 60 千万亿个 token。

报告将消费端代理分为两类:一是「按需型」代理,如 OpenAI Operator、Claude Code 等浏览器端代理,由用户发起任务后自主规划、执行并返回结果;二是「常驻型」代理,如持续在后台运行的邮件监控、日程管理或数字生活助手。高盛认为,最大的 token 消耗跃升将发生在代理从用户发起任务转向持续后台运行的阶段——代理持续监控上下文并在需要时主动行动。

从模拟数据来看,普通 LLM 聊天机器人每次会话消耗约 1,000 个 token,嵌入式 Copilot 每天消耗超过 5,000 个 token,而常驻型代理每天的 token 消耗量可超过 100,000 个。

高盛预计,到 2030 年每日 AI 查询量将从 2025 年的约 50 亿次增至约 230 亿次,其中最多 30% 将流向搜索、购物、旅行、邮件及个人生产力等领域的代理。与此同时,传统搜索引擎在查询量中的份额预计将从 2025 年的 68% 降至 2030 年的 36%,LLM 原生应用的份额则将从 12% 升至 31%。

企业端代理:工作流复杂度驱动 token 强度,2040 年消耗量或达 55 倍

高盛预计,企业端 AI 代理将成为最大的 token 乘数,到 2030 年推动全球 token 消耗量增长 24 倍,到 2040 年峰值采用时进一步增至 55 倍,届时企业端工作负载将占全球 token 总使用量的 70% 以上。

企业端代理之所以比消费端代理更具 token 强度,在于其工作流要求代理执行更复杂、更精确的操作——监控任务、检索上下文、推理异常、验证输出、更新系统并在整个工作日中持续上报问题。此外,企业代理往往涉及更重的多模态输入(语音、图像、文档、屏幕活动、应用数据、日志及结构化系统记录),这将显著提升 token 强度。

高盛通过构建模拟代理对不同职业的 token 消耗进行了量化测算。

结果显示,编程代理每天消耗约 700 万个 token,API 成本约为 13 美元 / 天,远低于人工成本,这解释了为何软件开发领域的代理采用速度最快;呼叫中心代理每天消耗约 200 万个 token,但若依赖实时语音处理,成本可高达 92 美元 / 天,使全面语音自动化在经济上仍不具竞争力;数据录入代理每天消耗约 2,500 万个 token,成本约为 60 美元 / 天,仍低于人工成本。

高盛指出,企业端代理的采用速度将取决于 token 量、API 成本、模态组合和实施复杂度四个变量。以文本为主、工具生态成熟的工作流将率先规模化;以语音为主或深度集成后台系统的工作流则可能进展较慢。

从采用曲线来看,高盛认为企业端智能体 AI 最可能遵循 S 型曲线,预计峰值采用率约为 35% 至 40% 的知识工作者,达峰时间约为 15 年,快于历史技术扩散的中位数(29 年)。

资本开支可持续性:利润改善为超大规模云厂商提供更大空间

高盛报告的一个关键投资结论是:超大规模云厂商利润率的改善,将使当前高企的基础设施投资更具可持续性,从而化解市场对 AI 资本开支回报的核心疑虑。

报告指出,目前运营商在满足当前及未来算力需求方面仍受供给约束,谷歌和 Meta 均已上调 2026 财年资本开支预期,亚马逊管理层在一季度财报后也重申了维持高资本开支的策略。高盛预计,随着利润拐点临近,投资者将越来越多地寻找回报可见性的证据。

在具体标的方面,高盛对亚马逊的核心逻辑在于 AWS 收入增速重新加速(一季度同比增长 28%),并拥有 3,640 亿美元的收入积压订单;对谷歌的看法基于其云业务一季度同比增长 63%、积压订单环比近乎翻倍至约 4,600 亿美元;对 Meta 的判断则基于其广告业务增速显著超越数字广告行业整体,以及 AI 算力在提升用户参与度和广告变现方面的持续贡献。

在软件领域,高盛认为更低的 token 成本使软件厂商更容易将代理嵌入现有产品而不显著影响毛利率,同时支持围绕成果、生产力或工作单元而非单纯席位数量进行定价,从而扩大软件可寻址市场。对于 IT 服务公司,随着代理将 AI 消费从独立工具转向企业级、高集成度的工作流改造,对集成、治理和托管编排的需求将大幅提升,Accenture 被视为这一趋势的主要受益者。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

Foresight News的精选文章

4小时前
买不到 OpenAI,散户开始在链上押注 AI 独角兽
5小时前
当所有人都在关注比特币时,Zcash 正在悄然飙升
5小时前
账本不是航海图,会计视角看不见新大陆
查看更多

目录

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

相关文章

avatar
avatarPANews
2小时前
Google Maps + Claude:一个人也能跑起来的本地商家获客机器
avatar
avatarPANews
2小时前
中国 Web3 创业,有哪些好路子?
avatar
avatar深潮TechFlow
4小时前
Bitget 对话北大交易员米哥:十年 9000 倍,运气定上限,纪律守下限
avatar
avatarOdaily星球日报
4小时前
史上最严重的存储短缺,把三星推上全球第二
APP下载
Windows
Mac

X

Telegram

Facebook

Reddit

复制链接