C
ChaoBro

高盛:Agent AI "低 Token 成本 × 高 Token 消耗"飞轮启动,AI 基础设施利润率拐点正在 2026 年到来

高盛:Agent AI "低 Token 成本 × 高 Token 消耗"飞轮启动,AI 基础设施利润率拐点正在 2026 年到来

核心结论

高盛在最新 AI 基础设施行业报告中提出了一个关键判断:Agent AI 正在改变 AI 基础设施的经济学模型。通过"低 Token 成本 × 高 Token 消耗"的飞轮效应,AI 基础设施的利润率拐点正在 2026 年到来。

这不仅是又一份看多 AI 的研报——这是华尔街首次系统性地论证 AI 从"成本中心"向"利润中心"转变的具体路径和时间表。

飞轮效应拆解

高盛的逻辑链条如下:

Agent AI 普及 → 单个 Agent 消耗更多 Token(自主执行多步骤任务)
         ↓
Token 总消耗量呈指数增长
         ↓
模型推理的规模效应显现 → 单位 Token 成本持续下降
         ↓
"量涨价跌"的交叉点 → 基础设施运营商开始盈利
         ↓
利润再投入 → 更强模型 → 更多 Agent → 更多 Token 消耗(飞轮加速)

关键数据点

  • Agent vs 对话:一个典型 Agent 任务的 Token 消耗量是人类对话的 10-50 倍(因为 Agent 需要自主规划、工具调用、多轮迭代)
  • 成本下降曲线:推理成本每年下降约 50-70%(模型优化 + 芯片迭代 + 规模化部署)
  • 交叉点预测:当 Token 消耗增速超过成本下降速度时,利润率由负转正——高盛预测这个拐点就在 2026 年下半年

产业链受益者

环节 受益逻辑 代表公司
算力芯片 Agent 推理需求暴增 → GPU/ASIC 用量增长 NVIDIA、AMD、Google TPU
云服务 Agent 7×24 运行 → 云资源消耗持续增长 AWS、Azure、GCP、阿里云
模型 API Token 消耗量指数增长 → API 收入规模化 OpenAI、Anthropic、智谱、月之暗面
Agent 框架 Agent 普及 → 框架工具需求增长 LangChain、CrewAI、OpenClaw

风险因素

高盛也指出了几个需要关注的风险:

  1. Agent 采用率不及预期:如果企业部署 Agent 的速度放缓,Token 消耗增速将低于预期,拐点推迟
  2. 模型能力瓶颈:当前 Agent 在复杂任务中的成功率仍不够高,如果技术进展放缓,企业可能减少 Agent 投入
  3. 监管不确定性:数据隐私、AI 安全相关的监管政策可能增加合规成本
  4. 竞争加剧导致价格战:模型 API 价格持续下降可能侵蚀利润率

投资逻辑

这份报告的核心投资逻辑是:AI 基础设施不再是"永远烧钱"的行业,而是一个有明确盈利时间表的新兴赛道

对于投资人来说,关键问题是:

  • 哪些公司能在这个拐点到来时占据最大的市场份额?
  • 哪些公司的技术路径能最大化享受规模效应?
  • 哪些公司的客户结构能提供稳定的 Token 消耗基线?

行动建议

开发者/技术决策者

  • Agent 部署的成本正在快速下降,现在是构建 Agent 工作流的好时机
  • 关注"低 Token 成本 × 高价值产出"的场景:数据清洗、文档生成、代码审查
  • 多模型并行策略可以进一步优化成本——用便宜模型处理简单任务,用旗舰模型处理关键决策

投资人

  • 关注 AI 基础设施公司的 Q2/Q3 财报,寻找利润率改善的早期信号
  • 重点跟踪 Token 消耗量增速和单位成本下降速度的相对关系
  • 警惕"故事好但数据差"的公司——Agent 叙事需要 Token 消耗数据支撑