核心结论
高盛在最新 AI 基础设施行业报告中提出了一个关键判断:Agent AI 正在改变 AI 基础设施的经济学模型。通过"低 Token 成本 × 高 Token 消耗"的飞轮效应,AI 基础设施的利润率拐点正在 2026 年到来。
这不仅是又一份看多 AI 的研报——这是华尔街首次系统性地论证 AI 从"成本中心"向"利润中心"转变的具体路径和时间表。
飞轮效应拆解
高盛的逻辑链条如下:
Agent AI 普及 → 单个 Agent 消耗更多 Token(自主执行多步骤任务)
↓
Token 总消耗量呈指数增长
↓
模型推理的规模效应显现 → 单位 Token 成本持续下降
↓
"量涨价跌"的交叉点 → 基础设施运营商开始盈利
↓
利润再投入 → 更强模型 → 更多 Agent → 更多 Token 消耗(飞轮加速)
关键数据点:
- Agent vs 对话:一个典型 Agent 任务的 Token 消耗量是人类对话的 10-50 倍(因为 Agent 需要自主规划、工具调用、多轮迭代)
- 成本下降曲线:推理成本每年下降约 50-70%(模型优化 + 芯片迭代 + 规模化部署)
- 交叉点预测:当 Token 消耗增速超过成本下降速度时,利润率由负转正——高盛预测这个拐点就在 2026 年下半年
产业链受益者
| 环节 | 受益逻辑 | 代表公司 |
|---|---|---|
| 算力芯片 | Agent 推理需求暴增 → GPU/ASIC 用量增长 | NVIDIA、AMD、Google TPU |
| 云服务 | Agent 7×24 运行 → 云资源消耗持续增长 | AWS、Azure、GCP、阿里云 |
| 模型 API | Token 消耗量指数增长 → API 收入规模化 | OpenAI、Anthropic、智谱、月之暗面 |
| Agent 框架 | Agent 普及 → 框架工具需求增长 | LangChain、CrewAI、OpenClaw |
风险因素
高盛也指出了几个需要关注的风险:
- Agent 采用率不及预期:如果企业部署 Agent 的速度放缓,Token 消耗增速将低于预期,拐点推迟
- 模型能力瓶颈:当前 Agent 在复杂任务中的成功率仍不够高,如果技术进展放缓,企业可能减少 Agent 投入
- 监管不确定性:数据隐私、AI 安全相关的监管政策可能增加合规成本
- 竞争加剧导致价格战:模型 API 价格持续下降可能侵蚀利润率
投资逻辑
这份报告的核心投资逻辑是:AI 基础设施不再是"永远烧钱"的行业,而是一个有明确盈利时间表的新兴赛道。
对于投资人来说,关键问题是:
- 哪些公司能在这个拐点到来时占据最大的市场份额?
- 哪些公司的技术路径能最大化享受规模效应?
- 哪些公司的客户结构能提供稳定的 Token 消耗基线?
行动建议
开发者/技术决策者:
- Agent 部署的成本正在快速下降,现在是构建 Agent 工作流的好时机
- 关注"低 Token 成本 × 高价值产出"的场景:数据清洗、文档生成、代码审查
- 多模型并行策略可以进一步优化成本——用便宜模型处理简单任务,用旗舰模型处理关键决策
投资人:
- 关注 AI 基础设施公司的 Q2/Q3 财报,寻找利润率改善的早期信号
- 重点跟踪 Token 消耗量增速和单位成本下降速度的相对关系
- 警惕"故事好但数据差"的公司——Agent 叙事需要 Token 消耗数据支撑