斯坦福大学以人为本人工智能研究所(HAI)又出了一年度报告——今年 423 页,叫《2026 年 AI 指数报告》。
这个报告每年出一份,已经是 AI 行业的事实标准参考。今年这份最抓眼球的结论很直接:中美两国在 AI 模型性能上的差距"已几乎消失"。
性能追平了,然后呢
报告对比了中美两国在 MMLU、GPQA、HumanEval 等基准上的最佳模型表现。2022 年,美国模型在所有主要基准上都明显领先。到了 2025 年,差距已经缩小到统计上不显著的水平。
这背后的驱动因素很明确:DeepSeek 2024 年底的 V3 是一个分水岭,之后中国开源模型社区跟进速度远超预期。开源生态让"追差距"变成了"抄作业+改进",而不是从零开始。
但性能追平不等于实力对等。报告还列了几个没被追平的差距:
算力。 美国顶级 AI 公司的训练集群规模仍然远超中国同行。英伟达高端芯片的出口管制是一个因素,但更根本的是——全球 AI 算力基础设施的投资,美国占绝对大头。
投资。 2025 年,全球 AI 私人投资约 1500 亿美元,美国公司拿到了其中的约 70%。中国 AI 投资增速放缓,部分原因是宏观经济,部分原因是监管对大模型生成内容的持续管控。
人才流动。 报告追踪了顶级 AI 会议论文的作者是"留在美国"还是"回到中国"。趋势是:越来越多的华裔 AI 研究者选择回国,但美国仍然是全球 AI 人才的最大聚集地。
几个值得注意的数据点
AI 行业正在"富者愈富"。 OpenAI 和 Anthropic 两家累计融资 2426 亿美元,占福布斯 AI 50 榜总融资额的近 80%。头部效应比 2024 年更极端。
企业 AI 采用加速。 报告引用麦肯锡数据称,全球 78% 的企业已在至少一个业务流程中使用 AI——高于 2024 年的 55%。但"使用 AI"和"从 AI 中获得显著商业价值"是两回事,后者仍然集中在科技和金融行业。
AI 安全研究投入大幅增长。 但报告指出,大部分安全研究集中在"对齐"和"红队测试"等技术问题,对 AI 的社会经济影响——比如就业替代、信息操纵——研究投入仍然不成比例地少。
一份报告的局限性
AI 指数报告是斯坦福做的,不是中立机构。它的资金来自斯坦福 HAI——而 HAI 的资金来源包括 Google、Microsoft、OpenAI 等科技公司。这不代表报告不靠谱,但意味着你需要带着这个背景读。
比如报告对"AI 对齐"和"负责任 AI"的强调篇幅,比任何独立研究机构写的都多——这不是巧合。
我的看法
"中美 AI 模型性能差距几乎消失"这个结论听起来很震撼,但它衡量的是"最佳模型在标准基准上的表现"。这是一个特定的、狭窄的维度。
真正的差距不在模型 benchmark 分数上,在生态里——芯片供应链、开发者社区、开源基础设施、商业落地场景。这些维度上,美国仍然领先。中国追赶速度很快,但"几乎消失"这四个字,用在 benchmark 上合适,用在整体竞争力上就不够了。
主要来源:
- Stanford HAI《2026 AI Index Report》(2026-04-17)
- 新华网相关报道