5 月 7 日,无问芯穹宣布再获超 7 亿元融资。本轮联合领投方为杭州高新金投集团和惠远资本,跟投阵容相当豪华:国兴资本、秦淮数据、广发乾和、力合清瞳、中保投资、AEF NextGen、腾瑞资本、卡莱特、中信建投资本和宽德智能学习实验室。老股东君联资本、上海国投孚腾和元智未来追加投资。
成立三年,累计融资近 22 亿元。
数据比融资更有说服力
融资数字固然亮眼,但真正让人侧目的是它的业务数据:
- 截至 2026 年 4 月底,MaaS 平台日均 Token 调用量较 2025 年底增长超 20 倍
- 增速是全国平均水平的数十倍
- 从 1 月底开始,平台 Token 调用量每两周翻一番
这个增长曲线确实恐怖。CEO 夏立雪在中关村论坛上的感慨不是夸张:"上一次见证如此疯狂的增长曲线,还是 3G 时代手机流量全民爆发的时候。"
3G 流量爆发撑起了移动互联网的黄金十年。Token 调用量指数级增长的背后,是 AI 产业正在从概念期走向全面落地的信号。
为什么涨这么快?Agent 在干活
原因很直接:Agent 改变了 Token 消耗的量级。
以前的大模型更像是个陪聊选手——用户手动输入、逐轮提问,单次交互消耗数百 Token,间隔分钟级,偶尔出错也无所谓。
现在呢?Agent 自主规划、自主执行、自主复盘,复杂长链条任务和多步骤协同成为常态。单次任务的 Token 消耗直接飙升至十万甚至百万级别。
交互节奏也从分钟级压缩到毫秒级。智能体之间高频联动、实时决策、不间断迭代。GLM-5.1 模型依托专业基建支撑,已经可以实现单次持续工作 8 小时。
这种变化对算力调度精度、系统稳定性、故障容错能力的要求是颠覆性的。老旧架构扛不住。
第三方 MaaS 平台的角色
这里有个有趣的行业判断:为什么需要一个独立的第三方 MaaS 平台?
现有的基础设施格局天然被切成三块:
- 大厂 Infra:以服务内部业务为主,不对外开放
- 芯片厂商 Infra:绑定自家硬件生态
- 模型公司自建 Infra:受竞争关系限制,无法成为全行业通用底座
无问芯穹的差异化正在于中立性。不绑定任何模型或芯片,专门做算力优化和 Token 生产。用夏立雪的话说,要成为中国 AI 产业链的"最大公约数"。
它目前的服务覆盖:GLM、Kimi、MiniMax、DeepSeek、通义千问等国产主流开源模型。精度对齐率 >99.9%,吞吐量提升 2-3 倍,时延缩减 50%,首字延迟压进 500ms 以内。
竞争焦点正在从模型转向 Token 生产效率
这才是这篇新闻最值得读的信号:
AI 产业竞争的焦点正在从"谁的模型更强"转向"谁的 Token 生产效率更高"。
谁能在更低成本、更高效率、更稳定的前提下完成 Token 生产调度,谁就掌握 AI 产业化的核心话语权。
这解释了为什么无问芯穹能拿到 22 亿融资——它不是模型公司,而是Token 经济的卖水人。淘金热里,卖铲子的永远稳赚。
风险与观察
- 技术壁垒是否足够深?Token 优化是工程问题还是科学问题?如果大模型厂商自己把推理效率提上来,第三方平台的价值空间会被压缩
- 中立性能否长期维持?当头部模型厂商开始自建或绑定基础设施,独立第三方的客户池会不会收窄
- 22 亿融资对应的估值和商业化进度没有披露,投资者阵容豪华但回报周期不清晰
主要来源:量子位(基于无问芯穹官方公告)、中关村论坛公开信息