C
ChaoBro

Anthropic秘密洽谈微软AI芯片:Claude的胃口,Google的TPU已经喂不饱了

Claude要"吃"的算力,比想象中更多

上周,Anthropic和SpaceX达成了一项震惊行业的协议:SpaceX每年向Anthropic提供150亿美元的AI算力。这笔交易让Anthropic一跃成为AI算力市场上的超级买家。

但看起来,这笔钱还不够。

根据The Information的最新报道,Anthropic已经开始与微软进行早期谈判,计划租用搭载微软自研Maia 200芯片的Azure服务器。

这意味着什么?意味着Claude的算力需求,已经大到连Google一家都供应不了了。

从Google的"干儿子"到多方下注

Anthropic和Google的关系曾经是AI行业最紧密的合作关系之一。Google不仅是最初的投资者,还是Anthropic主要的算力供应商——Claude的模型训练和推理大量依赖Google的TPU(Tensor Processing Unit)。

但现在,Anthropic正在"去Google化"。

这一转变有几个层面的原因:

供应链安全。 把所有算力押在一家供应商身上,风险太高。如果Google因为任何原因调整TPU的分配优先级,Anthropic就会陷入被动。多元化的算力供应商是必然选择。

微软的Maia 200有吸引力。 微软自研的Maia 200芯片虽然在训练速度上可能不如最新的TPU,但它"专门设计用来运行现有的模型,比如Claude"。也就是说,Maia 200在推理场景下可能是一个性价比更高的选择。

商业博弈。 Anthropic和微软的关系一直"冷热交替"——一方面,Anthropic需要微软的算力和渠道;另一方面,微软同时投资了OpenAI,双方存在竞争关系。但在算力短缺的时代,敌人也可以成为供应商。

为什么是推理,而不是训练?

报道特别提到,Maia 200芯片"在帮助训练新模型方面不如TPU快"。这意味着Anthropic可能将Maia 200主要用于推理(inference),即让已经训练好的Claude模型回答用户问题,而不是训练新一代模型。

这个区分很重要:

  • 训练需要极大规模的算力和高速互联,TPU在这方面仍然是王者。
  • 推理对单卡性能的要求相对较低,但对成本和延迟更敏感。Maia 200在推理场景下可能更具成本优势。

随着Claude用户量的增长,推理算力的需求正在呈指数级上升。训练一次模型是一次性的大额支出,而推理是持续的、每天都在发生的开销。

更大的背景:AI算力战争正在升级

Anthropic的这一举动不是孤立事件。整个AI行业正在经历一场算力军备竞赛:

  • OpenAI 已经与微软深度绑定,同时也在探索自建算力基础设施。
  • xAI 的Colossus集群正在扩建,马斯克的"宇宙级"算力野心不止于此。
  • Google 在持续扩展TPU产能,但同时也在向第三方(包括Anthropic的竞争对手)出售算力。
  • 亚马逊 的Trainium和Inferentia芯片也在追赶。

在这场竞赛中,Anthropic作为一个相对"年轻"的选手,正在通过多元化的供应链策略来确保自己的算力安全。

对行业的影响

Anthropic找微软谈芯片,看似是一家公司的商业决策,实际上反映了AI行业的几个深层趋势:

算力正在成为AI行业最大的瓶颈。 模型架构的创新、算法的优化,都在让位于一个简单的物理现实:谁有更多的GPU/TPU,谁就能跑得更快。

云厂商之间的竞争将加剧。 当Anthropic这样的顶级AI公司开始在Google和微软之间"货比三家"时,云厂商之间的价格战和技术竞赛将更加激烈。

自研芯片的战略价值上升。 微软的Maia 200可能不是市场上最快的AI芯片,但因为它是由微软自己设计、自己控制的,微软可以在定价、供应优先级上拥有更大的灵活性。这种自主权在算力紧缺的时代极其珍贵。

一个问题留给Anthropic

在多方下注的同时,Anthropic需要回答一个战略问题:当你的算力来源越来越分散,你的技术路线图还能保持一致吗?

不同芯片架构之间的兼容性、迁移成本、优化策略,都可能成为Claude未来发展的隐性成本。

不过,在"有没有算力"和"算力来自哪里"这两个问题面前,后者显然是一个"幸福的烦恼"。