Вычислительные мощности, которые «поглощает» Claude, превышают ожидания
На прошлой неделе Anthropic и SpaceX заключили соглашение, потрясшее отрасль: SpaceX будет предоставлять Anthropic ИИ-вычислительные мощности на сумму 15 млрд долларов в год. Эта сделка мгновенно превратила Anthropic в мегаскупщика на рынке ИИ-вычислений.
Однако, похоже, и этих средств недостаточно.
Согласно последним данным The Information, Anthropic уже начала предварительные переговоры с Microsoft о планах аренды серверов Azure на базе собственного чипа Maia 200.
Что это значит? Это означает, что потребности Claude в вычислительных ресурсах стали настолько велики, что даже Google в одиночку не может их удовлетворить.
От «приёмного сына» Google к стратегии множественных ставок
Отношения Anthropic и Google когда-то были одним из самых тесных партнёрств в ИИ-индустрии. Google выступал не только первоначальным инвестором, но и основным поставщиком вычислительных мощностей для Anthropic — обучение и инференс моделей Claude в значительной степени опирались на TPU (Tensor Processing Unit) от Google.
Однако сейчас Anthropic активно проводит политику снижения зависимости от Google.
У этого поворота есть несколько причин:
Безопасность цепочки поставок. Ставить все вычислительные ресурсы на одного поставщика слишком рискованно. Если Google по какой-либо причине изменит приоритеты распределения TPU, Anthropic окажется в уязвимом положении. Диверсификация поставщиков вычислительных мощностей — неизбежный выбор.
Привлекательность Maia 200 от Microsoft. Хотя собственный чип Maia 200 от Microsoft может уступать новейшим TPU в скорости обучения, он «специально разработан для запуска существующих моделей, таких как Claude». Иными словами, в сценариях инференса Maia 200 может оказаться более выгодным решением с точки зрения соотношения цены и качества.
Коммерческая игра. Отношения Anthropic и Microsoft всегда были «то горячими, то холодными»: с одной стороны, Anthropic нуждается в вычислительных мощностях и каналах Microsoft, с другой — Microsoft также инвестирует в OpenAI, что создаёт конкурентную среду. Но в эпоху дефицита вычислительных ресурсов даже конкуренты могут стать поставщиками.
Почему инференс, а не обучение?
В отчёте особо отмечается, что чип Maia 200 «уступает TPU в скорости помощи при обучении новых моделей». Это означает, что Anthropic, вероятно, будет использовать Maia 200 преимущественно для инференса (inference), то есть для того, чтобы уже обученная модель Claude отвечала на запросы пользователей, а не для обучения моделей нового поколения.
Это различие имеет ключевое значение:
- Обучение требует колоссальных вычислительных мощностей и высокоскоростных соединений, и TPU в этой области по-прежнему остаётся безоговорочным лидером.
- Инференс предъявляет относительно более низкие требования к производительности отдельного чипа, но гораздо более чувствителен к стоимости и задержкам. В сценариях инференса Maia 200 может обладать преимуществом в стоимости.
По мере роста числа пользователей Claude спрос на вычислительные мощности для инференса растёт экспоненциально. Обучение модели — это разовые крупные капитальные затраты, тогда как инференс — это постоянные, ежедневные операционные расходы.
Более широкий контекст: война за ИИ-вычисления набирает обороты
Этот шаг Anthropic не является изолированным случаем. Вся ИИ-индустрия переживает гонку вычислительных вооружений:
- OpenAI уже глубоко интегрирована с Microsoft, но также изучает возможности создания собственной вычислительной инфраструктуры.
- Кластер Colossus компании xAI продолжает расширяться, и «космические» амбиции Маска в сфере вычислительных мощностей на этом не заканчиваются.
- Google продолжает наращивать производственные мощности TPU, но одновременно продаёт вычислительные ресурсы третьим лицам (включая конкурентов Anthropic).
- Чипы Trainium и Inferentia от Amazon также активно догоняют лидеров.
В этой гонке Anthropic, будучи относительно «молодым» игроком, обеспечивает свою вычислительную безопасность за счёт стратегии диверсификации цепочки поставок.
Влияние на отрасль
Переговоры Anthropic с Microsoft о чипах, на первый взгляд, кажутся коммерческим решением одной компании, но на деле отражают несколько глубинных тенденций в ИИ-индустрии:
Вычислительные мощности становятся главным ограничивающим фактором ИИ-индустрии. Инновации в архитектуре моделей и оптимизация алгоритмов отходят на второй план перед простой физической реальностью: у кого больше GPU/TPU, тот и движется быстрее.
Конкуренция между облачными провайдерами усилится. Когда ведущие ИИ-компании, подобные Anthropic, начинают «сравнивать цены» между Google и Microsoft, ценовые войны и технологическая гонка среди облачных провайдеров станут ещё более жёсткими.
Растёт стратегическая ценность собственных чипов. Maia 200 от Microsoft может быть не самым быстрым ИИ-чипом на рынке, но поскольку он спроектирован и контролируется самой Microsoft, компания получает большую гибкость в ценообразовании и приоритетах поставок. Такая автономия бесценна в эпоху дефицита вычислительных ресурсов.
Вопрос, остающийся за Anthropic
Делая ставки на несколько сторон, Anthropic должна ответить на стратегический вопрос: сможет ли ваша технологическая дорожная карта оставаться согласованной, когда источники вычислительных мощностей становятся всё более рассредоточенными?
Совместимость между различными архитектурами чипов, затраты на миграцию и стратегии оптимизации могут стать скрытыми издержками для будущего развития Claude.
Впрочем, перед выбором между «есть ли вообще вычислительные мощности» и «откуда они поступают», второй вопрос явно является «приятной проблемой».