7 мая Infini AI объявила о привлечении нового раунда финансирования на сумму более 700 млн юаней. Соведущими инвесторами раунда стали Группа инвестиционного развития Ханчжоу Гаосинь и Hillhouse Capital. В число участников последующих инвестиций вошёл впечатляющий состав: Guoxing Capital, Qinhuai Data, GF Qianhe, Lihe Qingtong, China Insurance Investment, AEF NextGen, Tendu Capital, Colorlight, CITIC Securities Capital и лаборатория Kuande Intelligent Learning. Существующие акционеры — Legend Capital, Shanghai State-owned Capital Fund Futeng и Yuanzhi Future — также увеличили свои вложения.
За три года совокупный объём финансирования составил почти 2,2 млрд юаней.
Цифры говорят громче, чем финансирование
Суммы финансирования впечатляют, но по-настоящему поражают показатели бизнеса:
- По состоянию на конец апреля 2026 года ежедневное количество вызовов токенов на платформе MaaS выросло более чем в 20 раз по сравнению с концом 2025 года
- Темпы роста в десятки раз превышают средний уровень по стране
- С конца января объём вызовов токенов на платформе удваивается каждые две недели
Эта кривая роста действительно впечатляет. Генеральный директор Ся Лисюэ на форуме Чжунгуаньцунь заметил: «В последний раз я наблюдал настолько безумную кривую роста во время массового бума мобильного трафика эпохи 3G».
Взрывной рост трафика 3G обеспечил золотое десятилетие мобильного интернета. Экспоненциальный рост вызовов токенов сигнализирует о том, что индустрия ИИ переходит от стадии концепций к полномасштабному внедрению.
Почему такой стремительный рост? Агентство за работой
Ответ прост: агенты (Agents) изменили масштаб потребления токенов.
Раньше большие модели работали скорее как собеседники — пользователи вводили запросы вручную, задавали вопросы по очереди, одно взаимодействие потребляло сотни токенов с интервалом в минуты, и ошибки были не критичны.
А теперь? Агенты самостоятельно планируют, исполняют и анализируют результаты, сложные многошаговые задачи и координация стали нормой. Потребление токенов на одну задачу прямо взлетело до сотен тысяч и даже миллионов.
Ритм взаимодействия сжался от минут до миллисекунд. Интеллектуальные агенты координируют высокочастотные взаимодействия, принимают решения в реальном времени и непрерывно итерируются. Модель GLM-5.1, опираясь на профессиональную инфраструктуру, уже способна непрерывно работать до 8 часов за одну сессию.
Подобные изменения предъявляют революционные требования к точности распределения вычислительных ресурсов, стабильности системы и отказоустойчивости. Старые архитектуры не выдерживают.
Роль сторонней платформы MaaS
Здесь возникает интересный отраслевой вопрос: зачем нужна независимая сторонняя платформа MaaS?
Текущая инфраструктурная картина естественным образом разделяется на три сегмента:
- Инфраструктура крупных технологических компаний: ориентирована на внутренние сервисы, не открыта для внешних клиентов
- Инфраструктура производителей чипов: привязана к собственной аппаратной экосистеме
- Собственная инфраструктура модельных компаний: ограничена конкурентными отношениями, не может стать универсальной основой для всей отрасли
Дифференциация Infini AI заключается именно в нейтральности. Компания не привязана ни к одной модели или чипу, специализируясь на оптимизации вычислительных мощностей и производстве токенов. По словам Ся Лисюэ, цель — стать «наибольшим общим знаменателем» индустриальной цепочки ИИ в Китае.
На сегодня сервис охватывает: GLM, Kimi, MiniMax, DeepSeek, Tongyi Qianwen и другие ведущие китайские открытые модели. Точность согласования >99,9%, пропускная способность увеличена в 2–3 раза, задержка сокращена на 50%, задержка первого токена уложена в пределы 500 мс.
Фокус конкуренции смещается от моделей к эффективности производства токенов
Это самый важный сигнал, который стоит вынести из этой новости:
Фокус конкуренции в индустрии ИИ смещается от «чья модель мощнее» к «кто производит токены эффективнее».
Тот, кто способен организовать производство и распределение токенов при меньших затратах, более высокой эффективности и большей стабильности, получает ключевое право голоса в индустриализации ИИ.
Это объясняет, почему Infini AI смогла привлечь 2,2 млрд юаней — она не модельная компания, а «поставщик воды» для экономики токенов. Во времена золотой лихорадки те, кто продавал лопаты, всегда оставались в выигрыше.
Риски и наблюдения
- Достаточно ли глубока технологическая преграда? Оптимизация токенов — это инженерная или научная задача? Если производители больших моделей самостоятельно повысят эффективность инференса, ценность сторонних платформ сократится
- Можно ли долгосрочно сохранять нейтральность? Когда ведущие модельные компании начнут создавать собственную инфраструктуру или привязываться к ней, не сузится ли клиентская база независимого игрока
- Оценка стоимости и прогресс коммерциализации, соответствующие финансированию в 2,2 млрд юаней, не раскрыты; состав инвесторов впечатляющий, но горизонт окупаемости неясен
Анализ конкурентного ландшафта китайских моделей
Парадигмальный сдвиг AI-агентов
Тенденции финансирования ИИ в Q1 2026
Основные источники: QbitAI (на основе официального объявления Infini AI), открытая информация форума Чжунгуаньцунь