Infini AI привлекла более 700 млн юаней: ежедневное количество токенов выросло в 20 раз, став «поставщиком воды» для китайских больших моделей

7 мая Infini AI объявила о привлечении нового раунда финансирования на сумму более 700 млн юаней. Соведущими инвесторами раунда стали Группа инвестиционного развития Ханчжоу Гаосинь и Hillhouse Capital. В число участников последующих инвестиций вошёл впечатляющий состав: Guoxing Capital, Qinhuai Data, GF Qianhe, Lihe Qingtong, China Insurance Investment, AEF NextGen, Tendu Capital, Colorlight, CITIC Securities Capital и лаборатория Kuande Intelligent Learning. Существующие акционеры — Legend Capital, Shanghai State-owned Capital Fund Futeng и Yuanzhi Future — также увеличили свои вложения.

За три года совокупный объём финансирования составил почти 2,2 млрд юаней.

Цифры говорят громче, чем финансирование

Суммы финансирования впечатляют, но по-настоящему поражают показатели бизнеса:

По состоянию на конец апреля 2026 года ежедневное количество вызовов токенов на платформе MaaS выросло более чем в 20 раз по сравнению с концом 2025 года
Темпы роста в десятки раз превышают средний уровень по стране
С конца января объём вызовов токенов на платформе удваивается каждые две недели

Эта кривая роста действительно впечатляет. Генеральный директор Ся Лисюэ на форуме Чжунгуаньцунь заметил: «В последний раз я наблюдал настолько безумную кривую роста во время массового бума мобильного трафика эпохи 3G».

Взрывной рост трафика 3G обеспечил золотое десятилетие мобильного интернета. Экспоненциальный рост вызовов токенов сигнализирует о том, что индустрия ИИ переходит от стадии концепций к полномасштабному внедрению.

Почему такой стремительный рост? Агентство за работой

Ответ прост: агенты (Agents) изменили масштаб потребления токенов.

Раньше большие модели работали скорее как собеседники — пользователи вводили запросы вручную, задавали вопросы по очереди, одно взаимодействие потребляло сотни токенов с интервалом в минуты, и ошибки были не критичны.

А теперь? Агенты самостоятельно планируют, исполняют и анализируют результаты, сложные многошаговые задачи и координация стали нормой. Потребление токенов на одну задачу прямо взлетело до сотен тысяч и даже миллионов.

Ритм взаимодействия сжался от минут до миллисекунд. Интеллектуальные агенты координируют высокочастотные взаимодействия, принимают решения в реальном времени и непрерывно итерируются. Модель GLM-5.1, опираясь на профессиональную инфраструктуру, уже способна непрерывно работать до 8 часов за одну сессию.

Подобные изменения предъявляют революционные требования к точности распределения вычислительных ресурсов, стабильности системы и отказоустойчивости. Старые архитектуры не выдерживают.

Роль сторонней платформы MaaS

Здесь возникает интересный отраслевой вопрос: зачем нужна независимая сторонняя платформа MaaS?

Текущая инфраструктурная картина естественным образом разделяется на три сегмента:

Инфраструктура крупных технологических компаний: ориентирована на внутренние сервисы, не открыта для внешних клиентов
Инфраструктура производителей чипов: привязана к собственной аппаратной экосистеме
Собственная инфраструктура модельных компаний: ограничена конкурентными отношениями, не может стать универсальной основой для всей отрасли

Дифференциация Infini AI заключается именно в нейтральности. Компания не привязана ни к одной модели или чипу, специализируясь на оптимизации вычислительных мощностей и производстве токенов. По словам Ся Лисюэ, цель — стать «наибольшим общим знаменателем» индустриальной цепочки ИИ в Китае.

На сегодня сервис охватывает: GLM, Kimi, MiniMax, DeepSeek, Tongyi Qianwen и другие ведущие китайские открытые модели. Точность согласования >99,9%, пропускная способность увеличена в 2–3 раза, задержка сокращена на 50%, задержка первого токена уложена в пределы 500 мс.

Фокус конкуренции смещается от моделей к эффективности производства токенов

Это самый важный сигнал, который стоит вынести из этой новости:

Фокус конкуренции в индустрии ИИ смещается от «чья модель мощнее» к «кто производит токены эффективнее».

Тот, кто способен организовать производство и распределение токенов при меньших затратах, более высокой эффективности и большей стабильности, получает ключевое право голоса в индустриализации ИИ.

Это объясняет, почему Infini AI смогла привлечь 2,2 млрд юаней — она не модельная компания, а «поставщик воды» для экономики токенов. Во времена золотой лихорадки те, кто продавал лопаты, всегда оставались в выигрыше.

Риски и наблюдения

Достаточно ли глубока технологическая преграда? Оптимизация токенов — это инженерная или научная задача? Если производители больших моделей самостоятельно повысят эффективность инференса, ценность сторонних платформ сократится
Можно ли долгосрочно сохранять нейтральность? Когда ведущие модельные компании начнут создавать собственную инфраструктуру или привязываться к ней, не сузится ли клиентская база независимого игрока
Оценка стоимости и прогресс коммерциализации, соответствующие финансированию в 2,2 млрд юаней, не раскрыты; состав инвесторов впечатляющий, но горизонт окупаемости неясен

Анализ конкурентного ландшафта китайских моделей

Парадигмальный сдвиг AI-агентов

Тенденции финансирования ИИ в Q1 2026

Основные источники: QbitAI (на основе официального объявления Infini AI), открытая информация форума Чжунгуаньцунь

Цифры говорят громче, чем финансирование

Почему такой стремительный рост? Агентство за работой

Роль сторонней платформы MaaS

Фокус конкуренции смещается от моделей к эффективности производства токенов

Риски и наблюдения

Похожие материалы

Ставка Лекуна на $1 млрд: AMI Labs строит анти-LLM

DeepSeek после 50 миллиардов юаней: июньское обновление V4, накопление вычислительных мощностей и право на ценообразование

Обзор финансирования китайских ИИ-лабораторий: $9 млрд собрано, у DeepSeek ещё $7,35 млрд в пути