xAI одновременно тренирует 7 моделей Grok на Colossus 2, до 10T параметров

Основной вывод

xAI одновременно обучает 7 различных моделей Grok на кластере Colossus 2 — крупнейший план параллельного обучения, раскрытый публично. В сочетании с только что выпущенным Grok 4.3, занявшим первое место в бенчмарках agent-вызова инструментов, xAI строит полную матрицу моделей от легких до ультрабоьших.

Обзор масштаба обучения

Согласно раскрытой информации на платформе X, текущая матрица моделей, обучаемых на Colossus 2:

Кодовое имя	Параметры	Позиционирование	Конкуренты
Текущий Grok	0.5T (500B)	Существующий флагман	GPT-5.5, Claude Opus 4.7
Grok 5 Small	1T	Эффективный инференс	Gemini 2.5 Pro
Grok 5 Mid	1.5T	Баланс производительности	Claude Sonnet 4.5
Grok 5 Large	6T	Глубокое рассуждение	GPT-6 (ожидается)
Grok 5 Max	10T	Пиковая производительность	Нет прямого конкурента

10T-параметрический Grok 5 Max, если успешно обучен, станет крупнейшей единой языковой моделью в мире.

Colossus 2: Инфраструктура обучения

Colossus 2 — ультрабоьшой GPU-кластер xAI в Мемфисе:

Масштаб GPU: 200 000+ NVIDIA H100/B200 GPU
Сеть: Кастомная архитектура InfiniScale
Электропитание: Выделенная подстанция, пиковое потребление более 500 МВт
Охлаждение: Полное жидкостное охлаждение, PUE ниже 1.1

Grok 4.3: Уже доступные возможности

Grok 4.3, выпущенный в начале мая 2026:

Agentic Tool Calling #1: Первое место в оценке agent-вызова инструментов
Скорость инференса: 100 токенов/секунду
Контекстное окно: 1M токенов
Цена: $1.25/MTok ввод

Ваша роль	Фокус
Agent-разработчики	Начните с Grok 4.3 — низкая цена, лидирующая производительность
Корпоративный выбор технологий	Следите за Grok 5 Small/Mid
Исследователи	Архитектура параллельного обучения Colossus 2
Инвесторы	Путь коммерциализации 10T модели

Основной вывод

Обзор масштаба обучения

Colossus 2: Инфраструктура обучения

Grok 4.3: Уже доступные возможности

Рекомендации

Похожие материалы

MiniMax 3.0 на горизонте: M2 отстает, акции под давлением, битва за выживание китайских AI-моделей второго эшелона

Qwen3.6-Plus: Обработка 80% ежедневных Agent-задач за 1/5 цены Opus

OpenAI GPT-6 "Goblin" Дорожная Карта: Объявление 29 Сентября на DevDay, Споры о AGI Возобновляются