Основной вывод
NVIDIA раскрыла две важные информации на GTC 2026: официальный дебют Vera CPU и заказы на чипы Blackwell + Vera Rubin превысили $1 трлн. Vera — первый CPU, созданный специально для рабочих нагрузок Agentic AI, с 88 кастомными ядрами Olympus, пропускной способностью памяти 1,2 ТБ/с и когерентной пропускной способностью CPU-GPU 1,8 ТБ/с через NVLink. Объём заказов в $1 трлн подтверждает один факт: инвестиции в инфраструктуру ИИ перешли от «исследовательских испытаний» к «ставке на будущее».
Vera CPU: Процессор, рождённый для агентов
Почему агентам нужен выделенный CPU
Типичная конфигурация традиционных серверов ИИ — 1 CPU в паре с 4 GPU — это соотношение было разумным в эпоху обучения, потому что GPU выполняли большую часть вычислений, а CPU в основном управлял перемещением данных и планированием задач.
Но Agentic AI изменил это предположение. Характеристики рабочих нагрузок агентов включают:
- Частые вызовы инструментов: Агентам может потребоваться вызов внешних инструментов на каждом шаге, оркестрируемых CPU
- Логическое гейтирование: Решение, когда вызывать какой инструмент, как ветвиться, когда завершать — это CPU-интенсивные логические решения
- Перемещение данных: Перемещение контекстных данных между GPU, памятью и внешними API
- Мультиагентная оркестрация: Планирование и координация нескольких экземпляров агентов
Начиная с 2026 Q1, взрыв спроса на Agentic AI вызвал серьёзную нехватку конфигурации CPU в серверах, ответственных за командование и управление. Существующее соотношение CPU-GPU 1:4 не может поддерживать требования конкурентности рабочих нагрузок агентов.
Основные спецификации Vera CPU
| Параметр | Значение | Значимость |
|---|---|---|
| Ядра | 88 кастомных ядер Olympus | Значительно превышает плотность ядер традиционных серверных CPU |
| Пропускная способность памяти | 1,2 ТБ/с | Поддерживает крупномасштабное перемещение контекстных данных |
| Когерентная пропускная способность CPU-GPU | 1,8 ТБ/с (NVLink) | Устраняет瓶颈 передачи данных CPU-GPU |
| Самостоятельная работа | Поддерживает автономный инференс | Может выполнять инференс и оркестрацию без GPU |
| Парная работа | Работает с GPU Rubin | Полное решение для обучения + инференса + оркестрации агентов |
Ключевое понимание: Vera может работать самостоятельно для инференса и оркестрации — что означает, что для задач агентов, не требующих ускорения GPU (оркестрация вызовов инструментов, логические решения, маршрутизация API), CPU Vera можно развёртывать независимо, значительно снижая затраты.
$1 трлн заказов: Сигнал за цифрой
Сравнение масштаба заказов
Дженсен Хуан раскрыл на GTC 2026, что заказы на покупку чипов Blackwell и Vera Rubin к 2027 году достигли $1 трлн. Для контекста:
- Мировой рынок чипов ИИ в 2024 году: ~$50 млрд
- $1 трлн等于 20x годового мирового рынка чипов ИИ
- Это не «экспериментирование» — это детерминированная ставка предприятий на инфраструктуру ИИ
Изменение структуры заказов
| Период | Основные покупатели | Цель покупки |
|---|---|---|
| 2023-2024 | Техгиганты (Meta, Google, Microsoft) | Обучение собственных больших моделей |
| 2025 | Облачные провайдеры (AWS, Azure, GCP) | Предоставление облачных сервисов ИИ |
| 2026 | Вся индустрия (финансы, здравоохранение, производство, розница) | Инференс + развёртывание агентов |
Сдвиг: Покупатели чипов ИИ расширились от «нескольких техгигантов» до «всей индустрии», а цель сместилась от «обучения» к «инференсу и развёртыванию агентов». Это标志 демократизации инвестиций в инфраструктуру ИИ.
Оценка ландшафта
Влияние на архитектуру серверов ИИ
NVIDIA и AMD переоценивают соотношения CPU-GPU в серверах ИИ. Аналитики полагают, что по мере роста спроса на Agentic AI будущие серверы ИИ могут принять более высокие соотношения конфигурации CPU (например, 2:4 или даже 4:4), и могут появиться чисто CPU-серверы агентов (использующие Vera для лёгкой оркестрации агентов).
Что это значит для разработчиков
- Снижение затрат на локальное развёртывание агентов: Vera может запускать инференс независимо, что означает возможность развёртывания лёгких агентов без GPU
- Специализация уровня оркестрации агентов: Появление выделенных CPU означает, что оркестрация агентов больше не будет «побочным действием», а станет независимой областью оптимизации оборудования
- Гибридное развёртывание становится нормой: Разделённая архитектура GPU для тяжёлого инференса + CPU для лёгкой оркестрации станет стандартом для развёртывания агентов
Рекомендации к действию
Планирование инфраструктуры
- Оцените текущие соотношения CPU-GPU: Если ваши рабочие нагрузки агентов показывают瓶颈 CPU (высокая задержка вызовов инструментов, очереди планирования), рассмотрите увеличение конфигурации CPU
- Следите за возможностями самостоятельного развёртывания Vera CPU: Для задач агентов, не требующих GPU (оркестрация API, правила принятия решений, лёгкий инференс), Vera может быть более экономичным выбором, чем GPU
- Планируйте гибридные архитектуры: Разделённая архитектура GPU для инференса моделей и CPU для оркестрации агентов станет мейнстримом
Подготовка разработчиков
- Оптимизируйте эффективность вызовов инструментов: Сократите不必要的 вызовы инструментов, чтобы снизить давление оркестрации CPU
- Облегчите логику агентов: Отделите логические решения, которые могут выполняться на CPU, от инференса моделей, требующих GPU
- Следите за открытым стеком Physical AI от NVIDIA: NVIDIA также открыла весь свой стек технологий Physical AI — разработчики в области робототехники и воплощённого ИИ должны клонировать репозиторий в первую очередь
Примечания о рисках
- $1 трлн — это «заказы на покупку», а не «поставлено», поэтому фактические сроки отгрузки и развёртывания несут неопределённость
- Конкретные цены и сроки поставки Vera CPU ещё не полностью раскрыты; разработчикам следует продолжать мониторинг
- Если AMD или другие вендоры выпустят конкурентные CPU, выделенные для агентов, ландшафт рынка может быстро измениться