C
ChaoBro

NVIDIA Vera CPU выходит: 88-ядерный чип собственной разработки для Agentic AI, $1 трлн заказов сигнализирует о смене аппаратной парадигмы

NVIDIA Vera CPU выходит: 88-ядерный чип собственной разработки для Agentic AI, $1 трлн заказов сигнализирует о смене аппаратной парадигмы

Основной вывод

NVIDIA раскрыла две важные информации на GTC 2026: официальный дебют Vera CPU и заказы на чипы Blackwell + Vera Rubin превысили $1 трлн. Vera — первый CPU, созданный специально для рабочих нагрузок Agentic AI, с 88 кастомными ядрами Olympus, пропускной способностью памяти 1,2 ТБ/с и когерентной пропускной способностью CPU-GPU 1,8 ТБ/с через NVLink. Объём заказов в $1 трлн подтверждает один факт: инвестиции в инфраструктуру ИИ перешли от «исследовательских испытаний» к «ставке на будущее».

Vera CPU: Процессор, рождённый для агентов

Почему агентам нужен выделенный CPU

Типичная конфигурация традиционных серверов ИИ — 1 CPU в паре с 4 GPU — это соотношение было разумным в эпоху обучения, потому что GPU выполняли большую часть вычислений, а CPU в основном управлял перемещением данных и планированием задач.

Но Agentic AI изменил это предположение. Характеристики рабочих нагрузок агентов включают:

  • Частые вызовы инструментов: Агентам может потребоваться вызов внешних инструментов на каждом шаге, оркестрируемых CPU
  • Логическое гейтирование: Решение, когда вызывать какой инструмент, как ветвиться, когда завершать — это CPU-интенсивные логические решения
  • Перемещение данных: Перемещение контекстных данных между GPU, памятью и внешними API
  • Мультиагентная оркестрация: Планирование и координация нескольких экземпляров агентов

Начиная с 2026 Q1, взрыв спроса на Agentic AI вызвал серьёзную нехватку конфигурации CPU в серверах, ответственных за командование и управление. Существующее соотношение CPU-GPU 1:4 не может поддерживать требования конкурентности рабочих нагрузок агентов.

Основные спецификации Vera CPU

Параметр Значение Значимость
Ядра 88 кастомных ядер Olympus Значительно превышает плотность ядер традиционных серверных CPU
Пропускная способность памяти 1,2 ТБ/с Поддерживает крупномасштабное перемещение контекстных данных
Когерентная пропускная способность CPU-GPU 1,8 ТБ/с (NVLink) Устраняетбутылочное горлышко передачи данных CPU-GPU
Самостоятельная работа Поддерживает автономный инференс Может выполнять инференс и оркестрацию без GPU
Парная работа Работает с GPU Rubin Полное решение для обучения + инференса + оркестрации агентов

Ключевое понимание: Vera может работать самостоятельно для инференса и оркестрации — что означает, что для задач агентов, не требующих ускорения GPU (оркестрация вызовов инструментов, логические решения, маршрутизация API), CPU Vera можно развёртывать независимо, значительно снижая затраты.

$1 трлн заказов: Сигнал за цифрой

Сравнение масштаба заказов

Дженсен Хуан раскрыл на GTC 2026, что заказы на покупку чипов Blackwell и Vera Rubin к 2027 году достигли $1 трлн. Для контекста:

  • Мировой рынок чипов ИИ в 2024 году: ~$50 млрд
  • $1 трлнравно 20x годового мирового рынка чипов ИИ
  • Это не «экспериментирование» — это детерминированная ставка предприятий на инфраструктуру ИИ

Изменение структуры заказов

Период Основные покупатели Цель покупки
2023-2024 Техгиганты (Meta, Google, Microsoft) Обучение собственных больших моделей
2025 Облачные провайдеры (AWS, Azure, GCP) Предоставление облачных сервисов ИИ
2026 Вся индустрия (финансы, здравоохранение, производство, розница) Инференс + развёртывание агентов

Сдвиг: Покупатели чипов ИИ расширились от «нескольких техгигантов» до «всей индустрии», а цель сместилась от «обучения» к «инференсу и развёртыванию агентов». Это标志 демократизации инвестиций в инфраструктуру ИИ.

Оценка ландшафта

Влияние на архитектуру серверов ИИ

NVIDIA и AMD переоценивают соотношения CPU-GPU в серверах ИИ. Аналитики полагают, что по мере роста спроса на Agentic AI будущие серверы ИИ могут принять более высокие соотношения конфигурации CPU (например, 2:4 или даже 4:4), и могут появиться чисто CPU-серверы агентов (использующие Vera для лёгкой оркестрации агентов).

Что это значит для разработчиков

  1. Снижение затрат на локальное развёртывание агентов: Vera может запускать инференс независимо, что означает возможность развёртывания лёгких агентов без GPU
  2. Специализация уровня оркестрации агентов: Появление выделенных CPU означает, что оркестрация агентов больше не будет «побочным действием», а станет независимой областью оптимизации оборудования
  3. Гибридное развёртывание становится нормой: Разделённая архитектура GPU для тяжёлого инференса + CPU для лёгкой оркестрации станет стандартом для развёртывания агентов

Рекомендации к действию

Планирование инфраструктуры

  • Оцените текущие соотношения CPU-GPU: Если ваши рабочие нагрузки агентов показываютбутылочное горлышко CPU (высокая задержка вызовов инструментов, очереди планирования), рассмотрите увеличение конфигурации CPU
  • Следите за возможностями самостоятельного развёртывания Vera CPU: Для задач агентов, не требующих GPU (оркестрация API, правила принятия решений, лёгкий инференс), Vera может быть более экономичным выбором, чем GPU
  • Планируйте гибридные архитектуры: Разделённая архитектура GPU для инференса моделей и CPU для оркестрации агентов станет мейнстримом

Подготовка разработчиков

  • Оптимизируйте эффективность вызовов инструментов: Сократите不必要的 вызовы инструментов, чтобы снизить давление оркестрации CPU
  • Облегчите логику агентов: Отделите логические решения, которые могут выполняться на CPU, от инференса моделей, требующих GPU
  • Следите за открытым стеком Physical AI от NVIDIA: NVIDIA также открыла весь свой стек технологий Physical AI — разработчики в области робототехники и воплощённого ИИ должны клонировать репозиторий в первую очередь

Примечания о рисках

  • $1 трлн — это «заказы на покупку», а не «поставлено», поэтому фактические сроки отгрузки и развёртывания несут неопределённость
  • Конкретные цены и сроки поставки Vera CPU ещё не полностью раскрыты; разработчикам следует продолжать мониторинг
  • Если AMD или другие вендоры выпустят конкурентные CPU, выделенные для агентов, ландшафт рынка может быстро измениться