NVIDIA Vera CPU выходит: 88-ядерный чип собственной разработки для Agentic AI, $1 трлн заказов сигнализирует о смене аппаратной парадигмы

NVIDIA Vera CPU выходит: 88-ядерный чип собственной разработки для Agentic AI, $1 трлн заказов сигнализирует о смене аппаратной парадигмы

Основной вывод

NVIDIA раскрыла две важные информации на GTC 2026: официальный дебют Vera CPU и заказы на чипы Blackwell + Vera Rubin превысили $1 трлн. Vera — первый CPU, созданный специально для рабочих нагрузок Agentic AI, с 88 кастомными ядрами Olympus, пропускной способностью памяти 1,2 ТБ/с и когерентной пропускной способностью CPU-GPU 1,8 ТБ/с через NVLink. Объём заказов в $1 трлн подтверждает один факт: инвестиции в инфраструктуру ИИ перешли от «исследовательских испытаний» к «ставке на будущее».

Vera CPU: Процессор, рождённый для агентов

Почему агентам нужен выделенный CPU

Типичная конфигурация традиционных серверов ИИ — 1 CPU в паре с 4 GPU — это соотношение было разумным в эпоху обучения, потому что GPU выполняли большую часть вычислений, а CPU в основном управлял перемещением данных и планированием задач.

Но Agentic AI изменил это предположение. Характеристики рабочих нагрузок агентов включают:

  • Частые вызовы инструментов: Агентам может потребоваться вызов внешних инструментов на каждом шаге, оркестрируемых CPU
  • Логическое гейтирование: Решение, когда вызывать какой инструмент, как ветвиться, когда завершать — это CPU-интенсивные логические решения
  • Перемещение данных: Перемещение контекстных данных между GPU, памятью и внешними API
  • Мультиагентная оркестрация: Планирование и координация нескольких экземпляров агентов

Начиная с 2026 Q1, взрыв спроса на Agentic AI вызвал серьёзную нехватку конфигурации CPU в серверах, ответственных за командование и управление. Существующее соотношение CPU-GPU 1:4 не может поддерживать требования конкурентности рабочих нагрузок агентов.

Основные спецификации Vera CPU

ПараметрЗначениеЗначимость
Ядра88 кастомных ядер OlympusЗначительно превышает плотность ядер традиционных серверных CPU
Пропускная способность памяти1,2 ТБ/сПоддерживает крупномасштабное перемещение контекстных данных
Когерентная пропускная способность CPU-GPU1,8 ТБ/с (NVLink)Устраняет瓶颈 передачи данных CPU-GPU
Самостоятельная работаПоддерживает автономный инференсМожет выполнять инференс и оркестрацию без GPU
Парная работаРаботает с GPU RubinПолное решение для обучения + инференса + оркестрации агентов

Ключевое понимание: Vera может работать самостоятельно для инференса и оркестрации — что означает, что для задач агентов, не требующих ускорения GPU (оркестрация вызовов инструментов, логические решения, маршрутизация API), CPU Vera можно развёртывать независимо, значительно снижая затраты.

$1 трлн заказов: Сигнал за цифрой

Сравнение масштаба заказов

Дженсен Хуан раскрыл на GTC 2026, что заказы на покупку чипов Blackwell и Vera Rubin к 2027 году достигли $1 трлн. Для контекста:

  • Мировой рынок чипов ИИ в 2024 году: ~$50 млрд
  • $1 трлн等于 20x годового мирового рынка чипов ИИ
  • Это не «экспериментирование» — это детерминированная ставка предприятий на инфраструктуру ИИ

Изменение структуры заказов

ПериодОсновные покупателиЦель покупки
2023-2024Техгиганты (Meta, Google, Microsoft)Обучение собственных больших моделей
2025Облачные провайдеры (AWS, Azure, GCP)Предоставление облачных сервисов ИИ
2026Вся индустрия (финансы, здравоохранение, производство, розница)Инференс + развёртывание агентов

Сдвиг: Покупатели чипов ИИ расширились от «нескольких техгигантов» до «всей индустрии», а цель сместилась от «обучения» к «инференсу и развёртыванию агентов». Это标志 демократизации инвестиций в инфраструктуру ИИ.

Оценка ландшафта

Влияние на архитектуру серверов ИИ

NVIDIA и AMD переоценивают соотношения CPU-GPU в серверах ИИ. Аналитики полагают, что по мере роста спроса на Agentic AI будущие серверы ИИ могут принять более высокие соотношения конфигурации CPU (например, 2:4 или даже 4:4), и могут появиться чисто CPU-серверы агентов (использующие Vera для лёгкой оркестрации агентов).

Что это значит для разработчиков

  1. Снижение затрат на локальное развёртывание агентов: Vera может запускать инференс независимо, что означает возможность развёртывания лёгких агентов без GPU
  2. Специализация уровня оркестрации агентов: Появление выделенных CPU означает, что оркестрация агентов больше не будет «побочным действием», а станет независимой областью оптимизации оборудования
  3. Гибридное развёртывание становится нормой: Разделённая архитектура GPU для тяжёлого инференса + CPU для лёгкой оркестрации станет стандартом для развёртывания агентов

Рекомендации к действию

Планирование инфраструктуры

  • Оцените текущие соотношения CPU-GPU: Если ваши рабочие нагрузки агентов показывают瓶颈 CPU (высокая задержка вызовов инструментов, очереди планирования), рассмотрите увеличение конфигурации CPU
  • Следите за возможностями самостоятельного развёртывания Vera CPU: Для задач агентов, не требующих GPU (оркестрация API, правила принятия решений, лёгкий инференс), Vera может быть более экономичным выбором, чем GPU
  • Планируйте гибридные архитектуры: Разделённая архитектура GPU для инференса моделей и CPU для оркестрации агентов станет мейнстримом

Подготовка разработчиков

  • Оптимизируйте эффективность вызовов инструментов: Сократите不必要的 вызовы инструментов, чтобы снизить давление оркестрации CPU
  • Облегчите логику агентов: Отделите логические решения, которые могут выполняться на CPU, от инференса моделей, требующих GPU
  • Следите за открытым стеком Physical AI от NVIDIA: NVIDIA также открыла весь свой стек технологий Physical AI — разработчики в области робототехники и воплощённого ИИ должны клонировать репозиторий в первую очередь

Примечания о рисках

  • $1 трлн — это «заказы на покупку», а не «поставлено», поэтому фактические сроки отгрузки и развёртывания несут неопределённость
  • Конкретные цены и сроки поставки Vera CPU ещё не полностью раскрыты; разработчикам следует продолжать мониторинг
  • Если AMD или другие вендоры выпустят конкурентные CPU, выделенные для агентов, ландшафт рынка может быстро измениться