NVIDIA Vera CPU выходит: 88-ядерный чип собственной разработки для Agentic AI, $1 трлн заказов сигнализирует о смене аппаратной парадигмы

Основной вывод

NVIDIA раскрыла две важные информации на GTC 2026: официальный дебют Vera CPU и заказы на чипы Blackwell + Vera Rubin превысили $1 трлн. Vera — первый CPU, созданный специально для рабочих нагрузок Agentic AI, с 88 кастомными ядрами Olympus, пропускной способностью памяти 1,2 ТБ/с и когерентной пропускной способностью CPU-GPU 1,8 ТБ/с через NVLink. Объём заказов в $1 трлн подтверждает один факт: инвестиции в инфраструктуру ИИ перешли от «исследовательских испытаний» к «ставке на будущее».

Vera CPU: Процессор, рождённый для агентов

Почему агентам нужен выделенный CPU

Типичная конфигурация традиционных серверов ИИ — 1 CPU в паре с 4 GPU — это соотношение было разумным в эпоху обучения, потому что GPU выполняли большую часть вычислений, а CPU в основном управлял перемещением данных и планированием задач.

Но Agentic AI изменил это предположение. Характеристики рабочих нагрузок агентов включают:

Частые вызовы инструментов: Агентам может потребоваться вызов внешних инструментов на каждом шаге, оркестрируемых CPU
Логическое гейтирование: Решение, когда вызывать какой инструмент, как ветвиться, когда завершать — это CPU-интенсивные логические решения
Перемещение данных: Перемещение контекстных данных между GPU, памятью и внешними API
Мультиагентная оркестрация: Планирование и координация нескольких экземпляров агентов

Начиная с 2026 Q1, взрыв спроса на Agentic AI вызвал серьёзную нехватку конфигурации CPU в серверах, ответственных за командование и управление. Существующее соотношение CPU-GPU 1:4 не может поддерживать требования конкурентности рабочих нагрузок агентов.

Основные спецификации Vera CPU

Параметр	Значение	Значимость
Ядра	88 кастомных ядер Olympus	Значительно превышает плотность ядер традиционных серверных CPU
Пропускная способность памяти	1,2 ТБ/с	Поддерживает крупномасштабное перемещение контекстных данных
Когерентная пропускная способность CPU-GPU	1,8 ТБ/с (NVLink)	Устраняетбутылочное горлышко передачи данных CPU-GPU
Самостоятельная работа	Поддерживает автономный инференс	Может выполнять инференс и оркестрацию без GPU
Парная работа	Работает с GPU Rubin	Полное решение для обучения + инференса + оркестрации агентов

Ключевое понимание: Vera может работать самостоятельно для инференса и оркестрации — что означает, что для задач агентов, не требующих ускорения GPU (оркестрация вызовов инструментов, логические решения, маршрутизация API), CPU Vera можно развёртывать независимо, значительно снижая затраты.

$1 трлн заказов: Сигнал за цифрой

Сравнение масштаба заказов

Дженсен Хуан раскрыл на GTC 2026, что заказы на покупку чипов Blackwell и Vera Rubin к 2027 году достигли $1 трлн. Для контекста:

Мировой рынок чипов ИИ в 2024 году: ~$50 млрд
$1 трлнравно 20x годового мирового рынка чипов ИИ
Это не «экспериментирование» — это детерминированная ставка предприятий на инфраструктуру ИИ

Изменение структуры заказов

Период	Основные покупатели	Цель покупки
2023-2024	Техгиганты (Meta, Google, Microsoft)	Обучение собственных больших моделей
2025	Облачные провайдеры (AWS, Azure, GCP)	Предоставление облачных сервисов ИИ
2026	Вся индустрия (финансы, здравоохранение, производство, розница)	Инференс + развёртывание агентов

Сдвиг: Покупатели чипов ИИ расширились от «нескольких техгигантов» до «всей индустрии», а цель сместилась от «обучения» к «инференсу и развёртыванию агентов». Это标志 демократизации инвестиций в инфраструктуру ИИ.

Оценка ландшафта

Влияние на архитектуру серверов ИИ

NVIDIA и AMD переоценивают соотношения CPU-GPU в серверах ИИ. Аналитики полагают, что по мере роста спроса на Agentic AI будущие серверы ИИ могут принять более высокие соотношения конфигурации CPU (например, 2:4 или даже 4:4), и могут появиться чисто CPU-серверы агентов (использующие Vera для лёгкой оркестрации агентов).

Что это значит для разработчиков

Снижение затрат на локальное развёртывание агентов: Vera может запускать инференс независимо, что означает возможность развёртывания лёгких агентов без GPU
Специализация уровня оркестрации агентов: Появление выделенных CPU означает, что оркестрация агентов больше не будет «побочным действием», а станет независимой областью оптимизации оборудования
Гибридное развёртывание становится нормой: Разделённая архитектура GPU для тяжёлого инференса + CPU для лёгкой оркестрации станет стандартом для развёртывания агентов

Примечания о рисках

$1 трлн — это «заказы на покупку», а не «поставлено», поэтому фактические сроки отгрузки и развёртывания несут неопределённость
Конкретные цены и сроки поставки Vera CPU ещё не полностью раскрыты; разработчикам следует продолжать мониторинг
Если AMD или другие вендоры выпустят конкурентные CPU, выделенные для агентов, ландшафт рынка может быстро измениться

NVIDIA Vera CPU выходит: 88-ядерный чип собственной разработки для Agentic AI, $1 трлн заказов сигнализирует о смене аппаратной парадигмы

Основной вывод

Vera CPU: Процессор, рождённый для агентов

Почему агентам нужен выделенный CPU

Основные спецификации Vera CPU

$1 трлн заказов: Сигнал за цифрой

Сравнение масштаба заказов

Изменение структуры заказов

Оценка ландшафта

Влияние на архитектуру серверов ИИ

Что это значит для разработчиков

Рекомендации к действию

Планирование инфраструктуры

Подготовка разработчиков

Примечания о рисках

Основной вывод

Vera CPU: Процессор, рождённый для агентов

Почему агентам нужен выделенный CPU

Основные спецификации Vera CPU

$1 трлн заказов: Сигнал за цифрой

Сравнение масштаба заказов

Изменение структуры заказов

Оценка ландшафта

Влияние на архитектуру серверов ИИ

Что это значит для разработчиков

Рекомендации к действию

Планирование инфраструктуры

Подготовка разработчиков

Примечания о рисках

Похожие материалы

Ставка Лекуна на $1 млрд: AMI Labs строит анти-LLM

DeepSeek после 50 миллиардов юаней: июньское обновление V4, накопление вычислительных мощностей и право на ценообразование

Обзор финансирования китайских ИИ-лабораторий: $9 млрд собрано, у DeepSeek ещё $7,35 млрд в пути