Основной вывод
Рынок AI-чипов переживает структурный сдвиг: от монополии NVIDIA в эпоху обучения к многоконкурентному соревнованию в эпоху инференса. Архитектура NVIDIA Vera Rubin обещает 35-кратное улучшение пропускной способности инференса.
NVIDIA Rubin: Детали 35x скачка
| Метрика | Hopper (H200) | Blackwell (B200) | Vera Rubin (GB300) |
|---|---|---|---|
| Пропускная способность инференса | Базовая | ~5x | ~35x |
| Энергоэффективность | Базовая | ~3x | ~10x |
| Пропускная способность памяти | 3.35 ТБ/с | 8 ТБ/с | 12+ ТБ/с |
| Поставки | 2024 Q1 | 2025 Q2 | 2026 Q3 (опережая график) |
Capex гиперскейлеров: Куда течет $600B
| Год | Amazon | Microsoft | Meta | Итого | |
|---|---|---|---|---|---|
| 2024 | $52B | $75B | $48B | $38B | ~$213B |
| 2025 | $75B | $100B | $65B | $55B | ~$295B |
| 2026E | $90B+ | $130B+ | $80B+ | $65B+ | $365B+ |
| Ежегодно (следующие 4-5 лет) | $600B+ |
Рекомендации
Для технологических руководителей:
- Закупки оборудования для инференса во второй половине 2026 должны оценивать нескольких поставщиков
- Оцените AMD Halo Box для edge-сценариев инференса
Для инвесторов:
- AI-полупроводники — это больше не «просто купите NVIDIA»
- Edge-инференс, память HBM, передовая упаковка — направления с определенным ростом