Что Произошло
В начале мая 2026 года твит о рынке аренды GPU Neocloud вызвал обсуждение в сообществе AI-инфраструктуры:
«Ни одна Neocloud не могла представить, что сегодня они будут сдавать в аренду H100 по ценам выше, чем 3 года назад.»
Этот твит, получивший 432 лайка и более 50 тысяч просмотров, выявил контринтуитивный рыночный феномен: на фоне продолжающегося расширения мощностей GPU и усиления конкуренции чипов AI, цены на аренду H100 растут, а не падают.
Почему Аренда GPU Становится Дороже
Логику этого можно разбить на три уровня:
1. Сторона Спроса: Передовые Фирмы Раньше Блокируют Заказы
Даже если у вас есть финансирование, передовые лаборатории и Neolabs уже заблокировали большую часть поставок GPU на 2026 год. Гиперскейлеры (Microsoft, Google, Meta, Amazon), как ожидается, потратят $725 млрд на капитальные расходы AI в 2026 году, что на 77% больше в годовом исчислении. Эти массивные заказы получают приоритет в распределении мощностей NVIDIA.
2. Сторона Предложения: Бутылочное Горлышко Мощностей HBM
GPU — это не автономные чипы — им требуется HBM (Память с Высокой Пропускной Способностью). Генеральный директор Micron ранее подтвердил, что поставки HBM на 2026 год полностью распроданы, удовлетворяя лишь 50-65% спроса клиентов. Бутылочное горлышко мощностей HBM напрямую ограничивает общий объём выпуска GPU.
| Бутылочное Горлышко | Текущий Статус | Влияние |
|---|---|---|
| Кремниевые пластины GPU | Мощности NVIDIA постоянно расширяются | Не основное бутылочное горлышко |
| Память HBM | Мощности трёх производителей заблокированы | Основное бутылочное горлышко |
| Упаковка CoWoS | Мощности TSMC напряжены | Вторичное бутылочное горлышко |
| Электропитание и охлаждение | Ограничения на размещение дата-центров | Долгосрочное ограничение |
3. Структура Рынка: Потеря Ценовой Силы Neocloud
Бизнес-модель Neocloud (новых провайдеров облачных вычислений) изначально была «оптовая закупка GPU, розничная продажа по ценам ниже AWS/Azure». Но на рынке с напряжённым предложением:
- Neocloud не могут получить достаточно GPU для создания эффекта масштаба
- Даже когда они получают GPU, растущие затраты на HBM повышают общую стоимость владения
- Спрос значительно превышает предложение, у Neocloud нет мотивации снижать цены
Куда Направляется Каждый $1M Расходов на AI
Понимание того, почему аренда GPU растёт, требует рассмотрения общей структуры расходов на AI-инфраструктуру:
| Категория Расходов | Сумма (на $1M) | Доля | Ключевые Поставщики |
|---|---|---|---|
| GPU и акселераторы | $520K | 52% | NVIDIA, AMD, Broadcom |
| Сети и оптика | $150K | 15% | Arista, Coherent |
| Инфраструктура дата-центров | $200K | 20% | Электропитание, охлаждение, стойки |
| Память и прочее | $130K | 13% | Micron, SK Hynix, Samsung |
Более половины инвестиций в AI направляются на GPU и акселераторы — кто контролирует цепочку поставок GPU, тот контролирует ценовую власть AI-инфраструктуры.
Оценка Ландшафта
Рост аренды GPU выявляет более глубокую тенденцию: AI-вычисления возвращаются от «товарности» к «редкости».
В 2023-2024 годах рынок в целом ожидал, что с расширением мощностей GPU и усилением конкуренции стоимость вычислений быстро снизится. Но реальность такова:
- Рост спроса значительно опережает рост мощностей
- Бутылочное горлышко цепочки поставок сместилось с GPU на HBM
- Раннее блокирование заказов игроками передового фронта сжимает доступ средних и мелких игроков
Это означает, что нарратив «демократизации вычислений» сталкивается с вызовами в 2026 году — наличие доступа к GPU становится конкурентным преимуществом, а не инфраструктурой.
Рекомендации к Действию
- AI-предприниматели: Не предполагайте, что аренда GPU будет естественно снижаться. Рассчитывайте затраты на вывод в вашей бизнес-модели по текущим или более высоким ценам, резервируя буфер риска поставок.
- Стратегия выбора модели: Когда затраты на GPU высоки, выбор моделей с более высокой эффективностью вывода (таких как архитектура MoE, квантованные версии) имеет больший экономический смысл, чем погоня за наибольшим масштабом параметров.
- Следите за альтернативами: Доступность и рентабельность альтернативных чипов AMD MI300, Google TPU, AWS Trainium улучшается. Стратегия с несколькими чипами может снизить зависимость от одного поставщика.
- Долгосрочная перспектива: Цикл расширения мощностей HBM составляет 18-24 месяца. Напряжённость поставок 2026 года может начать смягчаться во второй половине 2027 года, но только если все планы расширения основных производителей будут реализованы по графику.