C
ChaoBro

AMD Halo Box: 128GB общей памяти, Mini PC для локального AI-инференса за $2000

AMD Halo Box: 128GB общей памяти, Mini PC для локального AI-инференса за $2000

Основной вывод

AMD планирует выпустить Halo Box в июне 2026 — Mini PC с процессором Ryzen AI MAX+ 395, 128GB унифицированной общей памяти, полной поддержкой ROCm, по цене $2,000-3,000. Первый продукт, предлагающий локальный инференс 200B параметрических моделей по потребительской цене.

Характеристики оборудования

Компонент Спецификация Значение
CPU Ryzen AI MAX+ 395 (16 ядер Zen 5) Мощные универсальные вычисления
GPU 40 вычислительных блоков RDNA 3.5 Ядро GPU-инференса
NPU XDNA 2 (16 TOPS) Низкоэнергетические резидентные AI-задачи
Память 128GB унифицированная общая CPU/GPU/NPU совместно, нулевое копирование
ROCm Полная поддержка Совместимость с PyTorch, vLLM
Цена $2,000-3,000 Потребительское ценообразование

Ключевая инновация: унифицированная общая память. CPU, GPU и NPU разделяют один пул памяти 128GB — нулевые накладные расходы на передачу данных.

Какие модели можно запустить?

С INT4 квантованием:

Модель Размер после квантования Halo Box запустит?
Llama 3.1 70B ~35GB ✅ Легко
Qwen3.6-35B ~18GB ✅ С запасом
DeepSeek V4 MoE ~70GB ✅ Да
200B плотная модель ~100GB ✅ Да

Рекомендации

Ваш сценарий Рекомендация
Высокие затраты на API Команды, тратящие $500+/месяц на API, должны рассмотреть
Конфиденциальность данных Здравоохранение, финансы, юриспруденция — локальное развертывание обязательно
Эксперименты с моделями 128GB памяти позволяет LoRA fine-tuning без облачного GPU
Существующая экосистема NVIDIA При глубокой зависимости от CUDA-библиотек следите за зрелостью ROCm

Запуск: Июнь 2026.