C
ChaoBro

AMD Halo Box: 128GB общей памяти, Mini PC для локального AI-инференса за $2000

AMD Halo Box: 128GB общей памяти, Mini PC для локального AI-инференса за $2000

Основной вывод

AMD планирует выпустить Halo Box в июне 2026 — Mini PC с процессором Ryzen AI MAX+ 395, 128GB унифицированной общей памяти, полной поддержкой ROCm, по цене $2,000-3,000. Первый продукт, предлагающий локальный инференс 200B параметрических моделей по потребительской цене.

Характеристики оборудования

КомпонентСпецификацияЗначение
CPURyzen AI MAX+ 395 (16 ядер Zen 5)Мощные универсальные вычисления
GPU40 вычислительных блоков RDNA 3.5Ядро GPU-инференса
NPUXDNA 2 (16 TOPS)Низкоэнергетические резидентные AI-задачи
Память128GB унифицированная общаяCPU/GPU/NPU совместно, нулевое копирование
ROCmПолная поддержкаСовместимость с PyTorch, vLLM
Цена$2,000-3,000Потребительское ценообразование

Ключевая инновация: унифицированная общая память. CPU, GPU и NPU разделяют один пул памяти 128GB — нулевые накладные расходы на передачу данных.

Какие модели можно запустить?

С INT4 квантованием:

МодельРазмер после квантованияHalo Box запустит?
Llama 3.1 70B~35GB✅ Легко
Qwen3.6-35B~18GB✅ С запасом
DeepSeek V4 MoE~70GB✅ Да
200B плотная модель~100GB✅ Да

Рекомендации

Ваш сценарийРекомендация
Высокие затраты на APIКоманды, тратящие $500+/месяц на API, должны рассмотреть
Конфиденциальность данныхЗдравоохранение, финансы, юриспруденция — локальное развертывание обязательно
Эксперименты с моделями128GB памяти позволяет LoRA fine-tuning без облачного GPU
Существующая экосистема NVIDIAПри глубокой зависимости от CUDA-библиотек следите за зрелостью ROCm

Запуск: Июнь 2026.