C
ChaoBro

TideGS: обучение более 1 млрд 3D-гауссов на одной GPU с 24 ГБ видеопамяти, Spotlight на ICML 2026

TideGS: обучение более 1 млрд 3D-гауссов на одной GPU с 24 ГБ видеопамяти, Spotlight на ICML 2026

3D Gaussian Splatting (3DGS) — одно из самых популярных направлений в области 3D-реконструкции последних лет. Однако у него есть критическое ограничение: видеопамять.

Каждый гауссов примитив содержит большой вектор атрибутов, и когда их количество достигает десятков миллионов, таблица параметров превышает объём памяти GPU. Ранее на потребительских одночиповых GPU системы могли обрабатывать максимум несколько десятков миллионов гауссов.

Статья TideGS, принятая в формате Spotlight на ICML 2026, поднимает этот потолок до более 1 млрд — и всё это на одной GPU с 24 ГБ памяти.

Ключевое наблюдение: обучение 3DGS по своей природе разрежено

Идея авторов весьма изящна: обучение 3DGS по своей сути является разреженным и зависит от траектории камеры.

На каждой итерации активируются только те гауссы, которые видны из текущего пакета кадров камеры. Это означает, что видеопамять GPU не обязана служить постоянным хранилищем параметров, а может работать как кеш рабочего набора — загружая только ту часть гауссов, которая нужна в данный момент.

Три синергетических технологии

TideGS управляет параметрами с помощью трёхуровневой иерархии памяти SSD-CPU-GPU:

1. Блочно-виртуализированная геометрия (Block-Virtualized Geometry)

Пространственная локальность, оптимизированная под SSD. 3D-пространство разбивается на блоки, что гарантирует физическую смежность соседних гауссов в хранилище и снижает фрагментацию ввода-вывода.

2. Многоуровневый асинхронный конвейер

Перекрытие операций ввода-вывода и вычислений. Пока на GPU идёт обучение текущего пакета, с SSD заранее подгружаются данные о гауссах для следующего пакета, и процессы не блокируют друг друга.

3. Адаптивный дифференциальный поток по траектории

Передаются только инкрементальные изменения рабочего набора между итерациями. Вместо полной загрузки каждый раз система вычисляет, состояние каких гауссов изменилось, и передаёт только эти изменения.

Масштаб производительности

Сравнительные цифры говорят сами за себя:

  • Обучение в оперативной памяти: около 11 млн гауссов
  • Предыдущие out-of-core базовые решения: около 100 млн гауссов
  • TideGS: более 1 млрд гауссов

На крупномасштабных сценах TideGS также превосходит оцениваемые одночиповые GPU-базовые решения по качеству реконструкции.

Почему это важно

3D-реконструкция переходит из лабораторий в реальные приложения: автономное вождение, цифровые двойники и AR/VR требуют обработки крупномасштабных сцен городского уровня. TideGS позволяет обучать модели с миллиардами гауссов на одной GPU, значительно снижая аппаратные требования для масштабной 3D-реконструкции.

Ссылка на статью: arXiv:2605.20150