C
ChaoBro

TideGS:単一GPUの24GB VRAMで10億超の3D Gaussianを訓練可能に、ICML 2026 Spotlight採択

TideGS:単一GPUの24GB VRAMで10億超の3D Gaussianを訓練可能に、ICML 2026 Spotlight採択

3D Gaussian Splatting(3DGS)は、近年の3D再構築分野で最も注目されている技術アプローチの一つです。しかし、これには致命的なボトルネックが存在します。それはVRAMです。

各ガウスプリミティブは大きな属性ベクトルを保持しており、プリミティブ数が千万単位に増加すると、パラメータテーブルがGPUの容量を超えてしまいます。これまで、コンシューマー向けの単一GPUハードウェアでは、システムが処理できる3Dガウスの数は数千万個が限界でした。

ICML 2026でSpotlightとして採択された本論文「TideGS」は、この限界を10億超まで引き上げました。しかも、必要なのは24GBのGPUを1枚だけです。

核心的な洞察:3DGS訓練は本質的にスパースである

研究チームの着眼点は非常に鋭いです。3DGSの訓練は本質的にスパースであり、軌道条件付きであるという点です。

各イテレーションでは、現在のカメラバッチから可視であるガウスプリミティブのみがアクティブになります。これは、GPUのVRAMを永続的なパラメータストレージとして使用する必要がなく、ワーキングセットキャッシュとして機能させられることを意味します。つまり、現在必要な部分のガウスプリミティブのみをロードすればよいのです。

3つの協調技術

TideGSは、SSD-CPU-GPUの3層ストレージ階層を用いてパラメータを管理します:

1. ブロック仮想化ジオメトリ(Block-Virtualized Geometry)

SSDに合わせた空間的局所性の確保。3D空間をブロック単位で整理し、物理的に隣接するガウスプリミティブがストレージ上でも隣接するように配置することで、I/Oの断片化を低減します。

2. 階層型非同期パイプライン

I/Oと計算のオーバーラップ(並行処理)。GPU上で現在のバッチを訓練しながら、SSDから次のバッチに必要なガウスプリミティブデータをプリフェッチし、両者が互いにブロックしないようにします。

3. 軌道適応型差分ストリーム

イテレーション間のワーキングセットの増分のみを転送します。毎回フルロードするのではなく、どのガウスプリミティブの状態が変化したかを計算し、変化した部分のみを転送します。

パフォーマンスと規模

比較数値は一目瞭然です:

  • 標準的なインメモリ訓練:約1100万3Dガウス
  • 従来のアウトオブコアベースライン:約1億3Dガウス
  • TideGS:10億超3Dガウス

大規模シーンにおいて、TideGSは再構築品質の面でも評価対象となった単一GPUベースラインを上回っています。

注目すべき理由

3D再構築は研究室から実用段階へと移行しつつあります。自動運転、デジタルツイン、AR/VRはいずれも都市規模の大規模シーンの処理を必要とします。TideGSにより、単一GPUで10億級の3Dガウス訓練が可能になり、大規模3D再構築のハードウェアハードルが大幅に引き下げられました。

論文URL:arXiv:2605.20150