コンシューマーGPUでSimpleQA 95%：ローカルAI深度研究が現実になる

去年のこの時期、「ローカルで深度研究を走る」と言えば空想のように聞こえた。クラウド大モデル、有料API、応答遅延とプライバシー漏洩の懸念を受け入れる必要があった。

今、RTX 3090 1枚、27Bパラメータのオープンソースモデル1つで、SimpleQAで約95%に到達する。

local-deep-researchプロジェクトはGitHubで静かに7,098 starまで成長、今週2,483増加。6,415コミット、440ブランチ、155タグ——これはトイプロジェクトではなく、真剣にメンテナンスされているツールだ。

何ができるか

一言：質問を与えれば、研究員のように働く。

クラウドベースの深度研究製品との核心的な違いは1つ：データがあなたのマシンを出ないこと。

27Bパラメータのモデル、4-bit量子化で約15GB VRAM。RTX 3090は24GB——ちょうど収まるが、余裕はある。これは何を意味するか？

2年前、このレベルの推論にはA100が必要だった。1年前、4090が必要だった。今、中古の3090でいい。

これは線形的な進歩ではない。コストカーブ上の跳水だ。

SimpleQAはOpenAIのQAベンチマークで、「モデルが簡潔で正確な事実回答を出せるか」をテストする。95%は高いが、いくつか注意点がある：

それでも、SimpleQA 95%は意味する：大部分の事実確認タスクにおいて、ローカルモデルは既に十分だ。

local-deep-researchは唯一のローカル研究ツールではないが、現時点で最も成熟している可能性がある。6,415コミット、186オープンPR、79オープンissue——これらの数字はコミュニティが真剣に貢献していることを示している。

コンシューマーGPU 1枚でクラウドモデルに迫る深度研究能力が実現するとき、「クラウドを使わなければならない」理由はまた1つ消える。

主な情報源：