概要
Google の Gemini CLI v0.40.0 が 2026 年 5 月 1 日にリリースされ、実験的なローカル Gemma モデルサポート + スマートルーティングアーキテクチャを導入しました。
スマートルーティングアーキテクチャ
リクエスト → CLI が複雑度を判断
├── 簡単タスク(コード補完、ファイル検索、フォーマット)
│ → ローカル Gemma(API コストゼロ、1秒未満で応答)
│
└── 複雑タスク(コードリファクタリング、アーキテクチャ設計、多段推論)
→ クラウド Gemini(API 課金、完全な推論能力)
Gemma 4 26B A4B:コンシューマーハードウェアの効率選択
- 合計 26B パラメータ、リクエストごとに約 4B のみ活性化
- 1台のノートPCでマルチインスタンス並行推論
- 10 の同時プロンプトをスムーズに処理
- 完全ローカル実行、API コストゼロ
コスト最適化
| タスクタイプ | 1日あたり | 純クラウド | スマートルーティング | 節約 |
|---|---|---|---|---|
| コード補完 | 50回 | $2.50 | $0 | $2.50 |
| ファイル検索 | 30回 | $1.50 | $0 | $1.50 |
| バグ分析 | 5回 | $1.00 | $1.00 | $0 |
| アーキテクチャ設計 | 2回 | $2.00 | $2.00 | $0 |
| 1日合計 | 87回 | $7.00 | $3.00 | $4.00/日 |
月間節約:開発者1人あたり約 $88。
始め方
npm install -g @google/[email protected]
gemini-cli model download gemma-4-26b-a4b
gemini-cli
ロードマップ
- 完全ローカル実行:将来のバージョンでは全タスクをローカルでサポート
- より多くのモデル選択肢:Gemma 4 以外も対応予定
- エンタープライズデプロイ:ローカルモデルの企業レベル管理とセキュリティポリシー