Gemini CLI v0.40.0 ローカル Gemma 対応:スマートルーティングで簡単タスクを無料に

Gemini CLI v0.40.0 ローカル Gemma 対応:スマートルーティングで簡単タスクを無料に

概要

Google の Gemini CLI v0.40.0 が 2026 年 5 月 1 日にリリースされ、実験的なローカル Gemma モデルサポート + スマートルーティングアーキテクチャを導入しました。

スマートルーティングアーキテクチャ

リクエスト → CLI が複雑度を判断
              ├── 簡単タスク(コード補完、ファイル検索、フォーマット)
              │     → ローカル Gemma(API コストゼロ、1秒未満で応答)

              └── 複雑タスク(コードリファクタリング、アーキテクチャ設計、多段推論)
                    → クラウド Gemini(API 課金、完全な推論能力)

Gemma 4 26B A4B:コンシューマーハードウェアの効率選択

  • 合計 26B パラメータ、リクエストごとに約 4B のみ活性化
  • 1台のノートPCでマルチインスタンス並行推論
  • 10 の同時プロンプトをスムーズに処理
  • 完全ローカル実行、API コストゼロ

コスト最適化

タスクタイプ1日あたり純クラウドスマートルーティング節約
コード補完50回$2.50$0$2.50
ファイル検索30回$1.50$0$1.50
バグ分析5回$1.00$1.00$0
アーキテクチャ設計2回$2.00$2.00$0
1日合計87回$7.00$3.00$4.00/日

月間節約:開発者1人あたり約 $88。

始め方

npm install -g @google/[email protected]
gemini-cli model download gemma-4-26b-a4b
gemini-cli

ロードマップ

  • 完全ローカル実行:将来のバージョンでは全タスクをローカルでサポート
  • より多くのモデル選択肢:Gemma 4 以外も対応予定
  • エンタープライズデプロイ:ローカルモデルの企業レベル管理とセキュリティポリシー