C
ChaoBro

penMonoAgent:.NET 10 + llama.cpp で構築されたトークン費用ゼロのローカルコーディングエージェント

penMonoAgent:.NET 10 + llama.cpp で構築されたトークン費用ゼロのローカルコーディングエージェント

結論ファースト

誰もが「AI が 5 分で SaaS を構築する」と語る中で、逆説的なトレンドが形成されている:コード主権が新たな開発者の必須要件になりつつある。

penMonoAgent は .NET 10 と llama.cpp で構築されたローカルコーディングエージェントだ。推論は完全にローカルで実行され、トークン費用はゼロ、コードはあなたのマシンから流出しない。20 の組み込みツールと 5 つの専門サブエージェントを備え、Docker ワンクリックデプロイをサポートする。

課題:クラウドコーディングエージェントの隠れた問題

問題 影響 ローカルソリューション
コード漏洩リスク 企業の基幹コードが第三者サーバーにアップロードされる コードは完全にマシン内にとどまる
トークン費用の累積 高頻度使用で月数百ドルに達する可能性 トークン費用ゼロ、デプロイコストは一度きり
ネットワーク遅延 毎回の対話にネットワーク往復が必要 ローカル推論、ミリ秒単位の応答
ベンダーロックイン 特定のプラットフォーム API とエコシステムに依存 オープンアーキテクチャ、モデル交換可能

penMonoAgent アーキテクチャ分解

技術スタック

┌──────────────────────────────────────────┐
│              penMonoAgent                │
├──────────────────────────────────────────┤
│  ランタイム: .NET 10 / C#                │
│  推論エンジン: llama.cpp (GGUF フォーマット) │
│  ローカルモデル: Qwen2.5-Coder / DeepSeek  │
├──────────────────────────────────────────┤
│  組み込みツール (20個):                   │
│  • ファイル入出力 • Git 操作 • ターミナル実行 │
│  • 検索置換 • コード分析 • テスト実行      │
├──────────────────────────────────────────┤
│  サブエージェント (5個):                  │
│  • アーキテクチャ • コードレビュー • テスト生成 │
│  • ドキュメント作成 • デプロイオーケストレーション│
└──────────────────────────────────────────┘

コア機能

機能 説明
データ流出ゼロ 推論はすべてローカルで実行、企業のコンプライアンスに理想的
モデル交換可能 GGUF フォーマットのモデルに対応、ベンダーに縛られない
サブエージェントの分業 5 つの専門エージェントが各自の領域を担当、単一エージェントのボトルネックを回避
Docker デプロイ コンテナ化されたデリバリーで開発環境の一貫性を保証

パフォーマンス参考

シナリオ ローカル (penMonoAgent) クラウド (Claude Code)
単一ファイル修正 ~2-5 秒 ~3-8 秒 + ネットワーク遅延
複数ファイルリファクタリング ~15-30 秒 ~20-45 秒 + ネットワーク遅延
コスト (月) ハードウェア減価償却 ~$50-100 $200-500+
プライバシー コードはマシンから出ない コードはクラウドにアップロード

はじめに

クイックデプロイ

# Docker 方式
docker run -d \
  --name penmonoagent \
  -v ./workspace:/workspace \
  -v ./models:/models \
  -p 8080:8080 \
  penmono/agent:latest

# ローカルモデルを指定
penmonoagent --model /models/qwen2.5-coder-7b.gguf \
             --workspace /workspace/my-project

おすすめモデル組み合わせ

モデル パラメータ数 必要 VRAM 適したシーン
Qwen2.5-Coder-7B 7B 8GB VRAM 日常のコーディング補助
Qwen2.5-Coder-32B 32B 24GB VRAM 複雑なリファクタリング + コードレビュー
DeepSeek-Coder-V2 16B 16GB VRAM 多言語プロジェクト開発

比較選択

ソリューション プライバシー コスト 能力 デプロイ難易度
penMonoAgent ★★★★★ ★★★★★ ★★★☆☆ ★★★☆☆
Claude Code ★★☆☆☆ ★★☆☆☆ ★★★★★ ★★★★★
Cursor ★★★☆☆ ★★★☆☆ ★★★★☆ ★★★★★
OpenClaw ★★★★☆ ★★★★☆ ★★★★☆ ★★☆☆☆

選択アドバイス

  • コードに商業機密やコンプライアンス要件が含まれる場合 → penMonoAgent
  • 最高のコーディング能力を追求し、クラウドを気にしない場合 → Claude Code
  • プライバシーと能力のバランスが必要な場合 → OpenClaw または penMonoAgent + 大規模モデル

業界における意義

penMonoAgent が代表するのは「反クラウド」の AI トレンドだ——モデルが十分に小さく、ハードウェアが十分に安くなれば、ローカルデプロイは妥協ではなく、積極的な選択になる。

中国の開発者にとって、このルートは特に重要だ:

  • API アクセスの不安定性を回避
  • 長期的な使用コストを削減
  • データセキュリティのコンプライアンス要件を満たす