課題
開発者は最新の大規模モデルで実験したい——プロトタイプを作ったり、サイドプロジェクトを作ったり、技術を評価したり——しかし現実に直面します:主要モデルのAPIはすべて有料なのです。
- OpenAI GPT-5 API:100万入力トークンあたり $15
- Anthropic Claude 4:100万入力トークンあたり $15
- Google Gemini 2.5 Pro:100万入力トークンあたり $7.5
個人開発者、学生、または「試してみたい」だけの技術意思決定者にとって、このハードルは決して小さくありません。
解決策
あるオープンソースプロジェクトが無料で利用可能なLLM APIをすべて1つのリファレンスに集約し、以下のプラットフォームをカバーしています:
| プラットフォーム | 無料枠 | 利用可能モデル | 制限 |
|---|---|---|---|
| Groq | 明示的な上限なし | Llama 4、Mixtral | レート制限 |
| Cerebras | 無料ティア | Llama 4、Qwen3 | リクエスト量制限 |
| OpenRouter | 一部モデル無料 | GPT-5-mini、Claude Haiku | 制限付きクォータ |
| Google AI Studio | 15 RPM 無料 | Gemini 3 Flash、Gemini 2.5 Pro | レート制限 |
| GitHub Models | 無料 | Phi-4、Qwen3、Llama 4 | レート制限 |
| DeepSeek | 新規登録ボーナス | DeepSeek R1、V4 | 制限付きトークン |
| Together AI | $25 無料クレジット | Llama 4、Mixtral | 使い切り |
利用可能モデルカタログ
無料で呼び出せる一線級モデル
| モデル | 無料プラットフォーム | 推奨用途 |
|---|---|---|
| Gemini 3 Flash | Google AI Studio | クイックQ&A、テキスト生成 |
| GPT-5-mini | OpenRouter(制限付き) | 汎用会話、軽量タスク |
| Claude Haiku | OpenRouter(制限付き) | 高速応答シーン |
| Llama 4 Scout | Groq / GitHub Models | オープンソース代替案 |
| Qwen3.6 35B | Cerebras / GitHub | 中国語タスクに最適 |
| DeepSeek R1 | DeepSeek プラットフォーム | 推論/数学タスク |
| Phi-4-mini | GitHub Models | エッジ/低レイテンシーシーン |
はじめ方
オプション1:Google AI Studio(最も簡単)
# 1. https://aistudio.google.com にアクセス
# 2. Google アカウントでログイン
# 3. API キーを取得(無料)
# 4. 直接呼び出し
curl https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash:generateContent \
-H "Content-Type: application/json" \
-d '{
"contents": [{"parts": [{"text": "こんにちは、日本語で答えてください"}]}],
"generationConfig": {"maxOutputTokens": 1000}
}'
オプション2:Groq(最速応答)
# 1. https://console.groq.com で登録
# 2. API キーを取得
# 3. 呼び出し(レイテンシー通常 < 100ms)
curl https://api.groq.com/openai/v1/chat/completions \
-H "Authorization: Bearer $GROQ_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "llama-4-scout",
"messages": [{"role": "user", "content": "量子コンピューティングを説明して"}]
}'
オプション3:OpenRouter(1つのキーで複数モデル)
# 1. https://openrouter.ai で登録
# 2. API キーを取得
# 3. 統一インターフェースで異なるモデルを呼び出し
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_KEY" \
-d '{
"model": "openai/gpt-5-mini",
"messages": [{"role": "user", "content": "こんにちは"}]
}'
コスト比較
| プラン | 月間無料枠 | 超過コスト | 最適な用途 |
|---|---|---|---|
| Google AI Studio | 約150万リクエスト | $7.5/百万トークン | 個人プロジェクト/学習 |
| Groq | 豊富な無料枠 | 従量課金 | 低レイテンシーアプリケーション |
| OpenRouter | 制限付き無料 | モデルにより異なる | 複数モデル比較 |
| GitHub Models | 無料 | なし | GitHub 統合プロジェクト |
アクション推奨
| シナリオ | 推奨ソリューション |
|---|---|
| サイドプロジェクトのプロトタイピング | Google AI Studio + Gemini 3 Flash |
| 最低レイテンシーが必要な場合 | Groq + Llama 4 |
| 複数モデルを比較したい場合 | OpenRouter(1つのインターフェースで切り替え) |
| 中国語タスク | Cerebras または GitHub Models 経由の Qwen3.6 |
| 推論/数学 | DeepSeek R1 無料クレジット |
注意:無料ティアには通常レート制限があり、本番環境には適していません。しかし、プロトタイプ検証、学習、または低頻度アプリケーションには、これらのソリューションで十分です。