痛点
开发者想用最新的大模型做实验、做原型、做 Side Project,但面临一个现实问题:主流模型的 API 都要钱。
- OpenAI GPT-5 API:$15/百万输入 token
- Anthropic Claude 4:$15/百万输入 token
- Google Gemini 2.5 Pro:$7.5/百万输入 token
对于个人开发者、学生、或者只是想"试一下"的技术决策者,这个门槛不低。
解决方案
一个开源项目把所有免费可用的 LLM API 整理到了一起,覆盖以下平台:
| 平台 | 免费额度 | 可用模型 | 限制 |
|---|---|---|---|
| Groq | 无明确上限 | Llama 4、Mixtral | 速率限制 |
| Cerebras | 免费 tier | Llama 4、Qwen3 | 请求量限制 |
| OpenRouter | 部分模型免费 | GPT-5-mini、Claude Haiku | 有限额度 |
| Google AI Studio | 15 RPM 免费 | Gemini 3 Flash、Gemini 2.5 Pro | 速率限制 |
| GitHub Models | 免费 | Phi-4、Qwen3、Llama 4 | 速率限制 |
| DeepSeek | 新注册送额度 | DeepSeek R1、V4 | 有限 token |
| Together AI | $25 免费额度 | Llama 4、Mixtral | 用完即止 |
可用模型清单
免费可调用的一线模型
| 模型 | 免费平台 | 推荐用途 |
|---|---|---|
| Gemini 3 Flash | Google AI Studio | 快速问答、文本生成 |
| GPT-5-mini | OpenRouter(有限) | 通用对话、轻量任务 |
| Claude Haiku | OpenRouter(有限) | 快速响应场景 |
| Llama 4 Scout | Groq / GitHub Models | 开源替代方案 |
| Qwen3.6 35B | Cerebras / GitHub | 中文场景首选 |
| DeepSeek R1 | DeepSeek 平台 | 推理/数学任务 |
| Phi-4-mini | GitHub Models | 端侧/低延迟场景 |
上手步骤
方案一:Google AI Studio(最简单)
# 1. 访问 https://aistudio.google.com
# 2. 用 Google 账号登录
# 3. 获取 API Key(免费)
# 4. 直接调用
curl https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash:generateContent \
-H "Content-Type: application/json" \
-d '{
"contents": [{"parts": [{"text": "你好,用中文回答"}]}],
"generationConfig": {"maxOutputTokens": 1000}
}'
方案二:Groq(最快响应)
# 1. 注册 https://console.groq.com
# 2. 获取 API Key
# 3. 调用(延迟通常 < 100ms)
curl https://api.groq.com/openai/v1/chat/completions \
-H "Authorization: Bearer $GROQ_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "llama-4-scout",
"messages": [{"role": "user", "content": "解释量子计算"}]
}'
方案三:OpenRouter(一个 Key 调用多模型)
# 1. 注册 https://openrouter.ai
# 2. 获取 API Key
# 3. 用统一接口调用不同模型
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_KEY" \
-d '{
"model": "openai/gpt-5-mini",
"messages": [{"role": "user", "content": "Hello"}]
}'
成本对比
| 方案 | 月免费额度 | 超额成本 | 适合场景 |
|---|---|---|---|
| Google AI Studio | ~150万次请求 | $7.5/百万 token | 个人项目/学习 |
| Groq | 充足免费额度 | 按量付费 | 低延迟应用 |
| OpenRouter | 有限免费 | 各模型不同 | 多模型对比测试 |
| GitHub Models | 免费 | N/A | 集成 GitHub 的项目 |
行动建议
| 场景 | 推荐方案 |
|---|---|
| 做 Side Project 原型 | Google AI Studio + Gemini 3 Flash |
| 需要最低延迟 | Groq + Llama 4 |
| 对比多个模型效果 | OpenRouter(一个接口切换) |
| 中文场景 | Qwen3.6 via Cerebras 或 GitHub Models |
| 推理/数学 | DeepSeek R1 免费额度 |
提醒:免费 tier 通常有速率限制,不适合生产环境。但对于原型验证、学习、或者低频应用,这些方案已经足够。