Проблема
Разработчики хотят экспериментировать с новейшими большими моделями — создавать прототипы, делать сайд-проекты, оценивать технологии — но сталкиваются с реальностью: API основных моделей стоят денег.
- OpenAI GPT-5 API: $15 за миллион входных токенов
- Anthropic Claude 4: $15 за миллион входных токенов
- Google Gemini 2.5 Pro: $7.5 за миллион входных токенов
Для индивидуальных разработчиков, студентов или технических специалистов, которые просто хотят «попробовать», этот барьер не trivial.
Решение
Проект с открытым исходным кодом собрал все бесплатно доступные LLM API в одном справочнике, охватывая следующие платформы:
| Платформа | Бесплатный уровень | Доступные модели | Ограничения |
|---|---|---|---|
| Groq | Без явного лимита | Llama 4, Mixtral | Ограничение по частоте |
| Cerebras | Бесплатный уровень | Llama 4, Qwen3 | Лимит объёма запросов |
| OpenRouter | Некоторые модели бесплатны | GPT-5-mini, Claude Haiku | Ограниченная квота |
| Google AI Studio | 15 RPM бесплатно | Gemini 3 Flash, Gemini 2.5 Pro | Ограничение по частоте |
| GitHub Models | Бесплатно | Phi-4, Qwen3, Llama 4 | Ограничение по частоте |
| DeepSeek | Бонус при регистрации | DeepSeek R1, V4 | Ограниченные токены |
| Together AI | $25 бесплатный кредит | Llama 4, Mixtral | Одноразовое использование |
Каталог доступных моделей
Топовые модели, доступные бесплатно
| Модель | Бесплатная платформа | Рекомендуемое использование |
|---|---|---|
| Gemini 3 Flash | Google AI Studio | Быстрые вопросы и ответы, генерация текста |
| GPT-5-mini | OpenRouter (ограниченно) | Общие разговоры, лёгкие задачи |
| Claude Haiku | OpenRouter (ограниченно) | Сценарии быстрого ответа |
| Llama 4 Scout | Groq / GitHub Models | Альтернатива с открытым кодом |
| Qwen3.6 35B | Cerebras / GitHub | Лучше всего для китайского языка |
| DeepSeek R1 | Платформа DeepSeek | Задачи рассуждений/математики |
| Phi-4-mini | GitHub Models | Сценарии edge/низкой задержки |
Начало работы
Вариант 1: Google AI Studio (самый простой)
# 1. Перейдите на https://aistudio.google.com
# 2. Войдите через аккаунт Google
# 3. Получите API-ключ (бесплатно)
# 4. Вызывайте напрямую
curl https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash:generateContent \
-H "Content-Type: application/json" \
-d '{
"contents": [{"parts": [{"text": "Привет, ответьте на русском"}]}],
"generationConfig": {"maxOutputTokens": 1000}
}'
Вариант 2: Groq (самый быстрый ответ)
# 1. Зарегистрируйтесь на https://console.groq.com
# 2. Получите API-ключ
# 3. Вызывайте (задержка обычно < 100мс)
curl https://api.groq.com/openai/v1/chat/completions \
-H "Authorization: Bearer $GROQ_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "llama-4-scout",
"messages": [{"role": "user", "content": "Объясни квантовые вычисления"}]
}'
Вариант 3: OpenRouter (один ключ, несколько моделей)
# 1. Зарегистрируйтесь на https://openrouter.ai
# 2. Получите API-ключ
# 3. Используйте единый интерфейс для вызова разных моделей
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_KEY" \
-d '{
"model": "openai/gpt-5-mini",
"messages": [{"role": "user", "content": "Привет"}]
}'
Сравнение стоимости
| План | Месячный бесплатный лимит | Стоимость сверх лимита | Лучше всего для |
|---|---|---|---|
| Google AI Studio | ~1.5 млн запросов | $7.5/миллион токенов | Личные проекты/обучение |
| Groq | Щедрый бесплатный уровень | Оплата по мере использования | Приложения с низкой задержкой |
| OpenRouter | Ограниченный бесплатный | Зависит от модели | Сравнение нескольких моделей |
| GitHub Models | Бесплатно | Н/Д | Проекты, интегрированные с GitHub |
Рекомендации к действию
| Сценарий | Рекомендуемое решение |
|---|---|
| Прототипирование сайд-проекта | Google AI Studio + Gemini 3 Flash |
| Нужна минимальная задержка | Groq + Llama 4 |
| Сравнить несколько моделей | OpenRouter (один интерфейс, переключение моделей) |
| Задачи на китайском языке | Qwen3.6 через Cerebras или GitHub Models |
| Рассуждения/математика | Бесплатные кредиты DeepSeek R1 |
Напоминание: Бесплатные уровни обычно имеют ограничения по частоте — не подходят для продакшна. Но для прототипирования, обучения или низкочастотных приложений этих решений более чем достаточно.