Основной вывод
Команда Steel 4 мая обновила свой Agent Cookbook, реализовав одну и ту же задачу с одинаковым набором инструментов в восьми основных агентских фреймворках. Этот подход сравнения с «контролируемыми переменными» является наиболее честной горизонтальной оценкой фреймворков из доступных на данный момент, предоставляя разработчикам прямую ссылку для выбора фреймворка.
Что произошло
Cookbook от Steel охватывает восемь фреймворков:
| Фреймворк | Язык | Основная позиция | Характеристики |
|---|---|---|---|
| LangChain | Python/JS | Фреймворк общего назначения для ИИ-приложений | Largest экосистема, наиболее полная документация, умеренная кривая обучения |
| Mastra | TypeScript | Полностековый ИИ-фреймворк | Встроенные воркфлоу, RAG, оркестрация агентов, нативный TypeScript |
| Pydantic AI | Python | Типобезопасные ИИ-приложения | Использует Pydantic для структурированного вывода и валидации |
| Vercel AI SDK | TypeScript | Интеграция ИИ во фронтенд | Потоковые ответы, UI-компоненты, глубокая интеграция с Next.js |
| Anthropic Agent SDK | Python/JS | Нативный агент для Claude | Глубоко оптимизирован для вызовов инструментов Claude и длинного контекста |
| OpenAI Agent SDK | Python | Нативный агент для OpenAI | Глубоко оптимизирован для вызовов инструментов GPT и function calling |
| LlamaIndex | Python | Фреймворк для RAG | Сильнейшие возможности индексации и извлечения данных |
| CrewAI | Python | Оркестрация мультиагентов | Разделение ролей, делегирование задач, совместные воркфлоу |
Ценность этого Cookbook заключается в устранении переменных — одна и та же задача, одни и те же определения инструментов, одни и те же вызовы моделей. Единственное различие — API фреймворка и архитектурный паттерн. Это позволяет напрямую сравнивать количество строк кода, сложность реализации и читаемость.
Руководство по выбору фреймворка
Сценарий 1: Быстрое прототипирование
Если вам нужен рабочий прототип агента за один день:
| Приоритет | Фреймворк | Причина |
|---|---|---|
| 1 | Vercel AI SDK | Бесшовная интеграция с Next.js, UI + агент в одном |
| 2 | LangChain | Богатая документация, много примеров, легко искать ответы в сообществе |
| 3 | Mastra | Полностековый TypeScript, встроенный движок воркфлоу |
Сценарий 2: Продакшн-система агентов
Если вам нужно развернуть в продакшн для долгосрочного обслуживания:
| Приоритет | Фреймворк | Причина |
|---|---|---|
| 1 | Anthropic Agent SDK | Если используете Claude, это оптимальный выбор (наименьшая задержка вызовов инструментов) |
| 2 | OpenAI Agent SDK | Если используете GPT, это оптимальный выбор (наиболее стабильный function calling) |
| 3 | Pydantic AI | Типобезопасный, подходит для сценариев со строгими требованиями к формату вывода |
Сценарий 3: Мультиагентное сотрудничество
Если ваш сценарий требует совместной работы нескольких агентов:
| Приоритет | Фреймворк | Причина |
|---|---|---|
| 1 | CrewAI | Специально разработан для мультиагентного сотрудничества, наиболее полные абстракции ролей/задач/процессов |
| 2 | Mastra | Встроенная оркестрация воркфлоу, поддержка параллельного и последовательного выполнения |
| 3 | LangGraph (LangChain) | Подход с графом состояний для оркестрации мультиагентов, гибкий, но высокая кривая обучения |
Сравнение сложности кода
На основе реализаций в Steel Cookbook, оценочное количество строк кода для одной и той же задачи в восьми фреймворках:
| Фреймворк | Строк кода | Сложность настройки | Сложность освоения |
|---|---|---|---|
| Vercel AI SDK | ~50 строк | Низкая | ⭐ |
| LangChain | ~80 строк | Средняя | ⭐⭐ |
| Mastra | ~60 строк | Низкая | ⭐⭐ |
| Pydantic AI | ~70 строк | Средняя | ⭐⭐ |
| Anthropic Agent SDK | ~45 строк | Низкая | ⭐ |
| OpenAI Agent SDK | ~45 строк | Низкая | ⭐ |
| LlamaIndex | ~100 строк | Высокая | ⭐⭐⭐ |
| CrewAI | ~90 строк | Средняя | ⭐⭐ |
Ключевое наблюдение: Нативные SDK производителей моделей (Anthropic/OpenAI) имеют наименьший объём кода, потому что они пропускают уровень кросс-модельной абстракции. Но если вашей системе нужно переключать модели, кросс-модельная абстракция LangChain или Mastra более ценна.
Оценка ландшафта
Агентские фреймворки в 2026 году разделяются на два направления:
- Лагерь нативных моделей: Anthropic Agent SDK, OpenAI Agent SDK — глубоко привязаны к одной модели, стремятся к максимальной производительности и опыту разработчика
- Лагерь кросс-моделей: LangChain, Mastra, Vercel AI SDK — предоставляют уровень абстракции моделей, стремятся к гибкости и переносимости
Какое направление выбрать зависит от ваших бизнес-потребностей:
- Если ваш продукт глубоко зависит от возможностей конкретной модели (например, длинный контекст Claude), выбирайте нативный SDK
- Если вам нужно гибкое переключение моделей или мульти-модельное A/B тестирование, выбирайте кросс-модельные фреймворки
Рекомендации к действию
| Роль | Рекомендация |
|---|---|
| Новые разработчики | Начните с Steel Cookbook, посмотрите реализации в 2-3 фреймворках, почувствуйте разные стили API перед принятием решения |
| Технический выбор | Не позволяйте «самой большой экосистеме» вас захватить. Большая экосистема LangChain не означает, что он подходит для вашего сценария. Смотрите на сложность кода и стоимость обслуживания |
| Лидеры команд | Унификация выбора фреймворка в вашей команде важнее, чем погоня за «лучшим фреймворком». Стоимость переключения фреймворков намного выше, чем ожидается |