Тайная борьба в цепочке инструментов для ИИ-агентов: когда все новые инструменты служат ИИ, а не людям

Недавно на Hacker News вызвал значительный интерес проект под названием Semble — «поисковый инструмент для кода, разработанный специально для агентов», способный выполнять задачи поиска по коду, расходуя на 98 % меньше токенов, чем grep.

283 балла и 96 комментариев — весьма высокий уровень внимания для инструмента поиска по коду.

Однако то, что действительно заслуживает обсуждения, — это не сам инструмент, а более широкая тенденция, стоящая за ним: всё больше новых инструментов создаются не для человеческих разработчиков, а для ИИ-агентов.

Что означает экономия в 98 % токенов?

Сначала разберёмся с проблемой, которую решает Semble.

Когда ИИ-агенту необходимо понять репозиторий кода, ему обычно требуется искать файлы, читать их содержимое и анализировать контекст. При использовании традиционного подхода (grep + чтение файлов) агент вынужден тратить огромное количество токенов на загрузку содержимого, которое ему на самом деле не нужно.

Semble же возвращает только те фрагменты кода, которые действительно требуются агенту — а не целые файлы. Это приводит к резкому снижению количества токенов, потребляемых при каждом поиске.

Экономия в 98 % токенов может показаться преувеличением, но в сценариях использования ИИ-агентов она вполне реальна. Дело в том, что человек может «бросить взгляд» и мгновенно определить, какие части текста важны, тогда как ИИ-агенту приходится читать всё посимвольно — если только кто-то не выполнит за него предварительную фильтрацию.

Происходит более масштабная тенденция

Semble — не единственный пример.

За последние месяцы цепочка инструментов для ИИ-агентов растёт на глазах:

Поиск по коду: от grep до Semble — от результатов, удобных для человека, до структурированного вывода, пригодного для агентов;
Навигация по коду: от древовидной структуры файлов, предназначенной для кликов человека, до графов кода, пригодных для обработки агентами;
Инструменты тестирования: от отчётов, ориентированных на человека, до оценочных сигналов, легко парсируемых агентами;
Инструменты документирования: от Markdown-документации для чтения людьми до структурированных баз знаний, пригодных для использования агентами.

Общее у всех этих инструментов — их «пользователь» — ИИ-агент, а не человек.

Это означает фундаментальный сдвиг: парадигма проектирования инструментов для разработчиков переходит от «человекоцентричной» к «агентоцентричной».

Это не плохо — но правила игры меняются

Некоторые могут воспринять эту тенденцию как тревожную: инструменты перестают создаваться для людей и начинают ориентироваться на машины.

Однако с другой точки зрения — это неизбежный этап технологического прогресса.

Как компиляторы пишутся не для людей (для этого есть ассемблер), а для исполнения машиной; как IDE создаются не для машин, а для удобства взаимодействия человека с кодом — каждая новая абстракция возникает для удовлетворения потребностей конкретной роли.

Появление цепочки инструментов для ИИ-агентов — просто следствие того, что ИИ-агенты стали новой «персоной» в мире кода. Им нужны свои инструменты — так же, как человеку нужна IDE.

Но это порождает и ряд вопросов, заслуживающих размышления

Во-первых, снижение наблюдаемости (observability). Если выходные данные инструмента оптимизированы для ИИ-агента, как разработчику-человеку понять, что именно делает агент? Если поисковый инструмент возвращает структурированный, «дружелюбный к агентам» формат, сможет ли его прочитать человек?

Во-вторых, фрагментация инструментов. В будущем нам, возможно, придётся поддерживать две отдельные цепочки инструментов — одну для людей, другую — для агентов. Не приведёт ли это к росту издержек на сопровождение?

В-третьих, каковы критерии качества инструментов для агентов? Качество инструментов для людей можно оценить по удобству использования (UX). А что такое «удобство использования» для ИИ-агента? Эффективность по токенам? Точность? Или что-то ещё?

Возможное будущее: «агентоцентрично» и «дружелюбно к человеку»

Наилучший сценарий — это инструменты, сочетающие оба принципа: «агентоцентрично» в основе и «дружелюбно к человеку» в интерфейсе.

Как API и панель управления (Dashboard): API проектируется для вызова машиной, а Dashboard позволяет человеку понять, что происходит.

На сегодняшний день Semble реализован как консольный инструмент с выводом в структурированном формате JSON. Это отличный выбор: структурированный вывод можно напрямую использовать ИИ-агентом, а также легко визуализировать в человекочитаемом виде с помощью вспомогательных инструментов.

Такой многоуровневый дизайн, вероятно, станет лучшей практикой для будущих цепочек инструментов для ИИ-агентов.

Заключение

Semble получил 283 балла не потому, что его технология революционна, а потому, что он попал в точку — в момент зарождения новой тенденции.

ИИ-агенты уже не абстрактное понятие — они становятся полноценными «гражданами» мира кода. А создание инструментов специально для них превращается в новую арену соперничества в индустрии разработки инструментов.

Для разработчиков это может означать необходимость задать себе важный вопрос: для кого вы создаёте свой инструмент?

Для человека — или для своего ИИ-коллеги?

Ответ, скорее всего, уже не сводится к простому выбору одного из двух вариантов.

Что означает экономия в 98 % токенов?

Происходит более масштабная тенденция

Это не плохо — но правила игры меняются

Но это порождает и ряд вопросов, заслуживающих размышления

Возможное будущее: «агентоцентрично» и «дружелюбно к человеку»

Заключение

Похожие материалы

Anthropic приобретает Stainless: цепочка инструментов SDK становится новым экономическим ровом для ИИ-компаний

CloakBrowser набирает 9000 звёзд за неделю: игра в кошки-мышки между автоматизацией и антидетектом выходит из-под контроля

mattpocock/skills преодолел рубеж в 91 тыс. звёзд: когда «навыки разработчика» упаковываются в продукт, кто в выигрыше?