«Making ALL Software Agent-Native.»
Когда вы видите такую фразу в README проекта на GitHub, первая мысль обычно: «Очередные пустые обещания».
Однако CLI-Anything уже собрал 38 429 звёзд на GitHub, и его подход весьма прагматичен: вместо того чтобы изобретать ПО заново, проект надевает на существующие программы «оболочку, понятную агенту».
Что такое Agent-Native
Давайте разберёмся с этим термином.
Agent-Native не означает, что программы нужно переписывать с нуля. Это значит, что любое ПО должно быть доступно для прямого управления ИИ-агентами без участия человека в роли «переводчика».
Сейчас ситуация такова: заставить ИИ-агента редактировать фото в Photoshop, проводить картографический анализ в QGIS или монтировать аудио в Audacity практически невозможно. Интерфейсы этих программ созданы для человеческих глаз и пальцев, а не для вызовов API агентов.
Идея CLI-Anything заключается в написании agent-harness (адаптера для агента) для каждой программы. Этот адаптер стандартизирует интерфейс командной строки (CLI) ПО, позволяя ИИ-агентам взаимодействовать с любым софтом единообразным способом.
Что они уже сделали
Судя по структуре репозитория, в CLI-Anything уже реализовано множество готовых agent-harness:
- 3MF — обработка 3D-моделей
- QGIS — геоинформационная система
- AdGuard Home — фильтрация сетевой рекламы
- Audacity — редактирование аудио
- Blender — 3D-моделирование и рендеринг
Каждый harness выполняет одну задачу: оборачивает интерфейс командной строки программы в стандартный формат, который агент может понять и вызвать.
Например, agent-harness для Audacity позволяет ИИ-агенту выполнить последовательность действий «открыть аудиофайл → удалить шум → экспортировать в WAV» без необходимости вручную кликать по меню.
Почему CLI является ключевым
Вы можете спросить: почему именно CLI? Почему не автоматизировать графический интерфейс (GUI)?
Причина проста: CLI структурирован, детерминирован и поддаётся скриптингу. Автоматизация GUI (на основе распознавания изображений или кликов по координатам) слишком ненадёжна — сдвинули кнопку, и всё сломалось; обновили интерфейс, и скрипт перестал работать.
CLI — это «чёрный ход», который разработчики оставляют для машин. CLI-Anything просто стандартизирует этот доступ.
CLI-Hub: амбиции экосистемы
У проекта есть сопутствующий сайт clianything.cc, называемый CLI-Hub. Это платформа для обмена agent-harness — аналог Docker Hub, но вместо контейнеров здесь размещаются адаптеры для агентов.
Если эта идея заработает, сформируется интересный цикл экосистемы:
- Кто-то пишет agent-harness для новой программы
- Загружает его на CLI-Hub
- Другие пользователи устанавливают его, и их ИИ-агенты получают возможность управлять этой программой
- Больше пользователей → больше контрибьюторов → поддержка большего количества ПО
Это очень напоминает путь взлёта npm и Docker Hub. Разница лишь в том, что на этот раз управляются не код или контейнеры, а возможности управления программами.
Академическая основа
CLI-Anything создан исследовательской группой по науке о данных Гонконгского университета (HKUDS). Это не «проект выходного дня», а серьёзная научная работа, подтверждённая публикациями.
Преимущества академических команд в open-source: строгая методология и качественная документация. Минус: темп обновлений иногда уступает коммерческим проектам.
Судя по истории коммитов, проект довольно активен (687 коммитов, последние обновления были 3 часа назад), что говорит о постоянной работе команды.
Ограничения и вызовы
CLI-Anything — не панацея:
- Охватывает только ПО с CLI — у многих потребительских приложений вообще нет интерфейса командной строки
- harness нужно писать вручную — несмотря на наличие вспомогательного фреймворка, использование CLI сильно различается от программы к программе, поэтому автоматическая генерация harness пока невозможна
- Сложные операции всё ещё ограничены — простые задачи (конвертация форматов, пакетная обработка) работают отлично, но в функциях, требующих сложного взаимодействия, агент всё ещё может ошибаться
Почему на это стоит обратить внимание
Самое ценное в CLI-Anything — не то, что он умеет сейчас, а направление, которое он задаёт: «агентопригодность» (agentability) ПО становится новым измерением в разработке программного обеспечения.
В будущем оценка удобства программы будет зависеть не только от красоты интерфейса и количества функций, но и от того, насколько эффективно ИИ-агент может ею управлять.
Это похоже на то, как в своё время «качество API» стало стандартом оценки SaaS-продуктов. CLI-Anything создаёт инфраструктуру для этой тенденции.
Основные источники: