CLI-Anything: команда Гонконгского университета стремится превратить всё ПО в Agent-Native, и это не просто громкие слова

«Making ALL Software Agent-Native.»

Когда вы видите такую фразу в README проекта на GitHub, первая мысль обычно: «Очередные пустые обещания».

Однако CLI-Anything уже собрал 38 429 звёзд на GitHub, и его подход весьма прагматичен: вместо того чтобы изобретать ПО заново, проект надевает на существующие программы «оболочку, понятную агенту».

Что такое Agent-Native

Давайте разберёмся с этим термином.

Agent-Native не означает, что программы нужно переписывать с нуля. Это значит, что любое ПО должно быть доступно для прямого управления ИИ-агентами без участия человека в роли «переводчика».

Сейчас ситуация такова: заставить ИИ-агента редактировать фото в Photoshop, проводить картографический анализ в QGIS или монтировать аудио в Audacity практически невозможно. Интерфейсы этих программ созданы для человеческих глаз и пальцев, а не для вызовов API агентов.

Идея CLI-Anything заключается в написании agent-harness (адаптера для агента) для каждой программы. Этот адаптер стандартизирует интерфейс командной строки (CLI) ПО, позволяя ИИ-агентам взаимодействовать с любым софтом единообразным способом.

Что они уже сделали

Судя по структуре репозитория, в CLI-Anything уже реализовано множество готовых agent-harness:

3MF — обработка 3D-моделей
QGIS — геоинформационная система
AdGuard Home — фильтрация сетевой рекламы
Audacity — редактирование аудио
Blender — 3D-моделирование и рендеринг

Каждый harness выполняет одну задачу: оборачивает интерфейс командной строки программы в стандартный формат, который агент может понять и вызвать.

Например, agent-harness для Audacity позволяет ИИ-агенту выполнить последовательность действий «открыть аудиофайл → удалить шум → экспортировать в WAV» без необходимости вручную кликать по меню.

Почему CLI является ключевым

Вы можете спросить: почему именно CLI? Почему не автоматизировать графический интерфейс (GUI)?

Причина проста: CLI структурирован, детерминирован и поддаётся скриптингу. Автоматизация GUI (на основе распознавания изображений или кликов по координатам) слишком ненадёжна — сдвинули кнопку, и всё сломалось; обновили интерфейс, и скрипт перестал работать.

CLI — это «чёрный ход», который разработчики оставляют для машин. CLI-Anything просто стандартизирует этот доступ.

CLI-Hub: амбиции экосистемы

У проекта есть сопутствующий сайт clianything.cc, называемый CLI-Hub. Это платформа для обмена agent-harness — аналог Docker Hub, но вместо контейнеров здесь размещаются адаптеры для агентов.

Если эта идея заработает, сформируется интересный цикл экосистемы:

Кто-то пишет agent-harness для новой программы
Загружает его на CLI-Hub
Другие пользователи устанавливают его, и их ИИ-агенты получают возможность управлять этой программой
Больше пользователей → больше контрибьюторов → поддержка большего количества ПО

Это очень напоминает путь взлёта npm и Docker Hub. Разница лишь в том, что на этот раз управляются не код или контейнеры, а возможности управления программами.

Академическая основа

CLI-Anything создан исследовательской группой по науке о данных Гонконгского университета (HKUDS). Это не «проект выходного дня», а серьёзная научная работа, подтверждённая публикациями.

Преимущества академических команд в open-source: строгая методология и качественная документация. Минус: темп обновлений иногда уступает коммерческим проектам.

Судя по истории коммитов, проект довольно активен (687 коммитов, последние обновления были 3 часа назад), что говорит о постоянной работе команды.

Ограничения и вызовы

CLI-Anything — не панацея:

Охватывает только ПО с CLI — у многих потребительских приложений вообще нет интерфейса командной строки
harness нужно писать вручную — несмотря на наличие вспомогательного фреймворка, использование CLI сильно различается от программы к программе, поэтому автоматическая генерация harness пока невозможна
Сложные операции всё ещё ограничены — простые задачи (конвертация форматов, пакетная обработка) работают отлично, но в функциях, требующих сложного взаимодействия, агент всё ещё может ошибаться

Почему на это стоит обратить внимание

Самое ценное в CLI-Anything — не то, что он умеет сейчас, а направление, которое он задаёт: «агентопригодность» (agentability) ПО становится новым измерением в разработке программного обеспечения.

В будущем оценка удобства программы будет зависеть не только от красоты интерфейса и количества функций, но и от того, насколько эффективно ИИ-агент может ею управлять.

Это похоже на то, как в своё время «качество API» стало стандартом оценки SaaS-продуктов. CLI-Anything создаёт инфраструктуру для этой тенденции.

Основные источники:

Что такое Agent-Native

Что они уже сделали

Почему CLI является ключевым

CLI-Hub: амбиции экосистемы

Академическая основа

Ограничения и вызовы

Почему на это стоит обратить внимание

Похожие материалы

Presenton — не «ещё один ИИ-генератор презентаций»: он превращает создание слайдов в развёртываемый рабочий процесс

Истинная ценность Midscene: в UI-автоматизации наконец можно писать меньше хрупких селекторов

Новый замкнутый цикл отладки фронтенда: Chrome DevTools MCP позволяет Coding Agent меньше гадать