C
ChaoBro

CLI-Anything: команда Гонконгского университета стремится превратить всё ПО в Agent-Native, и это не просто громкие слова

«Making ALL Software Agent-Native.»

Когда вы видите такую фразу в README проекта на GitHub, первая мысль обычно: «Очередные пустые обещания».

Однако CLI-Anything уже собрал 38 429 звёзд на GitHub, и его подход весьма прагматичен: вместо того чтобы изобретать ПО заново, проект надевает на существующие программы «оболочку, понятную агенту».

Что такое Agent-Native

Давайте разберёмся с этим термином.

Agent-Native не означает, что программы нужно переписывать с нуля. Это значит, что любое ПО должно быть доступно для прямого управления ИИ-агентами без участия человека в роли «переводчика».

Сейчас ситуация такова: заставить ИИ-агента редактировать фото в Photoshop, проводить картографический анализ в QGIS или монтировать аудио в Audacity практически невозможно. Интерфейсы этих программ созданы для человеческих глаз и пальцев, а не для вызовов API агентов.

Идея CLI-Anything заключается в написании agent-harness (адаптера для агента) для каждой программы. Этот адаптер стандартизирует интерфейс командной строки (CLI) ПО, позволяя ИИ-агентам взаимодействовать с любым софтом единообразным способом.

Что они уже сделали

Судя по структуре репозитория, в CLI-Anything уже реализовано множество готовых agent-harness:

  • 3MF — обработка 3D-моделей
  • QGIS — геоинформационная система
  • AdGuard Home — фильтрация сетевой рекламы
  • Audacity — редактирование аудио
  • Blender — 3D-моделирование и рендеринг

Каждый harness выполняет одну задачу: оборачивает интерфейс командной строки программы в стандартный формат, который агент может понять и вызвать.

Например, agent-harness для Audacity позволяет ИИ-агенту выполнить последовательность действий «открыть аудиофайл → удалить шум → экспортировать в WAV» без необходимости вручную кликать по меню.

Почему CLI является ключевым

Вы можете спросить: почему именно CLI? Почему не автоматизировать графический интерфейс (GUI)?

Причина проста: CLI структурирован, детерминирован и поддаётся скриптингу. Автоматизация GUI (на основе распознавания изображений или кликов по координатам) слишком ненадёжна — сдвинули кнопку, и всё сломалось; обновили интерфейс, и скрипт перестал работать.

CLI — это «чёрный ход», который разработчики оставляют для машин. CLI-Anything просто стандартизирует этот доступ.

CLI-Hub: амбиции экосистемы

У проекта есть сопутствующий сайт clianything.cc, называемый CLI-Hub. Это платформа для обмена agent-harness — аналог Docker Hub, но вместо контейнеров здесь размещаются адаптеры для агентов.

Если эта идея заработает, сформируется интересный цикл экосистемы:

  1. Кто-то пишет agent-harness для новой программы
  2. Загружает его на CLI-Hub
  3. Другие пользователи устанавливают его, и их ИИ-агенты получают возможность управлять этой программой
  4. Больше пользователей → больше контрибьюторов → поддержка большего количества ПО

Это очень напоминает путь взлёта npm и Docker Hub. Разница лишь в том, что на этот раз управляются не код или контейнеры, а возможности управления программами.

Академическая основа

CLI-Anything создан исследовательской группой по науке о данных Гонконгского университета (HKUDS). Это не «проект выходного дня», а серьёзная научная работа, подтверждённая публикациями.

Преимущества академических команд в open-source: строгая методология и качественная документация. Минус: темп обновлений иногда уступает коммерческим проектам.

Судя по истории коммитов, проект довольно активен (687 коммитов, последние обновления были 3 часа назад), что говорит о постоянной работе команды.

Ограничения и вызовы

CLI-Anything — не панацея:

  • Охватывает только ПО с CLI — у многих потребительских приложений вообще нет интерфейса командной строки
  • harness нужно писать вручную — несмотря на наличие вспомогательного фреймворка, использование CLI сильно различается от программы к программе, поэтому автоматическая генерация harness пока невозможна
  • Сложные операции всё ещё ограничены — простые задачи (конвертация форматов, пакетная обработка) работают отлично, но в функциях, требующих сложного взаимодействия, агент всё ещё может ошибаться

Почему на это стоит обратить внимание

Самое ценное в CLI-Anything — не то, что он умеет сейчас, а направление, которое он задаёт: «агентопригодность» (agentability) ПО становится новым измерением в разработке программного обеспечения.

В будущем оценка удобства программы будет зависеть не только от красоты интерфейса и количества функций, но и от того, насколько эффективно ИИ-агент может ею управлять.

Это похоже на то, как в своё время «качество API» стало стандартом оценки SaaS-продуктов. CLI-Anything создаёт инфраструктуру для этой тенденции.


Основные источники: