Безумный, но серьёзный эксперимент
Сама компания Andon Labs уже звучит довольно безумно. Среди их проектов: ИИ, подписавший трёхлетний договор аренды торговой площади в Сан-Франциско для открытия магазина у дома (Andon Market), ИИ, открывший кафе в Стокгольме (Andon Cafe Stockholm), и Claude, управляющий торговым автоматом в офисе Anthropic.
Их ключевая идея заключается в следующем: к 2027 году способности моделей ИИ больше не потребуют участия человека в контуре принятия решений на каждом шаге. Единственным необходимым программным обеспечением останутся протоколы безопасности для контроля и согласования (alignment) их действий.
Andon FM — их новейший и, пожалуй, самый интересный эксперимент: четырём разным моделям ИИ был дан одинаковый начальный промпт — создать личность радиобренда и выйти на прибыль — после чего им предоставили пять месяцев полностью самостоятельной работы.
Дизайн эксперимента
У этого эксперимента есть несколько тонких особенностей:
- Одинаковая стартовая точка: все четыре ИИ получили абсолютно идентичные начальные инструкции без предустановленных различий
- Разные модели: в основе лежат четыре различные модели ИИ, что означает их естественные различия в логике принятия решений, контент-предпочтениях и стиле коммуникации
- Долгий цикл: пять месяцев — это не демо и не хакатон, а настоящая непрерывная операционная деятельность
- Реальные экономические ограничения: цель — выйти на прибыль, а не просто поиграться
Дифференциация спустя пять месяцев
В отчёте, опубликованном Andon Labs 13 мая, говорится: «Спустя пять месяцев они развили различия, которых мы не ожидали.»
Хотя полные технические детали ещё не обнародованы, исходя из традиционного исследовательского стиля Andon Labs, мы можем предположить следующие параметры наблюдения в этом эксперименте:
- Эволюция личности бренда: какую «характер» развил каждый ИИ-ведущий? Юмористический, профессиональный или компанейский?
- Контент-стратегия: консервативный выбор музыки по безопасному пути или рискованные эксперименты с нишевыми жанрами для привлечения конкретной аудитории?
- Модель монетизации: реклама, спонсорство, подписки, мерч — какие пути монетизации выбрали разные ИИ?
- Взаимодействие с аудиторией: как обрабатывались отзывы слушателей? Подстраиваться под них или придерживаться собственного стиля?
По сути, эти параметры тестируют способность ИИ к долгосрочному автономному принятию решений — не просто выполнение разовой задачи, а возможность выстроить и поддерживать согласованную стратегию на протяжении нескольких месяцев.
Почему этот эксперимент заслуживает внимания
Вам может показаться, что «ИИ, запускающий радиостанцию» звучит как маркетинговый трюк. Однако он затрагивает весьма практический вопрос: способны ли ИИ-агенты эффективно функционировать в реальных сценариях с длительным циклом, множеством переменных и необходимостью постоянной корректировки стратегии?
В настоящее время большинство оценок ИИ-агентов носят краткосрочный и узконаправленный характер — написать фрагмент кода, ответить на вопрос, выполнить разовую задачу. Однако бизнес-решения в реальном мире носят непрерывный, итеративный характер и требуют долгосрочной памяти и стратегической согласованности.
Значение Andon FM заключается в создании контролируемой среды для реального эксперимента:
- Управление радиостанцией включает выбор контента, поддержание бренда, взаимодействие с пользователями и коммерческую монетизацию
- Результаты можно объективно измерить с помощью показателей дохода и количества слушателей
- Различные модели можно сравнивать в идентичных условиях
От радиостанции к «автономным организациям»
Амбиции Andon Labs не ограничиваются радиостанциями. Их линейка продуктов, от Vending-Bench (симулятор торговых автоматов) до Blueprint-Bench (тестирование пространственного интеллекта) и Butter-Bench (управление роботами), охватывает системную структуру оценки способностей.
Andon FM является наиболее близким к реальным бизнес-сценариям звеном в этой системе. Если четыре ИИ смогут за пять месяцев самостоятельно создать узнаваемые бренды и выйти на прибыль, это будет означать, что границы автономности ИИ находятся гораздо дальше, чем мы предполагали.
Однако, если они потерпят неудачу — или проявят непредсказуемое, вредоносное поведение — это также станут ценными данными. Именно в этом заключается смысл существования Andon Labs: тестировать пределы возможностей ИИ в реальных условиях до их полномасштабного развёртывания.
Сигналы для индустрии
Кремниевая долина лихорадочно создаёт программное обеспечение вокруг текущих возможностей ИИ. Гипотеза Andon Labs заключается в том, что эта спешка сама по себе может быть близорукой. Поскольку к 2027 году способности самих моделей совершат значительный скачок. То, что действительно необходимо создавать — это не инструменты «пусть ИИ поможет тебе сделать X», а фреймворки безопасности для «пусть ИИ самостоятельно сделает X».
Верность этого суждения покажет время. Однако такие эксперименты, как Andon FM, по крайней мере, предлагают новый подход: вместо того чтобы гонять бенчмарки в лабораториях, лучше позволить ИИ окунуться в реальный мир.