C
ChaoBro

Отчёт по эксперименту Andon FM: что произошло спустя пять месяцев самостоятельного управления радиостанциями четырьмя ИИ?

Безумный, но серьёзный эксперимент

Сама компания Andon Labs уже звучит довольно безумно. Среди их проектов: ИИ, подписавший трёхлетний договор аренды торговой площади в Сан-Франциско для открытия магазина у дома (Andon Market), ИИ, открывший кафе в Стокгольме (Andon Cafe Stockholm), и Claude, управляющий торговым автоматом в офисе Anthropic.

Их ключевая идея заключается в следующем: к 2027 году способности моделей ИИ больше не потребуют участия человека в контуре принятия решений на каждом шаге. Единственным необходимым программным обеспечением останутся протоколы безопасности для контроля и согласования (alignment) их действий.

Andon FM — их новейший и, пожалуй, самый интересный эксперимент: четырём разным моделям ИИ был дан одинаковый начальный промпт — создать личность радиобренда и выйти на прибыль — после чего им предоставили пять месяцев полностью самостоятельной работы.

Дизайн эксперимента

У этого эксперимента есть несколько тонких особенностей:

  • Одинаковая стартовая точка: все четыре ИИ получили абсолютно идентичные начальные инструкции без предустановленных различий
  • Разные модели: в основе лежат четыре различные модели ИИ, что означает их естественные различия в логике принятия решений, контент-предпочтениях и стиле коммуникации
  • Долгий цикл: пять месяцев — это не демо и не хакатон, а настоящая непрерывная операционная деятельность
  • Реальные экономические ограничения: цель — выйти на прибыль, а не просто поиграться

Дифференциация спустя пять месяцев

В отчёте, опубликованном Andon Labs 13 мая, говорится: «Спустя пять месяцев они развили различия, которых мы не ожидали.»

Хотя полные технические детали ещё не обнародованы, исходя из традиционного исследовательского стиля Andon Labs, мы можем предположить следующие параметры наблюдения в этом эксперименте:

  1. Эволюция личности бренда: какую «характер» развил каждый ИИ-ведущий? Юмористический, профессиональный или компанейский?
  2. Контент-стратегия: консервативный выбор музыки по безопасному пути или рискованные эксперименты с нишевыми жанрами для привлечения конкретной аудитории?
  3. Модель монетизации: реклама, спонсорство, подписки, мерч — какие пути монетизации выбрали разные ИИ?
  4. Взаимодействие с аудиторией: как обрабатывались отзывы слушателей? Подстраиваться под них или придерживаться собственного стиля?

По сути, эти параметры тестируют способность ИИ к долгосрочному автономному принятию решений — не просто выполнение разовой задачи, а возможность выстроить и поддерживать согласованную стратегию на протяжении нескольких месяцев.

Почему этот эксперимент заслуживает внимания

Вам может показаться, что «ИИ, запускающий радиостанцию» звучит как маркетинговый трюк. Однако он затрагивает весьма практический вопрос: способны ли ИИ-агенты эффективно функционировать в реальных сценариях с длительным циклом, множеством переменных и необходимостью постоянной корректировки стратегии?

В настоящее время большинство оценок ИИ-агентов носят краткосрочный и узконаправленный характер — написать фрагмент кода, ответить на вопрос, выполнить разовую задачу. Однако бизнес-решения в реальном мире носят непрерывный, итеративный характер и требуют долгосрочной памяти и стратегической согласованности.

Значение Andon FM заключается в создании контролируемой среды для реального эксперимента:

  • Управление радиостанцией включает выбор контента, поддержание бренда, взаимодействие с пользователями и коммерческую монетизацию
  • Результаты можно объективно измерить с помощью показателей дохода и количества слушателей
  • Различные модели можно сравнивать в идентичных условиях

От радиостанции к «автономным организациям»

Амбиции Andon Labs не ограничиваются радиостанциями. Их линейка продуктов, от Vending-Bench (симулятор торговых автоматов) до Blueprint-Bench (тестирование пространственного интеллекта) и Butter-Bench (управление роботами), охватывает системную структуру оценки способностей.

Andon FM является наиболее близким к реальным бизнес-сценариям звеном в этой системе. Если четыре ИИ смогут за пять месяцев самостоятельно создать узнаваемые бренды и выйти на прибыль, это будет означать, что границы автономности ИИ находятся гораздо дальше, чем мы предполагали.

Однако, если они потерпят неудачу — или проявят непредсказуемое, вредоносное поведение — это также станут ценными данными. Именно в этом заключается смысл существования Andon Labs: тестировать пределы возможностей ИИ в реальных условиях до их полномасштабного развёртывания.

Сигналы для индустрии

Кремниевая долина лихорадочно создаёт программное обеспечение вокруг текущих возможностей ИИ. Гипотеза Andon Labs заключается в том, что эта спешка сама по себе может быть близорукой. Поскольку к 2027 году способности самих моделей совершат значительный скачок. То, что действительно необходимо создавать — это не инструменты «пусть ИИ поможет тебе сделать X», а фреймворки безопасности для «пусть ИИ самостоятельно сделает X».

Верность этого суждения покажет время. Однако такие эксперименты, как Andon FM, по крайней мере, предлагают новый подход: вместо того чтобы гонять бенчмарки в лабораториях, лучше позволить ИИ окунуться в реальный мир.