Следующий кризис безопасности ИИ-агентов: Microsoft обнаружила, что одно вредоносное сообщение может прыгать по мульти-агентным сетям

Ключевое открытие

Исследовательская команда безопасности Microsoft на этой неделе раскрыла новый вектор атак для мульти-агентных систем: одно вредоносное сообщение может распространяться пошагово по мульти-агентным сетям.

Процесс:

Атакующий отправляет тщательно сконструированное вредоносное сообщение Агенту A
Агент A, обрабатывая сообщение, индуцируется произвести вывод, содержащий скрытые инструкции
Агент B принимает вывод Агента A как ввод, неосознанно наследуя скрытые инструкции
Агент B выполняет скрытые инструкции, извлекает приватные данные и производит новый вредоносный вывод
Агент C получает вывод Агента B… цепочка заражения продолжается

Ключевое понимание: Речь не о том, что один агент скомпрометирован. Вся сеть агентов может быть постепенно заражена одним сообщением.

Почему эта проблема была обнаружена только сейчас

Мульти-агентные системы — одно из самых горячих направлений в ИИ-индустрии 2026 года:

Claude Cowork от Anthropic создаёт мульти-агентные рабочие процессы
Codex Workflow Engine от OpenAI поддерживает мульти-агентную оркестрацию
Open-source фреймворки, такие как Hermes Agent, CrewAI и LangGraph, продвигают мульти-агентные архитектуры
Предприятия разворачивают десятки и даже сотни агентов для сложных бизнес-процессов

Индустрия опередила безопасность. Пока все занимаются тем, чтобы сделать агентов мощнее, автономнее и лучше в коллаборации, мало кто остановился и спросил: что произойдёт, если один агент будет заражён?

Исследование Microsoft дало ответ: заражена будет вся сеть.

Итог

Исследование перекрёстного заражения мульти-агентных систем от Microsoft и статья об отравлении агентов от UC Santa Cruz вместе указывают на один вывод: чем мощнее ИИ-агенты, тем больше их риски безопасности; когда несколько агентов сотрудничают, риск не линейно суммируется, а экспоненциально усиливается.

Речь не о том, чтобы остановить разработку мульти-агентных систем — речь о том, чтобы встроить безопасность с первого дня.

Следующий кризис безопасности ИИ-агентов: Microsoft обнаружила, что одно вредоносное сообщение может прыгать по мульти-агентным сетям

Ключевое открытие

Почему эта проблема была обнаружена только сейчас

Рекомендации по защите

Для проектировщиков мульти-агентных систем

Для предприятий, разворачивающих агентов

Итог

Ключевое открытие

Почему эта проблема была обнаружена только сейчас

Рекомендации по защите

Для проектировщиков мульти-агентных систем

Для предприятий, разворачивающих агентов

Итог

Похожие материалы

Расширение CAISI: Google/Microsoft/xAI присоединяются к программе тестирования AI-безопасности правительства США, добровольная рамка принимает реальную форму

Claude Managed Agents выпускает функцию Dreaming: агенты эволюционируют от исполнителей к предварительным акторам

Meta тайно разрабатывает конкурента OpenClaw: персональный AI-ассистент для миллиардов пользователей на базе Muse Spark