У ИИ-агентов сейчас глупая проблема.
Ты тратишь полчаса на разговор с агентом, учишь его своим предпочтениям, структуре проекта, стилю кода. Потом открываешь новую сессию — агент всё забыл.
Каждый разговор — первое знакомство.
Четырёхуровневая архитектура памяти
Кто-то пытается это решить, имитируя многослойность человеческой памяти:
L1 Рабочая память (<5мс): Аналог кратковременной памяти. Информация, необходимая для текущей задачи, чтение и запись в реальном времени, чрезвычайно быстро. Как «какой файл сейчас редактирует пользователь».
L2 Эпизодическая память (графы событий): Записывает то, что произошло. Не сырые логи, а структурированные графы событий — «пользователь вчера модифицировал модуль аутентификации, потому что нашёл баг с истечением токена».
L3 Семантическая память (сжатый HNSW): Сжимает опыт в извлекаемые знания. Как «здравый смысл» — не нужно помнить точно, когда что-то произошло, но знаешь «этот проект использует JWT для аутентификации».
L4 Облачный архив + персистентность идентичности: Долгосрочное хранение. Как дневник — редко открывается, но доступен когда нужен.
→ Дополнительное чтение: Персистентная память для кодирующих агентов | Персистентность контекста агентов
Основные источники: