ИИ-новости Избранное
Фudan × PKU предлагают AHE: Пусть Harness эволюционирует сам, обгоняя Codex за 10 раундов
Университет Фудань, Пекинский университет и Qiji Zhifeng предлагают Agentic Harness Engineering (AHE) — фреймворк, позволяющий кодовым агентам автоматически читать трассировки выполнения, диагностировать проблемы и модифицировать свой Harness. После 10 раундов автоматической эволюции pass@1 на Terminal-Bench 2 улучшился с 69,7% до 77,0%, превзойдя созданный людьми Harness Codex-CLI.
#Agentic Harness Engineering
#AHE
#Fudan University