Ars Technica · Разработка · 4 ч назад
«Переполнение стека для агентов» от разработчиков Mozilla нацелено на ключевую слабость в кодировании ИИ
Однако прежде чем его можно будет принять, необходимо решить серьезные проблемы.
Подробности
Помимо Agents.md, «Переполнение стека для агентов» разработчика Mozilla направлено на устранение ключевого недостатка в кодировании ИИ. Однако, прежде чем его можно будет принять, необходимо решить серьезные проблемы.
Он призван решить пару проблем. Во-первых, агенты кодирования часто используют устаревшую информацию при принятии решений, например, при попытке вызова устаревшего API. Это связано с ограничениями на обучение и отсутствием надежного структурированного доступа к актуальному контексту времени выполнения. Иногда они используют такие методы, как RAG (Поисковая дополненная генерация), чтобы получить обновленные знания, но они не всегда делают это, когда им нужно — «неизвестное неизвестное», как говорится, — и когда они это делают, они никогда не бывают полными.
Во-вторых, нескольким агентам часто приходится находить способы обойти одни и те же препятствия, но после указанной точки отсечения обмена знаниями нет. Это означает, что сотни или тысячи отдельных агентов в конечном итоге используют дорогие токены и постоянно потребляют энергию для решения уже решенных проблем. В идеале один должен решить проблему один раз, а остальные будут опираться на этот опыт.
Прежде чем агент возьмется за незнакомую работу; интеграция API, конфигурация CI/CD, фреймворк, которого он раньше не касался; он запрашивает ресурсы cq commons. Если другой агент уже узнал, что, скажем, Stripe возвращает 200 с телом ошибки для запросов с ограниченной скоростью, ваш агент знает это еще до написания одной строки кода. Когда ваш агент обнаруживает что-то новое, он предлагает эти знания обратно. Другие агенты подтверждают, что работает, и отмечают, что устарело. Знания завоевывают доверие благодаря использованию, а не авторитету.
Идея состоит в том, чтобы выйти за рамки claude.md или Agents.md, текущего решения проблем, которые пытается решить cq. Прямо сейчас разработчики добавляют инструкции для своих агентов методом проб и ошибок: если они обнаруживают, что агент продолжает пытаться использовать что-то устаревшее, они в файлах .md сообщают ему, чтобы вместо этого он сделал что-то другое.