Ars Technica · Разработка · 4 ч назад

«Переполнение стека для агентов» от разработчиков Mozilla нацелено на ключевую слабость в кодировании ИИ

Однако прежде чем его можно будет принять, необходимо решить серьезные проблемы.

Источник Ars Technica
Опубликовано 4 ч назад
Оригинальный заголовок Mozilla dev's "Stack Overflow for agents" targets a key weakness in coding AI
Важность 4/5
Почему это может быть интересно Может дать практические идеи для backend, инфраструктуры, инструментов и инженерных решений.
← Назад к ленте Открыть оригинал
#development#infra#engineering#разработка

Подробности

Помимо Agents.md, «Переполнение стека для агентов» разработчика Mozilla направлено на устранение ключевого недостатка в кодировании ИИ. Однако, прежде чем его можно будет принять, необходимо решить серьезные проблемы.

Он призван решить пару проблем. Во-первых, агенты кодирования часто используют устаревшую информацию при принятии решений, например, при попытке вызова устаревшего API. Это связано с ограничениями на обучение и отсутствием надежного структурированного доступа к актуальному контексту времени выполнения. Иногда они используют такие методы, как RAG (Поисковая дополненная генерация), чтобы получить обновленные знания, но они не всегда делают это, когда им нужно — «неизвестное неизвестное», как говорится, — и когда они это делают, они никогда не бывают полными.

Во-вторых, нескольким агентам часто приходится находить способы обойти одни и те же препятствия, но после указанной точки отсечения обмена знаниями нет. Это означает, что сотни или тысячи отдельных агентов в конечном итоге используют дорогие токены и постоянно потребляют энергию для решения уже решенных проблем. В идеале один должен решить проблему один раз, а остальные будут опираться на этот опыт.

Прежде чем агент возьмется за незнакомую работу; интеграция API, конфигурация CI/CD, фреймворк, которого он раньше не касался; он запрашивает ресурсы cq commons. Если другой агент уже узнал, что, скажем, Stripe возвращает 200 с телом ошибки для запросов с ограниченной скоростью, ваш агент знает это еще до написания одной строки кода. Когда ваш агент обнаруживает что-то новое, он предлагает эти знания обратно. Другие агенты подтверждают, что работает, и отмечают, что устарело. Знания завоевывают доверие благодаря использованию, а не авторитету.

Идея состоит в том, чтобы выйти за рамки claude.md или Agents.md, текущего решения проблем, которые пытается решить cq. Прямо сейчас разработчики добавляют инструкции для своих агентов методом проб и ошибок: если они обнаруживают, что агент продолжает пытаться использовать что-то устаревшее, они в файлах .md сообщают ему, чтобы вместо этого он сделал что-то другое.