Ars Technica · Разработка · 2 ч назад
Модели искусственного интеллекта плохо умеют делать ставки на футбол, особенно xAI Grok.
Системы от Google, OpenAI, Anthropic и xAI борются за Премьер-лигу.
Подробности
Азартные игры с моделями LLM ИИ ужасны при ставках на футбол — особенно xAI Grok Systems от Google, OpenAI, Anthropic и xAI борются с Премьер-лигой.
Отчет «KellyBench», опубликованный на этой неделе стартапом General Reasoning в области искусственного интеллекта, подчеркивает разрыв между быстро развивающимися возможностями ИИ в определенных задачах, таких как написание программного обеспечения, и его недостатками в других видах человеческих проблем.
Лондонская компания General Reasoning протестировала восемь лучших систем искусственного интеллекта в виртуальном воссоздании сезона Премьер-лиги 2023–24 годов, предоставив им подробные исторические данные и статистику о каждой команде и предыдущих играх. ИИ было поручено построить модели, которые максимизировали бы прибыль и управляли рисками.
Затем «агенты» ИИ делали ставки на результаты матчей и количество забитых голов, чтобы проверить, как они смогут адаптироваться к новым событиям, и обновляли данные об игроках по ходу сезона.
ИИ не мог получить доступ к Интернету для получения результатов, и каждому было дано три попытки получить прибыль.