Ars Technica · Разработка · 2 ч назад
Лаборатория суперинтеллекта Меты представляет свою первую публичную модель Muse Spark
Meta рекламирует сильные тесты, но признает «пробелы в производительности» в агентных системах и системах кодирования.
Подробности
Лаборатория суперинтеллекта компании Meta представляет свою первую общедоступную модель Muse Spark. Meta рекламирует сильные тесты, но признает «пробелы в производительности» в агентных системах и системах кодирования.
Muse Spark — это первый выпуск Лаборатории Суперинтеллекта Меты, созданной чуть меньше года назад с грандиозной целью «выполнить обещание личного суперинтеллекта для каждого». Релиз представляет собой полный разрыв с предыдущей работой Meta над семейством моделей Llama с открытым исходным кодом, которая получила посредственную реакцию как со стороны пользователей, так и в независимых рейтингах LLM. И хотя Spark будет запатентованной моделью, основатель и генеральный директор Meta Марк Цукерберг заявил в сообщении на Threads, что в будущем семейство Muse «включит новые модели с открытым исходным кодом».
Meta заявила, что Muse Spark будет использовать преимущества контента, размещенного на таких платформах, как Instagram, Facebook и Threads, так же, как Grok от xAI интегрирован с контентом, размещенным на X. В настоящее время это означает, что Muse Spark может ссылаться на общедоступные публикации, связанные, например, с местоположением или актуальной темой, о которой вы спрашиваете. В будущем, по словам Meta, это будет расширено до «новых функций, которые цитируют рекомендации и контент, которым люди делятся» и «Ролики, фотографии и сообщения, вплетенные непосредственно в ваши ответы, с упоминанием создателей контента».
В несколько техническом сообщении в блоге, сопровождающем анонс Spark, Meta включает уже ставший рутинным список тестов искусственного интеллекта, в которых стандартный режим мышления Muse Spark оценивается сопоставимо или лучше, чем конкурирующие модели от OpenAI, Anthropic, Google и xAI. Но в этом посте также смущенно признается, что «мы продолжаем инвестировать в области с текущими недостатками в производительности, такие как долгосрочные агентные системы и рабочие процессы кодирования».
В том же посте Meta также рекламирует режим «Созерцания», который, по его словам, будет «развертываться постепенно» и который может «управлять несколькими агентами, которые рассуждают параллельно». По словам Меты, используя до 16 агентов, думающих одновременно, режим «Созерцание» «обеспечивает превосходную производительность с сопоставимой задержкой». По данным Meta, этот «превосходный результат» включает в себя высокий балл 58,4 на последнем экзамене человечества (с использованием внешних инструментов).