Ars Technica · Разработка · 2 ч назад

Лаборатория суперинтеллекта Меты представляет свою первую публичную модель Muse Spark

Meta рекламирует сильные тесты, но признает «пробелы в производительности» в агентных системах и системах кодирования.

Источник Ars Technica
Опубликовано 2 ч назад
Оригинальный заголовок Meta's Superintelligence Lab unveils its first public model, Muse Spark
Важность 3/5
Почему это может быть интересно Может дать практические идеи для backend, инфраструктуры, инструментов и инженерных решений.
← Назад к ленте Открыть оригинал
#development#infra#engineering#разработка

Подробности

Лаборатория суперинтеллекта компании Meta представляет свою первую общедоступную модель Muse Spark. Meta рекламирует сильные тесты, но признает «пробелы в производительности» в агентных системах и системах кодирования.

Muse Spark — это первый выпуск Лаборатории Суперинтеллекта Меты, созданной чуть меньше года назад с грандиозной целью «выполнить обещание личного суперинтеллекта для каждого». Релиз представляет собой полный разрыв с предыдущей работой Meta над семейством моделей Llama с открытым исходным кодом, которая получила посредственную реакцию как со стороны пользователей, так и в независимых рейтингах LLM. И хотя Spark будет запатентованной моделью, основатель и генеральный директор Meta Марк Цукерберг заявил в сообщении на Threads, что в будущем семейство Muse «включит новые модели с открытым исходным кодом».

Meta заявила, что Muse Spark будет использовать преимущества контента, размещенного на таких платформах, как Instagram, Facebook и Threads, так же, как Grok от xAI интегрирован с контентом, размещенным на X. В настоящее время это означает, что Muse Spark может ссылаться на общедоступные публикации, связанные, например, с местоположением или актуальной темой, о которой вы спрашиваете. В будущем, по словам Meta, это будет расширено до «новых функций, которые цитируют рекомендации и контент, которым люди делятся» и «Ролики, фотографии и сообщения, вплетенные непосредственно в ваши ответы, с упоминанием создателей контента».

В несколько техническом сообщении в блоге, сопровождающем анонс Spark, Meta включает уже ставший рутинным список тестов искусственного интеллекта, в которых стандартный режим мышления Muse Spark оценивается сопоставимо или лучше, чем конкурирующие модели от OpenAI, Anthropic, Google и xAI. Но в этом посте также смущенно признается, что «мы продолжаем инвестировать в области с текущими недостатками в производительности, такие как долгосрочные агентные системы и рабочие процессы кодирования».

В том же посте Meta также рекламирует режим «Созерцания», который, по его словам, будет «развертываться постепенно» и который может «управлять несколькими агентами, которые рассуждают параллельно». По словам Меты, используя до 16 агентов, думающих одновременно, режим «Созерцание» «обеспечивает превосходную производительность с сопоставимой задержкой». По данным Meta, этот «превосходный результат» включает в себя высокий балл 58,4 на последнем экзамене человечества (с использованием внешних инструментов).