TechCrunch · AI · 1 ч назад

Приложение Speechify для Windows использует локальные модели для транскрипции и диктовки

Speechify только что запустил собственное приложение для Windows, которое использует локально хранимые модели для обеспечения диктовки и транскрипции между приложениями.

Источник TechCrunch
Опубликовано 1 ч назад
Оригинальный заголовок Speechify’s Windows app uses local models for transcription and dictation
Важность 5/5
Почему это может быть интересно Важно для понимания, куда реально двигаются модели, агенты и продуктовые AI-инструменты.
← Назад к ленте Открыть оригинал
#ai#startups#tech

Подробности

Компания Speechify, занимающаяся голосовым искусственным интеллектом, только что запустила собственное приложение для Windows, которое использует локально хранимые модели для обеспечения диктовки в приложениях и чтения вслух статей, документов или PDF-файлов с использованием своей библиотеки голосов.

Компания конкурирует с такими компаниями, как Wispr Flow, Willow и Superwhisper, которые также предоставляют приложения для диктовки и транскрипции на разных платформах.

Speechify сообщил, что приложение для Windows выполняет обработку голоса полностью на устройстве на ПК Copilot+ (с NPU от AMD, Intel и Qualcomm) и других ПК с Windows 11, оснащенных графическими процессорами Intel и AMD.

Приложение имеет три модели, работающие на устройстве: нейронное преобразование текста в речь, обнаружение голосовой активности в реальном времени и транскрипция с помощью Whisper. Пользователи могут настроить приложение для переключения на облачные модели или даже изменять их во время использования.

Компания, у которой более 50 миллионов пользователей, заявила, что VITS Neural может генерировать звук с семью различными предустановками скорости, что позволяет пользователям читать вслух документы или веб-страницы. Компания использует модель с открытым исходным кодом Silero для обнаружения голосовой активности.