TechCrunch · AI · 1 ч назад
Приложение Speechify для Windows использует локальные модели для транскрипции и диктовки
Speechify только что запустил собственное приложение для Windows, которое использует локально хранимые модели для обеспечения диктовки и транскрипции между приложениями.
Подробности
Компания Speechify, занимающаяся голосовым искусственным интеллектом, только что запустила собственное приложение для Windows, которое использует локально хранимые модели для обеспечения диктовки в приложениях и чтения вслух статей, документов или PDF-файлов с использованием своей библиотеки голосов.
Компания конкурирует с такими компаниями, как Wispr Flow, Willow и Superwhisper, которые также предоставляют приложения для диктовки и транскрипции на разных платформах.
Speechify сообщил, что приложение для Windows выполняет обработку голоса полностью на устройстве на ПК Copilot+ (с NPU от AMD, Intel и Qualcomm) и других ПК с Windows 11, оснащенных графическими процессорами Intel и AMD.
Приложение имеет три модели, работающие на устройстве: нейронное преобразование текста в речь, обнаружение голосовой активности в реальном времени и транскрипция с помощью Whisper. Пользователи могут настроить приложение для переключения на облачные модели или даже изменять их во время использования.
Компания, у которой более 50 миллионов пользователей, заявила, что VITS Neural может генерировать звук с семью различными предустановками скорости, что позволяет пользователям читать вслух документы или веб-страницы. Компания использует модель с открытым исходным кодом Silero для обнаружения голосовой активности.