HypeScribe: AI-транскрипция аудио/видео в текст. Точные субтитры, ИИ-саммари, инсайты и совместная работа в одном приложении.
OpenAI Realtime API обеспечивает низколатентную мультимодальную связь для создания таких приложений, как голосовые агенты, поддерживая преобразование речи в речь, аудио/изображения/текстовые входы и аудио/текстовые выходы.
Zavi AI — это усовершенствованная клавиатура для голосового набора текста, которая мгновенно преобразует естественную речь в чистый, профессиональный текст, автоматически удаляя слова-паразиты и исправляя грамматику во всех приложениях.
Dictato — это частное приложение для диктовки на устройстве для Mac, которое мгновенно преобразует речь в текст во всех приложениях с использованием движков Whisper, Parakeet или Apple.
Thinklet — это приложение для создания заметок на основе искусственного интеллекта с голосовым вводом, которое мгновенно преобразует произнесенные мысли в упорядоченные заметки и позволяет пользователям общаться со своей базой знаний локально на устройстве.
Willow Voice — это интеллектуальное программное обеспечение для диктовки с преобразованием речи в текст, осознающее контекст, доступное для Mac, Windows и iOS, разработанное для повышения производительности за счет мгновенного преобразования естественной речи в идеальный текст.
闪电说 AI 语音输入法 — это инструмент голосового ввода с приоритетом локальной обработки на базе ИИ, который заявляет о скорости на 400% выше традиционного набора текста, обеспечивает отклик на уровне миллисекунд и мощную функцию интеллектуального исправления ошибок ИИ, поддерживая при этом все приложения.
ClawdTalk устраняет разрыв между текстовыми ботами (например, созданными с помощью OpenClaw) и реальным голосовым общением, позволяя пользователям звонить своим ботам, как по обычному телефону.
Бесплатный онлайн-инструмент, который преобразует аудио- и видеофайлы в точные текстовые транскрипции на более чем 45 языках. Поддерживает множество форматов файлов и не требует загрузок или регистрации.
MiniCPM-o 4.5 — это высокоэффективная мультимодальная модель ИИ, предназначенная для обработки визуальных данных, речи и полно-дуктных прямых трансляций. Она обеспечивает передовое визуальное понимание, синтез речи и возможности взаимодействия в реальном времени в компактной архитектуре с 9 миллиардами параметров.
Voxtral — это продвинутая платформа для преобразования речи в текст, предлагающая транскрипцию в реальном времени и пакетную обработку с диаризацией, поддержкой нескольких языков и низкой задержкой, подходящую для предприятий и разработчиков.

Ваш персональный ИИ, который помнит всё, что вы видите, говорите и слышите. Бесплатно, с открытым исходным кодом, полностью локально.

Voice Anywhere — это инструмент мгновенной диктовки для macOS, который мгновенно преобразует вашу речь в текст в любом приложении.
Sayline — это самый продуктивный способ ввода текста, позволяющий пользователям быстро и эффективно диктовать текст с помощью мощной технологии диктовки на основе ИИ.
TalkMirror - это профессиональный инструмент обратной связи по голосу, разработанный для изучающих языки, публичных ораторов и актеров, обеспечивающий мгновенную самокоррекцию через голосовое отражение.
Qlay предлагает надзор за экзаменами с использованием ИИ для прозрачных процессов оценки.

Легко преобразуйте речь в текст с помощью расширения Chrome от BlabbyAI.
Poised — это коуч по коммуникации на основе ИИ, который предоставляет обратную связь в реальном времени, чтобы помочь вам уверенно говорить во время звонков.
Служба транскрипции на основе ИИ, которая преобразует аудио и видеофайлы в текст.
AIMIX智剪 - это интеллектуальное программное обеспечение для редактирования видео, которое позволяет быстро производить оригинальные короткие видео партиями, используя ИИ для таких функций, как автоматическая генерация субтитров и синтез речи.