TongueType
TongueType — macOS приложение для голосового ввода с локальной расшифровкой речи через Whisper AI и вставкой текста в месте курсора. Поддерживает аудио и видеофайлы, без облака, аккаунтов и подписок.
Что такое TongueType?
TongueType — это macOS-приложение для голосового ввода, которое позволяет пользователям нажать горячую клавишу, говорить и отпустить ее, чтобы вставить расшифрованный текст в месте курсора. Оно локально запускает Whisper AI на Mac с Apple Silicon, поэтому распознавание происходит на устройстве, а не в облаке.
Приложение создано для быстрого ввода текста без использования рук в таких местах, как почта, чаты, заметки, промпты и комментарии к коду. Оно также поддерживает расшифровку аудио- и видеофайлов, что делает его полезным для преобразования записанной речи в текст без загрузки файлов во внешние сервисы.
Основные возможности
- Локальная расшифровка с Whisper AI на Mac с Apple Silicon, так что аудио остается на устройстве.
- Рабочий процесс диктовки push-to-talk: удерживайте горячую клавишу, говорите, затем отпустите, чтобы вставить текст туда, где находится курсор.
- Поддержка 12 языков с автоматическим определением языка.
- Расшифровка файлов WAV, MP3, MP4 и MOV, что расширяет возможности приложения за пределы живой диктовки.
- Приложение в меню-баре без значка в Dock и основного окна, чтобы оно было доступно, не занимая место на рабочем столе.
- Параметры настройки горячей клавиши, времени активации, режима фиксации двойным нажатием, внешнего вида оверлея и поведения вставки.
- Правила постобработки для удаления пометок вроде [music] или (laughter), отмены диктовки голосовыми фразами и сопоставления голосовых команд, таких как «новая строка» или «вопросительный знак».
- Синхронизация настроек через iCloud между Mac, чтобы предпочтения пользователя переходили между устройствами.
Как пользоваться TongueType
Установите приложение на совместимый Mac, затем задайте горячую клавишу или оставьте стандартную. Когда нужно продиктовать текст, удерживайте клавишу, говорите естественно и отпустите ее, чтобы вставить расшифровку в текущее приложение в позицию курсора.
Для записей перетащите поддерживаемый аудио- или видеофайл в TongueType и дайте ему локально расшифровать содержимое. Перед регулярным использованием пользователи также могут настроить язык, внешний вид и очистку текста.
Сценарии использования
- Быстрее писать письма или сообщения в Slack, особенно когда хочется говорить вместо переключения контекста на набор текста.
- Сразу вводить комментарии к коду, промпты или короткие технические заметки в редактор.
- Расшифровывать записи встреч, интервью или голосовые заметки в форматах WAV, MP3, MP4 или MOV.
- Использовать диктовку в сценарии с повышенными требованиями к приватности, где аудио должно оставаться на Mac.
- Помогать пользователям, которым ввод с клавиатуры кажется болезненным, медленным или неудобным, и нужен голос как альтернативный способ ввода.
FAQ
TongueType работает через облако?
Нет. В источнике указано, что расшифровка выполняется локально на Mac с Whisper AI, и аудио не покидает устройство.
Поддерживает ли TongueType живую диктовку и расшифровку файлов?
Да. Он поддерживает живую диктовку в режиме push-to-talk, а также расшифровку поддерживаемых аудио- и видеофайлов.
Какие языки поддерживаются?
На странице указано, что TongueType поддерживает 12 языков и включает автоопределение, но полный список языков не приводится, кроме примеров: английский, испанский, французский, немецкий, японский, китайский и корейский.
Есть ли бесплатная версия?
Да. На странице сказано, что бесплатная версия включает все функции, с 30 минутами живой диктовки в месяц и ограничением расшифровки файлов первыми 10 секундами каждого файла.
На какой платформе он работает?
TongueType предназначен для macOS 14+ на Mac с Apple Silicon.
Альтернативы
- Встроенная диктовка macOS: более простой системный вариант для базового преобразования речи в текст, но, судя по всему, без такого же локального рабочего процесса на базе Whisper и без описанных здесь возможностей настройки.
- Облачные приложения для диктовки: они могут предлагать кроссплатформенный доступ или синхронизацию через аккаунт, но обычно передают аудио через внешние сервисы, а не оставляют расшифровку полностью локальной.
- Общие инструменты транскрибации: приложения, ориентированные на преобразование записей в текст, могут подойти, если главная задача — расшифровка файлов, но они могут быть не оптимизированы для мгновенной вставки в активное приложение.
- Расширения для голосового ввода или утилиты доступности: они могут помочь пользователям, которым нужен голос как альтернатива вводу, хотя могут делать упор на другие сценарии — системное управление, функции доступности или заметки — а не на диктовку через горячую клавишу.
Альтернативы
Speech to Text Converter Online
Бесплатный онлайн-инструмент, который преобразует аудио- и видеофайлы в точные текстовые транскрипции на более чем 45 языках. Поддерживает множество форматов файлов и не требует загрузок или регистрации.
Dictato
Dictato — офлайн диктовка речи в текст для macOS без облака и тайм-аута: расшифровка на устройстве и вставка в любое приложение.
Ringg Parrot STT V1
Ringg Parrot STT V1 — API распознавания речи для потоковой и файловой транскрибации хинди, английского и смешанной речи с низкой задержкой.
Sanota
Sanota превращает ваш голос в четкий и красивый текст — чтобы легко сохранять воспоминания и идеи. Начните бесплатно.
Carbon Voice
Carbon Voice — асинхронное приложение для голосовых сообщений команд с людьми и AI-агентами. Отправляйте расшифрованные голосовые обновления с desktop, mobile, watch и widgets.
OpenAI Realtime API
Создавайте голосовые и realtime-аудио-сценарии с низкой задержкой с OpenAI Realtime API: браузерные voice agents и realtime-транскрипция.