Vox
Vox — AI-диктовка для Mac и Windows с локальной обработкой: надиктуйте текст и вставьте очищенный результат из буфера обмена без аккаунта и интернета.
Что такое Vox?
Vox — это AI-приложение для диктовки с локальной обработкой для Mac и Windows. Оно позволяет удерживать горячую клавишу, говорить естественно и вставлять очищенный текст из буфера обмена, не отправляя аудио или расшифровки в облачный сервис.
Приложение создано для быстрого ввода текста с минимальной настройкой: в комплекте есть горячая клавиша по умолчанию, используются локальные модели транскрипции и очистки, а после первой загрузки моделей оно может работать без интернета. Vox также адаптирует стиль вывода под приложение, в которое вы печатаете, с режимами для общего текста, email, чата, комментариев к коду и заметок.
Основные возможности
- Локальная транскрипция и очистка: диктовка обрабатывается на устройстве, а не через облачный запрос.
- Поддержка Mac и Windows с отдельными горячими клавишами для каждой платформы.
- Рабочий процесс через буфер обмена: удерживаете сочетание, говорите, отпускаете, затем вставляете очищенный текст туда, куда нужно.
- Режимы голоса с учетом приложения, которые меняют форматирование для обычного текста, email, чата, комментариев к коду, заметок или пользовательского режима.
- Для использования не нужен аккаунт, и, согласно странице продукта, телеметрия диктовки не собирается.
- Работает офлайн после первой загрузки модели при первом запуске.
Как использовать Vox
Установите приложение для своей платформы, затем используйте горячую клавишу по умолчанию, чтобы начать диктовку. На Mac это ⌘⌥.; на Windows — Ctrl+Alt+..
Говорите обычно, пока Vox слушает, затем отпустите горячую клавишу, чтобы остановить. Приложение помещает очищенный текст в буфер обмена, а вы вставляете его в целевое приложение обычной командой вставки.
Сценарии использования
- Быстрее писать email, надиктовывая черновик и позволяя Vox оформить его как полноценное письмо.
- Отправлять короткие сообщения в Slack, Discord или iMessage в более неформальном, сокращенном стиле.
- Диктовать комментарии к коду или другие заметки разработчика, сохраняя идентификаторы и используя формулировки в настоящем времени.
- Фиксировать заметки с встреч, списки задач или записи для брейншторма в более чистом и структурированном виде.
- Использовать диктовку офлайн или в средах с ограниченным подключением после первой загрузки модели.
FAQ
Нужен ли Vox аккаунт?
Для личного использования аккаунт не нужен. На странице указано, что коммерческие лицензии оформляются отдельно через биллинг Stripe.
Отправляет ли Vox аудио или расшифровки в облако?
Нет. На странице продукта сказано, что аудио, расшифровки и отчеты о сбоях никогда не покидают ваше устройство.
Работает ли Vox без интернета?
Да, после одноразовой загрузки модели при первом запуске. На странице указано, что затем приложение может работать без интернета.
Какие платформы поддерживает Vox?
Vox доступен для Mac и Windows. На странице указаны Mac на Apple Silicon с macOS 14+ и Windows 10/11 x64.
Альтернативы
- Традиционные настольные инструменты диктовки, которые полагаются на облачную обработку: их может быть проще сравнить, если вам нужен speech-to-text, но обычно они используют онлайн-обработку вместо локальной.
- Встроенный голосовой ввод в операционной системе: он часто проще и уже установлен, но может не предлагать такие же режимы очистки под конкретные приложения или workflow, ориентированный на буфер обмена.
- Универсальные AI-инструменты для письма с голосовым вводом: они помогают с перефразированием и черновиками, но обычно строятся вокруг редактора или чата, а не системной диктовки.
- Ручной ввод: по-прежнему запасной вариант для точечных правок, но он не дает преимущества в скорости, которое Vox и призван обеспечить.
Альтернативы
Speech to Text Converter Online
Бесплатный онлайн-инструмент, который преобразует аудио- и видеофайлы в точные текстовые транскрипции на более чем 45 языках. Поддерживает множество форматов файлов и не требует загрузок или регистрации.
Dictato
Dictato — офлайн диктовка речи в текст для macOS без облака и тайм-аута: расшифровка на устройстве и вставка в любое приложение.
Ringg Parrot STT V1
Ringg Parrot STT V1 — API распознавания речи для потоковой и файловой транскрибации хинди, английского и смешанной речи с низкой задержкой.
Sanota
Sanota превращает ваш голос в четкий и красивый текст — чтобы легко сохранять воспоминания и идеи. Начните бесплатно.
Carbon Voice
Carbon Voice — асинхронное приложение для голосовых сообщений команд с людьми и AI-агентами. Отправляйте расшифрованные голосовые обновления с desktop, mobile, watch и widgets.
OpenAI Realtime API
Создавайте голосовые и realtime-аудио-сценарии с низкой задержкой с OpenAI Realtime API: браузерные voice agents и realtime-транскрипция.