OpenAI Realtime API는 음성-음성 변환, 오디오/이미지/텍스트 입력 및 오디오/텍스트 출력을 지원하는 음성 에이전트와 같은 애플리케이션 구축을 위해 저지연, 멀티모달 통신을 용이하게 합니다.
Zavi AI는 자연스러운 음성을 깨끗하고 전문적인 텍스트로 즉시 변환하는 고급 음성 타이핑 키보드로, 모든 애플리케이션에서 필러 단어를 자동으로 제거하고 문법을 수정합니다.
Dictato는 Whisper, Parakeet 또는 Apple 엔진을 사용하여 모든 애플리케이션에서 음성을 텍스트로 즉시 변환하는 Mac용 개인 온디바이스 받아쓰기 앱입니다.
Thinklet은 음성 우선 메모 앱으로, 말하는 생각을 즉시 정리된 메모로 변환하고 사용자가 기기 내에서 자신의 지식 기반과 대화할 수 있게 해주는 AI 기반 애플리케이션입니다.
Willow Voice는 Mac, Windows 및 iOS에서 사용할 수 있는 지능형 상황 인식 AI 음성 딕테이션 소프트웨어로, 자연스러운 음성을 즉시 완벽한 텍스트로 변환하여 생산성을 높이도록 설계되었습니다.
闪电说 AI 语音输入법은 온디바이스(端侧) 우선의 AI 음성 입력 도구로, 기존 타이핑보다 4배 빠르다고 주장하며 밀리초급 응답 속도와 강력한 AI 지능형 오류 수정 기능을 제공하고 모든 애플리케이션을 지원합니다.
ClawdTalk은 텍스트 기반 봇(OpenClaw 등으로 구축된 봇)과 실제 음성 통신 간의 격차를 해소하여 사용자가 마치 전화 통화처럼 봇에 전화를 걸 수 있도록 합니다.
오디오 및 비디오 파일을 45개 이상의 언어로 정확한 텍스트 스크립트로 변환하는 무료 온라인 도구입니다. 다양한 파일 형식을 지원하며 다운로드나 가입이 필요 없습니다.
MiniCPM-o 4.5는 비전, 음성, 전이중 실시간 스트리밍을 위한 고성능 멀티모달 AI 모델로, 첨단 시각 이해, 음성 합성, 실시간 상호작용 기능을 9B 파라미터 아키텍처에 담아 제공합니다.
Voxtral은 Mistral AI가 개발한 고급 음성-텍스트 솔루션으로, 높은 정확도와 실시간, 배치 전사 서비스를 제공하도록 설계되었습니다. 차세대 모델을 활용하여 업계 선도적인 전사 품질, 화자 디아리제이션, 낮은 지연 시간 처리를 지원하며, 다양한 음성 기반 애플리케이션에 적합합니다. Voxtral의 제품군에는 배치 및 실시간 전사 모델이 포함되어 있으며, 각각의 사용 사례에 최적화되어 있고, 프라이버시와 효율성을 고려하여 개발되었습니다.

당신이 보는 것, 말하는 것, 듣는 모든 것을 기억하는 개인 AI입니다. 무료이고 오픈 소스이며 100% 로컬로 동작합니다.

Voice Anywhere는 macOS용 즉각적인 음성 인식 도구로, 사용자가 어떤 애플리케이션에서도 즉시 음성을 텍스트로 변환할 수 있게 해줍니다.
Sayline은 사용자가 강력한 AI 음성 인식 기술로 텍스트를 빠르고 효율적으로 받아쓰기 할 수 있도록 하는 가장 생산적인 방법입니다.
TalkMirror는 언어 학습자, 대중 연설가 및 배우를 위해 설계된 전문 음성 피드백 도구로, 음성 반사를 통해 즉각적인 자기 교정을 제공합니다.
Qlay는 투명한 평가 프로세스를 위한 AI 기반 감독 감독을 제공합니다.

BlabbyAI의 Chrome 확장 프로그램을 사용하여 음성을 손쉽게 텍스트로 변환하세요.
Poised는 통화 중 자신감 있게 말할 수 있도록 실시간 피드백을 제공하는 AI 기반 커뮤니케이션 코치입니다.
오디오 및 비디오 파일을 텍스트로 변환하는 AI 기반 전사 서비스입니다.
AIMIX智剪은 AI를 활용하여 자동 자막 생성 및 음성 합성과 같은 기능을 제공하며, 오리지널 짧은 비디오를 신속하게 배치 생산할 수 있는 지능형 비디오 편집 소프트웨어입니다.
AssemblyAI는 음성을 텍스트로 전사하고 음성 데이터에서 인사이트를 추출하기 위한 업계 최고의 음성 AI 모델을 제공합니다.