OpenAI Realtime API 促进低延迟、多模态通信,支持构建语音代理等应用,支持语音到语音、音频/图像/文本输入以及音频/文本输出。
Zavi AI 是一款先进的语音输入键盘,可即时将自然语音转换为清晰、专业的文本,并自动删除填充词和修复所有应用程序中的语法错误。
Dictato 是一款专为 Mac 设计的私密、设备端听写应用,它利用 Whisper、Parakeet 或 Apple 引擎即时将语音转换为文本,并应用于所有应用程序中。
Thinklet 是一款由人工智能驱动、以语音优先的笔记应用程序,可即时将口述想法转录成有条理的笔记,并允许用户在本地设备上与他们自己的知识库进行聊天。
Willow Voice 是一款智能、具备上下文感知的 AI 语音转文本听写软件,适用于 Mac、Windows 和 iOS,旨在通过即时将自然语音转化为完美文本来提高工作效率。
闪电说 AI 语音输入法是一款端侧优先的 AI 语音输入工具,声称比传统打字快4倍,并提供毫秒级响应和强大的AI智能纠错功能,支持所有应用。
ClawdTalk 弥合了基于文本的机器人(如使用 OpenClaw 构建的机器人)与真实世界语音通信之间的差距,允许用户像拨打电话一样呼叫他们的机器人。
一个免费的在线工具,可将音频和视频文件转换为45种以上语言的准确文本记录。它支持多种文件格式,无需下载或注册。
MiniCPM-o 4.5 是一款功能强大的多模态人工智能模型,专为视觉、语音和全双工直播流设计,提供先进的视觉理解、语音合成和实时交互能力,采用紧凑的9B参数架构。
Voxtral 是一款先进的语音转文本平台,提供实时和批量转录,支持说话人分离、多语言和低延迟,适合企业和开发者使用。

您个人的 AI,能够记住您所看到、所说和听到的一切。免费、开源、100% 本地。

Voice Anywhere 是一款适用于 macOS 的即时听写工具,可以将您的语音即时转换为文本,适用于任何应用程序。
Sayline 是最有效的输入方式,使用户能够快速高效地通过强大的 AI 语音识别技术进行文本输入。
TalkMirror 是一款专业的语音反馈工具,专为语言学习者、公众演讲者和演员设计,通过语音反射提供即时自我纠正。
Qlay 提供基于人工智能的监考监督,确保评估过程的透明性。

通过 BlabbyAI 的 Chrome 扩展轻松将语音转换为文本。
Poised 是一款由人工智能驱动的沟通教练,提供实时反馈,帮助您在通话中自信地表达。
由人工智能驱动的转录服务,将音频和视频文件转换为文本。
AIMIX智剪是一款智能视频编辑软件,能够快速批量制作原创短视频,利用人工智能实现自动生成字幕和语音合成等功能。
AssemblyAI 提供行业领先的语音 AI 模型,用于将语音转录为文本并从语音数据中提取见解。