AI 语音转文字与总结
支持录音、语音和视频转文字,并提供 AI 智能总结、文本多语种翻译和对话式理解,适合会议记录、内容整理和素材检索。
录咖是一个在线 AI 音视频处理平台,提供录音/语音/视频转文字、字幕生成、文字转语音、视频翻译、视频生成和音视频总结等功能。网站将其定位为“新一代 AI 音视频处理平台”,强调在网页端即可完成常见的音视频创作与编辑任务。
从公开页面看,录咖既面向个人创作者和日常办公场景,也提供 API 文档和 API 定价,方便开发者将语音识别、字幕、翻译、合成和切片等能力接入自有系统。会员页面还说明平台采用算粒作为功能消耗单位,用户可按会员方案或按需购买算粒。
支持录音、语音和视频转文字,并提供 AI 智能总结、文本多语种翻译和对话式理解,适合会议记录、内容整理和素材检索。
可生成视频字幕,支持多语言字幕识别与翻译、单语或双语显示,以及字幕样式定制。
支持文本转语音及翻译朗读,页面提到普通话、粤语、闽南语和自定义克隆音色等能力,适用于配音和朗读。
提供视频翻译、音色克隆相关能力,支持字幕翻译、配音和导出等工作流。
可用于视频生成、视频切片、视频去水印、视频去字幕、视频裁剪、视频合并以及人声分离等处理任务。
API 文档覆盖语音转文字、视频翻译、字幕、文字转语音和视频切片等接口,便于开发者集成到自有产品中。
把会议录音、采访片段或课程视频快速转成文字,再用 AI 总结要点,减少手动整理时间。
为短视频、教程或海外内容批量生成字幕,并按需要切换单语、双语或翻译字幕。
将脚本或文案转成语音,用于旁白、播报、小说配音或多语言朗读。
把视频翻译、配音、切片、去水印和去字幕等步骤组合起来,用于重新分发或本地化处理。
通过 API 将转写、字幕、翻译、语音合成或切片能力接入自有业务流程,减少自研工作量。
录咖提供在线网页端服务,并支持通过 iPhone/iPad、Android 和 Windows 客户端使用。API 文档页也说明了开发者可以通过接口接入部分能力。
根据页面说明,录咖可用于录音转文字、视频转文字、AI字幕、文字转语音、视频翻译、视频生成、视频切片、视频去水印、人声分离和音视频总结等场景。不同功能对应的算粒消耗和权益以会员或 API 页面说明为准。
会员页说明周会员、普通包年、高级包年和商业包年都包含对应算粒与部分基础权益;其中普通会员和高级会员的主要区别是赠送算粒数量,商业会员可将生成的音视频文件用于商业及盈利用途。
会员页说明:周会员为 7 天内不满意可全额退款,且周度会员为 3 天内;API 页面说明购买后 7 天内可申请退款。具体条件以对应页面和退款政策为准。
常见问答说明,会员算粒的有效期取决于获取方式:会员套餐内附赠算粒在会员有效期内可用,单独购买的算粒自购买日起一年内有效;API 试用算粒有效期为一个月,购买算粒有效期为一年。
Pewbeam 是一款教会演示应用,可在讲道中实时聆听并识别圣经经文引用,自动在屏幕上显示对应经文,帮助牧师、投影团队和教会媒体志愿者减少现场手动切换幻灯片。
Speech to Text Converter is a browser-based transcription tool for live dictation and uploaded audio or video files. It offers a free tier for short tasks and a Pro plan for unlimited transcription, AI summaries, translation, speaker identification, and advanced exports.
An OpenAI API guide for choosing the right speech architecture for live audio, translation, transcription, speech generation, and audio-capable chat. It helps developers map each speech application to the appropriate session type, endpoint, and connection method.
Dictato 是一款适用于 Mac 的语音听写应用,可在任何 App 中将语音转写为文字,支持本地离线处理、多种转写引擎、可选润色与翻译,并提供一次性买断授权。
Voicenotes is an AI note-taking and meeting recording app that transcribes conversations, generates summaries and action items, and makes past recordings searchable with Ask AI. It also supports voice dictation, imported audio on Pro, and multilingual transcription.
Tactiq is an AI note taker for Google Meet, Zoom, and Microsoft Teams that transcribes meetings live and turns them into summaries, action items, and follow-up outputs. It is built around a Chrome extension and supports team workflows through sharing and integrations.