语音转字幕
基于语音识别技术自动识别视频或音频中的语音内容,并生成带时间码的字幕时间轴,减少手工听打与切轴工作。
场辞是一款基于语音识别的视频字幕制作软件,主要用于把视频或音频中的语音自动转成字幕,并配合时间轴编辑、快捷校对和导出压制,完成完整的字幕制作流程。官网将其定位为适合多种视频内容场景的字幕工具,强调自动识别与高效编辑的组合。
公开页面说明,场辞支持多种常见音视频和字幕文件导入,提供多轨时间轴、实时预览、字幕样式调整、查找替换等功能,并可导出 SRT、ASS、TXT 或标准 MP4。文档还给出快捷键、时间码调整和黑边处理等帮助内容,说明它面向需要频繁制作和修改字幕的创作者与后期工作流。
基于语音识别技术自动识别视频或音频中的语音内容,并生成带时间码的字幕时间轴,减少手工听打与切轴工作。
支持 MP4、OGG/OGV、WEBM、MP3、WAV、OGG、AAC、AMR、WMA 以及 SRT、ASS、TXT 等文件导入,便于直接接入现有素材和字幕稿。
提供可视化时间轴、多轨制作、实时预览、拖拽缩放旋转字幕等编辑方式,适合对字幕样式和位置做精细调整。
提供字幕列表、文本编辑、查找替换、合并、切割、换行等快捷校对工具,帮助快速修正识别结果。
支持导出 SRT、ASS、TXT 和标准 MP4,也支持一键压制带字幕视频及压制参数设置,便于对接剪辑和发布流程。
适合需要把长视频或课程录音快速转成字幕的创作者,先自动识别,再在时间轴里做少量修正,减少逐句听打的时间。
适合短视频、Vlog 和节目后期制作,在时间轴上预览字幕效果、调整样式并导出 SRT,再进入剪辑软件继续合成。
适合在线教育或课程团队处理录播课字幕,利用自动识别、快捷键和查找替换工具批量修正术语与文本。
适合已经有字幕稿或字幕文件的项目,直接导入 SRT、ASS 或 TXT 后进行调整、样式设置和重新导出。
适合需要输出带字幕成片的工作流,完成字幕制作后直接压制为标准 MP4,并按需要设置压制参数。
场辞支持通过视频、音频和字幕文件导入内容,再生成字幕并导出为常见格式。帮助文档列出的导入格式包括 MP4、OGG/OGV、WEBM、MP3、WAV、OGG、AAC、AMR、WMA、SRT、ASS、TXT;导出支持标准 MP4、SRT、ASS、TXT。
可以在时间轴上创建字幕块、使用快捷键进行拍打创建,或在字幕列表中编辑时间码和文本。文档还提供了合并、切割、换行、查找替换等快捷操作,适合需要高频校对的字幕工作流。
场辞提供一键导出字幕文件,以及一键压制带字幕视频的能力,并支持压制参数设置。文档还说明导出标准 MP4 时采用 H.264 视频编码和 AAC 音频编码。
协议中写明,场辞客户端可在电脑上使用,具体终端与版本以平台提供为准;同时服务仅限在中国大陆区域使用。
协议提到若使用高级功能,可能需要支付软件使用费;但公开页面未提供具体价格、套餐或试用信息。
Pewbeam is a church presentation app that listens to sermons, detects Bible verse references in real time, and displays the matching passage on screen. It is built for pastors, projection teams, and church media volunteers who want to reduce manual slide control during live services.
Caploは、他のアプリの音声をリアルタイム翻訳字幕に変えるiPhone向けコンパニオンアプリ。字幕がない配信、アニメ、スポーツ、ポッドキャスト、講座、ニュースをPiP表示で見やすくします。
CAMB.AI Streams dubs live audio in multiple languages in real time for broadcasts on platforms like YouTube, Twitch, and X. It plugs into existing live workflows using common streaming protocols and avoids a post-production step.
Tavus is an AI video platform for building real-time, face-to-face agents, digital twins, and AI companions. It combines APIs, custom replicas, and multilingual conversational workflows for developers and teams.
Sanota is an app that turns spoken memories, reflections, and interviews into clear written stories. It supports personal storytelling, family history, and shared memories, with guided prompts and subscription pricing.
Carbon Voice is an asynchronous voice messaging app for teams and individuals, with transcripts, AI catch-up, and cross-device access. It helps people and agents communicate without needing a live call.