Capso 是什么?
Capso 是一款免费的开源 macOS 截图和屏幕录制应用。它旨在取代典型的截图工作流:捕获屏幕、标注捕获内容、录制视频或 GIF,以及提取文字——使用原生 macOS 应用,以 Swift 6 和 SwiftUI 构建。
Capso 将捕获模式(区域、窗口、全屏)、标注编辑器、OCR 文字识别以及录制/美化功能整合在一个界面中,而非分离工具。该项目开源且永久免费,无试用期、无订阅要求。
主要功能
- 区域、窗口和全屏捕获:从菜单栏或全局快捷键捕获,包括快速窗口抓取和拖选带实时尺寸叠加。
- 录制 MP4 和 GIF:录制视频或 GIF,支持系统音频和麦克风,可选添加摄像头画中画叠加。
- 摄像头画中画叠加(4 种形状):录制时添加可拖动摄像头叠加,支持圆形/方形/竖屏/横屏形状,带吸附角落定位和点击展开全屏视图。
- 标注编辑器:为捕获图像添加箭头、矩形、椭圆、文字、自由绘图、像素化/模糊、编号计数器和高亮,支持撤销/重做和颜色选择器。
- OCR 文字识别:选择区域检测文字并复制;Capso 可高亮检测到的文字块,支持选择性复制。
- 截图美化:使用背景渐变、内边距、圆角和投影将原始捕获转为风格化视觉,支持“Solid”或“Liquid Glass”样式选择和实时预览。
- 可配置偏好和键盘快捷键:设置截图/录制格式和质量,自定义热键,控制快速访问行为和导出预设。
- 快速访问和捕获后操作:捕获后使用浮动预览进行复制、保存、标注、OCR、置顶和拖放。
- 置顶到屏幕:将捕获保持为置顶参考叠加,带锁定模式支持点击穿透参考使用。
- 使用 Swift 6 / SwiftUI 构建且开源:应用使用 Swift 6 和 SwiftUI 开发,开源代码通过 GitHub 提供。
如何使用 Capso
- 下载并安装 Capso,从提供的 GitHub 发行版(DMG)下载,或从源码构建。
- 选择捕获模式,使用菜单栏或全局快捷键:区域、窗口或全屏。
- 对于截图,在标注编辑器中打开捕获添加标注,或应用美化样式用于分享。
- 对于录制,选择区域,开始 MP4 或 GIF 录制(可选带摄像头画中画),按需使用暂停/恢复/重启控件。
- 使用OCR 选择区域检测并复制文字,然后从捕获后预览应用快速访问操作(复制、保存、标注、OCR 或置顶)。
使用场景
- 文档和教程:捕获特定 UI 区域,用箭头/文字/标注添加说明,并应用美化(内边距、圆角、阴影)创建一致视觉效果。
- Bug 报告:录制 MP4 或 GIF(带系统音频和麦克风)展示步骤,然后添加标注或像素化/模糊敏感部分再分享。
- 从截图提取文字:选择屏幕上含文字区域,使用 Capso 的 OCR 工作流复制检测到的文字块。
- 工作时实时参考:将捕获置顶到屏幕作为叠加参考;使用锁定模式在继续使用其他应用时实现点击穿透参考。
- 屏幕演示和展示:录制带选定形状和位置的摄像头画中画视频,使用可配置控件和全局快捷键简化捕获。
常见问题
Capso 免费使用吗?
是的。Capso 永久免费,无试用、无功能限制、无订阅。
可以在工作场所使用 Capso 吗?
FAQ 说明,根据 BSL 1.1 许可,个人和公司内部使用完全允许,但禁止分叉并作为竞争性商业截图产品销售。
Capso 支持 OCR 吗?
是的。可以选择区域进行文字识别并复制检测文字。视觉高亮检测文字块支持选择性复制。
支持哪些录制格式?
Capso 支持录制视频 (MP4) 和 GIF,录制时支持系统音频和麦克风。
应用已签名和公证吗?
FAQ 说明,GitHub Releases 中的 DMG 使用 Developer ID 证书签名并经 Apple 公证,因此 macOS Gatekeeper 应允许无警告打开。
替代方案
- macOS 付费截图/标注工具:这些通常注重精致用户体验,并可能捆绑云功能;Capso 定位为免费开源选项,提供基于 Swift 的原生集成。
- 基于浏览器的截图和屏幕录制:适用于仅需 Web 工作流中轻量捕获的场景,但通常将捕获、标注和文字提取分离为不同步骤。
- macOS 基础截图 + 内置标注:适合简单截图,但无法提供 Capso 所述的录制(MP4/GIF)、摄像头画中画和 OCR 组合工作流。
- 开源捕获/标注应用:如果偏好开源工具,寻找将捕获和编辑捆绑于一体的项目;Capso 特别将标注、美化、OCR 和录制结合在同一界面中。
替代品
Tactiq
Tactiq 是一款 AI 会议助手,提供实时转录、AI 摘要、行动项和 Google Meet、Zoom 和 Teams 的自定义 AI 提示。
Tavus
Tavus 构建可在实时面对面互动中看、听并响应的 AI 系统,并通过 API 支持视频代理、数字孪生与 AI 伴侣部署。
Nolain OCR
Nolain OCR 是一款先进的光学字符识别解决方案,旨在从各种文档格式中准确提取文本和数据,从而简化文档处理工作流程。
Scriptmine
Scriptmine 从真实受众对话提取问题与热门角度,生成可上镜脚本,支持写作、编辑与录制,助你更快完成短视频内容。
Scripta
Scripta 是一款注重隐私的人工智能笔记工具,可在您的设备上直接录制、转录和总结会议内容,无需添加机器人。
DataSieve: Text to Data
DataSieve:Text to Data 可从文本和多种文件中提取邮件、日期、URL 等结构化信息,并在 iPhone/iPad/Mac 上完全离线运行。