Manifest 是什么?
Manifest 是 OpenClaw 的开源 LLM 路由器。它拦截您的查询,并将每个请求发送到其判定为最具成本效益的模型,以降低 token 使用成本。
根据项目页面,Manifest 在您的机器上本地执行查询评分(<2ms),然后将请求路由到最合适的模型。它还会跟踪 token 和消息成本,并支持设置使用限制或告警。
主要特性
- 本地查询评分用于路由决策:Manifest 在转发请求前于本地分析每个查询(<2ms)。
- 路由至最具成本效益的模型:Manifest 不会将所有流量发送至单一模型,而是为每个请求选择最合适的模型。
- 按消息跟踪成本:页面描述了测量消息 token 成本,并提供监控节省的指导。
- 使用限制与告警:您可以设置限制或告警,当预算超支时触发。
- 注重隐私的遥测:页面指出 Manifest 不收集您的内容,仅使用遥测元数据,并在设备上执行查询评分。它还提及“云版本”作为架构级隐私支持的盲代理。
- 兼容 OpenTelemetry 的遥测:Manifest 使用 OpenTelemetry 标准收集和导出遥测数据。
- 开源且可检查:Manifest 完全开源,旨在可检查、可扩展和自托管(无黑盒)。
- 原生 OpenClaw 插件:安装描述为无需编码的一键设置。
如何使用 Manifest
- 使用页面描述的一键安装器,将 Manifest 作为原生 OpenClaw 插件安装。
- 配置 OpenClaw 使用 Manifest,以便在模型选择前拦截请求。
- 通过 OpenClaw 开始发送请求;Manifest 将本地评分每个查询并路由至选定模型。
- 查看 Manifest 生成的成本和 token 数据,然后设置使用限制或告警以控制预算。
- 如导出遥测,可使用项目描述的 OpenTelemetry 格式集成至您的可观测性工作流。
使用场景
- 查询复杂度变化时降低支出:当某些任务较简单(或所需能力较低)而其他更复杂时,Manifest 可将每个请求路由至更具成本效益的模型。
- 活跃部署中强制预算:团队可设置使用限制或告警,当支出达到阈值时暂停成本或触发通知。
- 隐私约束下运行:如果偏好设备上决策,页面指出查询评分在您的机器上进行,且不收集内容(仅遥测元数据)。
- 监控和审计模型使用成本:通过跟踪每条消息成本并经 OpenTelemetry 导出遥测,您可了解 token 支出随时间变化。
- 自托管或检查路由逻辑:由于 Manifest 开源并支持检查/自托管,开发者可审阅并适配行为至其环境。
常见问题
Manifest 会收集我的内容吗?
页面指出 Manifest 不收集您的内容,仅使用遥测元数据。查询评分也在您的机器上进行。
Manifest 如何决定使用哪个模型?
Manifest 在本地分析每个查询(页面所述 <2ms),并基于本地评分将请求路由至最合适/最具成本效益的模型。
我能监控 token 和成本使用量吗?
是的。页面描述了跟踪 token/消息成本,并提供超预算时设置限制或告警的功能。
Manifest 是开源的吗?
是的。页面称 Manifest 完全开源,可检查、扩展或自托管。
遥测如何处理?
Manifest 使用 OpenTelemetry 标准收集和导出遥测数据。页面还强调仅收集遥测元数据以保障隐私。
替代方案
- 自管 LLM 路由服务:不使用 OpenClaw 插件,您可以运行自己的路由服务,按请求选择模型,以自定义路由和评分控制换取便利性。
- 基于 OpenTelemetry 的无路由可观测性:如果主要目标是监控成本和模型使用,可专注于遥测/可观测性工具,而非模型选择和路由。
- 单模型部署加手动选择:某些设置将所有请求路由至单一模型(或要求客户端选择)。这更简单,但不会基于成本效益按查询切换模型。
- 其他 AI 代理/网关方案:视技术栈而定,您可能使用 AI 网关/代理模式中介请求,尽管工作流可能不同于 Manifest 描述的 OpenClaw 插件模式。
替代品
AakarDev AI
AakarDev AI 是一个强大的平台,通过无缝的向量数据库集成简化 AI 应用程序的开发,实现快速部署和可扩展性。
BenchSpan
BenchSpan 支持 AI agent 基准并行运行,自动记录得分与失败并整理运行历史;按提交标签复现,减少失败重跑浪费的 token。
Edgee
Edgee 边缘原生 AI 网关:在请求到达 LLM 供应商前压缩提示词,提供单一 OpenAI 兼容 API,路由 200+ 模型并按 token 降本降延迟。
LobeHub
LobeHub 是一个开源平台,旨在构建、部署和协作 AI 智能体队友,它充当通用的 LLM Web UI。
Claude Opus 4.5
介绍全球最佳的编码、代理、计算机使用和企业工作流程模型。
Codex Plugins
使用 Codex Plugins 将技能、应用集成和 MCP 服务器打包成可复用工作流,扩展 Codex 访问 Gmail、Google Drive 与 Slack 等工具。