Manifest
Manifest es un router LLM de código abierto para OpenClaw: intercepta consultas, puntúa localmente y enruta al modelo más rentable con control de costes.
¿Qué es Manifest?
Manifest es el router LLM de código abierto para OpenClaw. Intercepta tus consultas y envía cada solicitud al modelo que determina como la opción más rentable, con el objetivo de reducir los costes de uso de tokens.
Según la página del proyecto, Manifest realiza la puntuación de consultas localmente en tu máquina (en menos de 2 ms) y luego enruta la solicitud al modelo más adecuado. También rastrea el coste de tokens y mensajes, con la posibilidad de establecer límites de uso o alertas.
Características clave
- Puntuación local de consultas para decisiones de enrutamiento: Manifest analiza cada consulta localmente en menos de 2 ms antes de reenviarla.
- Enruta al modelo más rentable: En lugar de enviar todo el tráfico a un solo modelo, Manifest selecciona el modelo más apropiado por solicitud.
- Seguimiento de costes por mensaje: La página describe la medición del coste de tokens para mensajes y ofrece guías para monitorear ahorros.
- Límites de uso y alertas: Puedes establecer límites o alertas cuando se supera el presupuesto.
- Telemetría centrada en la privacidad: La página indica que Manifest no recopila tu contenido; solo usa metadatos de telemetría y realiza la puntuación de consultas en el dispositivo. También menciona una “versión en la nube” descrita como un proxy ciego para soportar la privacidad por diseño.
- Telemetría compatible con OpenTelemetry: Manifest utiliza el estándar OpenTelemetry para recopilar y exportar datos de telemetría.
- Código abierto e inspeccionable: Manifest es completamente de código abierto, diseñado para ser inspeccionable, extensible y autoalojable (sin cajas negras).
- Plugin nativo de OpenClaw: La instalación se describe como un comando único sin necesidad de codificar.
Cómo usar Manifest
- Instala Manifest como plugin nativo de OpenClaw usando el instalador de un solo comando descrito en la página.
- Configura OpenClaw para usar Manifest y que las solicitudes se intercepten antes de la selección del modelo.
- Comienza a enviar solicitudes a través de OpenClaw; Manifest puntuará cada consulta localmente y la enrutará al modelo seleccionado.
- Revisa los datos de costes y tokens generados por Manifest, luego establece límites de uso o alertas para mantenerte dentro de tu presupuesto.
- Si exportas telemetría, usa el formato OpenTelemetry descrito por el proyecto para integrarlo en tu flujo de observabilidad.
Casos de uso
- Reduce gastos cuando las consultas varían en complejidad: Cuando algunas tareas son pequeñas (o requieren menos capacidad) y otras son más exigentes, Manifest puede enrutar cada solicitud a un modelo más rentable.
- Impón presupuestos en despliegues activos: Los equipos pueden establecer límites de uso o alertas para pausar costes o activar notificaciones al alcanzar umbrales de gasto.
- Opera con restricciones de privacidad: Si prefieres toma de decisiones en el dispositivo, la página indica que la puntuación de consultas ocurre en tu máquina y no se recopila contenido (solo metadatos de telemetría).
- Monitorea y audita costes de uso de modelos: Al rastrear el coste de cada mensaje y exportar telemetría vía OpenTelemetry, puedes entender cómo varía el gasto en tokens con el tiempo.
- Autoalojamiento o inspección de la lógica de enrutamiento: Como Manifest es de código abierto y soporta inspección/autoalojamiento, los desarrolladores pueden revisar y adaptar el comportamiento a su entorno.
Preguntas frecuentes
¿Recopila Manifest mi contenido?
La página indica que Manifest no recopila tu contenido y solo usa metadatos de telemetría. También describe la puntuación de consultas como un proceso que ocurre en tu máquina.
¿Cómo decide Manifest qué modelo usar?
Manifest analiza cada consulta localmente (en menos de 2 ms, según la página) y enruta la solicitud al modelo más adecuado/rentable basado en esa puntuación local.
¿Puedo monitorear cuántos tokens y costes se están usando?
Sí. La página describe el seguimiento del coste de tokens/mensajes y ofrece funcionalidad para establecer límites o alertas cuando se supera tu presupuesto.
¿Es Manifest de código abierto?
Sí. La página dice que Manifest es completamente de código abierto y puede inspeccionarse, extenderse o autoalojarse.
¿Cómo se maneja la telemetría?
Manifest utiliza el estándar OpenTelemetry para recopilar y exportar datos de telemetría. La página también enfatiza la privacidad al indicar que solo recopila metadatos de telemetría.
Alternativas
- Servicios de enrutamiento LLM autogestionados: En lugar de un plugin de OpenClaw, puedes ejecutar tu propio servicio de router que seleccione modelos por solicitud, intercambiando comodidad por control personalizado sobre enrutamiento y puntuación.
- Observabilidad basada en OpenTelemetry sin enrutamiento: Si tu objetivo principal es monitorear costes y uso de modelos, puedes centrarte en herramientas de telemetría/observabilidad en vez de selección y enrutamiento de modelos.
- Despliegues de un solo modelo con selección manual: Algunos entornos enrutan todas las solicitudes a un modelo (o requieren que el cliente elija). Es más simple, pero no busca cambiar de modelo por consulta según rentabilidad.
- Otros enfoques de proxy/gateway de IA: Dependiendo de tu stack, puedes usar un patrón de gateway/proxy de IA para mediar solicitudes, aunque el flujo de trabajo puede diferir del modelo de plugin de OpenClaw descrito por Manifest.
Alternativas
AakarDev AI
AakarDev AI es una plataforma poderosa que simplifica el desarrollo de aplicaciones de IA con integración fluida de bases de datos vectoriales, permitiendo un despliegue y escalabilidad rápidos.
BenchSpan
BenchSpan ejecuta benchmarks de agentes con IA en paralelo, registra puntuaciones y fallos en un historial organizado y ayuda a reproducir resultados por commit.
Edgee
Edgee es un gateway de IA nativo en el edge que comprime prompts antes de llegar a los proveedores. API compatible con OpenAI para enrutar 200+ modelos.
LobeHub
LobeHub es una plataforma de código abierto diseñada para construir, desplegar y colaborar con compañeros de equipo de agentes de IA, funcionando como una interfaz web universal para LLM.
Claude Opus 4.5
Presentamos el mejor modelo del mundo para codificación, agentes, uso de computadoras y flujos de trabajo empresariales.
Codex Plugins
Usa Codex Plugins para combinar skills, integraciones de apps y servidores MCP en flujos reutilizables que amplían el acceso de Codex a Gmail, Drive y Slack.