Manifest
Manifest é um roteador open source de LLM para OpenClaw que intercepta consultas, pontua localmente e roteia para o modelo mais custo-efetivo.
O que é Manifest?
Manifest é o roteador open source de LLM para OpenClaw. Ele intercepta suas consultas e envia cada solicitação para o modelo que determina ser a escolha mais custo-efetiva, visando reduzir os custos de uso de tokens.
De acordo com a página do projeto, o Manifest realiza a pontuação de consultas localmente na sua máquina (em menos de 2ms) e, em seguida, roteia a solicitação para o modelo mais adequado. Ele também rastreia o custo de tokens e mensagens, com a possibilidade de definir limites de uso ou alertas.
Principais Recursos
- Pontuação local de consultas para decisões de roteamento: O Manifest analisa cada consulta localmente em menos de 2ms antes de encaminhar a solicitação.
- Roteamento para o modelo mais custo-efetivo: Em vez de enviar todo o tráfego para um único modelo, o Manifest seleciona o modelo mais apropriado por solicitação.
- Rastreamento de custos por mensagem: A página descreve a medição de custo de tokens para mensagens e fornece orientações para monitoramento de economias.
- Limites de uso e alertas: Você pode definir limites ou alertas quando o orçamento for excedido.
- Telemetria focada em privacidade: A página afirma que o Manifest não coleta seu conteúdo; ele usa apenas metadados de telemetria e realiza a pontuação de consultas no dispositivo. Também menciona uma “versão em nuvem” descrita como um proxy cego para suportar privacidade por arquitetura.
- Telemetria compatível com OpenTelemetry: O Manifest usa o padrão OpenTelemetry para coletar e exportar dados de telemetria.
- Open source e inspectável: O Manifest é totalmente open source, projetado para ser inspectável, extensível e auto-hospedável (sem caixas-pretas).
- Plugin nativo do OpenClaw: A instalação é descrita como um setup de um comando, sem necessidade de codificação.
Como Usar o Manifest
- Instale o Manifest como um plugin nativo do OpenClaw usando o instalador de um comando descrito na página.
- Configure o OpenClaw para usar o Manifest, de modo que as solicitações sejam interceptadas antes da seleção do modelo.
- Comece a enviar solicitações pelo OpenClaw; o Manifest pontuará cada consulta localmente e a roteará para o modelo selecionado.
- Revise os dados de custo e tokens gerados pelo Manifest, depois defina limites de uso ou alertas para permanecer dentro do seu orçamento.
- Se você exportar telemetria, use o formato OpenTelemetry descrito pelo projeto para integrar ao seu fluxo de observabilidade.
Casos de Uso
- Reduza gastos quando as consultas variam em complexidade: Quando algumas tarefas são pequenas (ou exigem menos capacidade) e outras são mais exigentes, o Manifest pode rotear cada solicitação para um modelo mais custo-efetivo.
- Impõe orçamentos em implantações ativas: Equipes podem definir limites de uso ou alertas para que os custos pausem ou notificações sejam acionadas ao atingir limites de gastos.
- Opere com restrições de privacidade: Se você preferir tomada de decisão no dispositivo, a página afirma que a pontuação de consultas ocorre na sua máquina e o conteúdo não é coletado (apenas metadados de telemetria).
- Monitore e audite custos de uso de modelos: Ao rastrear o custo de cada mensagem e exportar telemetria via OpenTelemetry, você pode entender como o gasto de tokens muda ao longo do tempo.
- Auto-hospede ou inspecione a lógica de roteamento: Como o Manifest é open source e suporta inspeção/auto-hospedagem, desenvolvedores podem revisar e adaptar o comportamento ao seu ambiente.
FAQ
O Manifest coleta meu conteúdo?
A página afirma que o Manifest não coleta seu conteúdo e usa apenas metadados de telemetria. Também descreve a pontuação de consultas como ocorrendo na sua máquina.
Como o Manifest decide qual modelo usar?
O Manifest analisa cada consulta localmente (em menos de 2ms, conforme a página) e roteia a solicitação para o modelo mais adequado/custo-efetivo com base nessa pontuação local.
Posso monitorar quanto de tokens e custo estão sendo usados?
Sim. A página descreve o rastreamento de custo de tokens/mensagens e fornece funcionalidade para definir limites ou alertas quando o orçamento for excedido.
O Manifest é open source?
Sim. A página diz que o Manifest é totalmente open source e pode ser inspecionado, estendido ou auto-hospedado.
Como a telemetria é tratada?
O Manifest usa o padrão OpenTelemetry para coletar e exportar dados de telemetria. A página também enfatiza a privacidade, afirmando que coleta apenas metadados de telemetria.
Alternativas
- Serviços de roteamento LLM gerenciados por você: Em vez de um plugin OpenClaw, você pode executar seu próprio serviço de roteador que seleciona modelos por solicitação, trocando conveniência por controle personalizado sobre roteamento e pontuação.
- Observabilidade baseada em OpenTelemetry sem roteamento: Se seu objetivo principal é monitorar custo e uso de modelos, você pode focar em ferramentas de telemetria/observabilidade em vez de seleção e roteamento de modelos.
- Implantações de modelo único com seleção manual de modelo: Algumas configurações roteiam todas as solicitações para um modelo (ou exigem que o cliente escolha). Isso é mais simples, mas não visa alternar modelos por consulta com base na eficiência de custo.
- Outras abordagens de proxy/gateway de IA: Dependendo de sua pilha, você pode usar um padrão de gateway/proxy de IA para mediar solicitações, embora o fluxo de trabalho possa diferir do modelo de plugin OpenClaw descrito pelo Manifest.
Alternativas
AakarDev AI
AakarDev AI é uma plataforma poderosa que simplifica o desenvolvimento de aplicações de IA com integração perfeita de banco de dados vetorial, permitindo implantação rápida e escalabilidade.
BenchSpan
BenchSpan executa benchmarks de agentes de IA em paralelo, registra scores e falhas em um histórico organizado e facilita reprodutibilidade por commit.
Edgee
Edgee é um gateway de IA nativo na borda que comprime prompts antes de chegar a provedores de LLM, com uma API compatível com OpenAI.
LobeHub
LobeHub é uma plataforma de código aberto projetada para construir, implantar e colaborar com companheiros de equipe de IA, funcionando como uma Interface Web Universal de LLM.
Claude Opus 4.5
Apresentando o melhor modelo do mundo para codificação, agentes, uso de computadores e fluxos de trabalho empresariais.
Codex Plugins
Use Codex Plugins para combinar skills, integrações de apps e servidores MCP em fluxos reutilizáveis, ampliando o acesso do Codex a Gmail, Drive e Slack.