UStackUStack
Manifest icon

Manifest

Manifest é um roteador open source de LLM para OpenClaw que intercepta consultas, pontua localmente e roteia para o modelo mais custo-efetivo.

Manifest

O que é Manifest?

Manifest é o roteador open source de LLM para OpenClaw. Ele intercepta suas consultas e envia cada solicitação para o modelo que determina ser a escolha mais custo-efetiva, visando reduzir os custos de uso de tokens.

De acordo com a página do projeto, o Manifest realiza a pontuação de consultas localmente na sua máquina (em menos de 2ms) e, em seguida, roteia a solicitação para o modelo mais adequado. Ele também rastreia o custo de tokens e mensagens, com a possibilidade de definir limites de uso ou alertas.

Principais Recursos

  • Pontuação local de consultas para decisões de roteamento: O Manifest analisa cada consulta localmente em menos de 2ms antes de encaminhar a solicitação.
  • Roteamento para o modelo mais custo-efetivo: Em vez de enviar todo o tráfego para um único modelo, o Manifest seleciona o modelo mais apropriado por solicitação.
  • Rastreamento de custos por mensagem: A página descreve a medição de custo de tokens para mensagens e fornece orientações para monitoramento de economias.
  • Limites de uso e alertas: Você pode definir limites ou alertas quando o orçamento for excedido.
  • Telemetria focada em privacidade: A página afirma que o Manifest não coleta seu conteúdo; ele usa apenas metadados de telemetria e realiza a pontuação de consultas no dispositivo. Também menciona uma “versão em nuvem” descrita como um proxy cego para suportar privacidade por arquitetura.
  • Telemetria compatível com OpenTelemetry: O Manifest usa o padrão OpenTelemetry para coletar e exportar dados de telemetria.
  • Open source e inspectável: O Manifest é totalmente open source, projetado para ser inspectável, extensível e auto-hospedável (sem caixas-pretas).
  • Plugin nativo do OpenClaw: A instalação é descrita como um setup de um comando, sem necessidade de codificação.

Como Usar o Manifest

  1. Instale o Manifest como um plugin nativo do OpenClaw usando o instalador de um comando descrito na página.
  2. Configure o OpenClaw para usar o Manifest, de modo que as solicitações sejam interceptadas antes da seleção do modelo.
  3. Comece a enviar solicitações pelo OpenClaw; o Manifest pontuará cada consulta localmente e a roteará para o modelo selecionado.
  4. Revise os dados de custo e tokens gerados pelo Manifest, depois defina limites de uso ou alertas para permanecer dentro do seu orçamento.
  5. Se você exportar telemetria, use o formato OpenTelemetry descrito pelo projeto para integrar ao seu fluxo de observabilidade.

Casos de Uso

  • Reduza gastos quando as consultas variam em complexidade: Quando algumas tarefas são pequenas (ou exigem menos capacidade) e outras são mais exigentes, o Manifest pode rotear cada solicitação para um modelo mais custo-efetivo.
  • Impõe orçamentos em implantações ativas: Equipes podem definir limites de uso ou alertas para que os custos pausem ou notificações sejam acionadas ao atingir limites de gastos.
  • Opere com restrições de privacidade: Se você preferir tomada de decisão no dispositivo, a página afirma que a pontuação de consultas ocorre na sua máquina e o conteúdo não é coletado (apenas metadados de telemetria).
  • Monitore e audite custos de uso de modelos: Ao rastrear o custo de cada mensagem e exportar telemetria via OpenTelemetry, você pode entender como o gasto de tokens muda ao longo do tempo.
  • Auto-hospede ou inspecione a lógica de roteamento: Como o Manifest é open source e suporta inspeção/auto-hospedagem, desenvolvedores podem revisar e adaptar o comportamento ao seu ambiente.

FAQ

O Manifest coleta meu conteúdo?

A página afirma que o Manifest não coleta seu conteúdo e usa apenas metadados de telemetria. Também descreve a pontuação de consultas como ocorrendo na sua máquina.

Como o Manifest decide qual modelo usar?

O Manifest analisa cada consulta localmente (em menos de 2ms, conforme a página) e roteia a solicitação para o modelo mais adequado/custo-efetivo com base nessa pontuação local.

Posso monitorar quanto de tokens e custo estão sendo usados?

Sim. A página descreve o rastreamento de custo de tokens/mensagens e fornece funcionalidade para definir limites ou alertas quando o orçamento for excedido.

O Manifest é open source?

Sim. A página diz que o Manifest é totalmente open source e pode ser inspecionado, estendido ou auto-hospedado.

Como a telemetria é tratada?

O Manifest usa o padrão OpenTelemetry para coletar e exportar dados de telemetria. A página também enfatiza a privacidade, afirmando que coleta apenas metadados de telemetria.

Alternativas

  • Serviços de roteamento LLM gerenciados por você: Em vez de um plugin OpenClaw, você pode executar seu próprio serviço de roteador que seleciona modelos por solicitação, trocando conveniência por controle personalizado sobre roteamento e pontuação.
  • Observabilidade baseada em OpenTelemetry sem roteamento: Se seu objetivo principal é monitorar custo e uso de modelos, você pode focar em ferramentas de telemetria/observabilidade em vez de seleção e roteamento de modelos.
  • Implantações de modelo único com seleção manual de modelo: Algumas configurações roteiam todas as solicitações para um modelo (ou exigem que o cliente escolha). Isso é mais simples, mas não visa alternar modelos por consulta com base na eficiência de custo.
  • Outras abordagens de proxy/gateway de IA: Dependendo de sua pilha, você pode usar um padrão de gateway/proxy de IA para mediar solicitações, embora o fluxo de trabalho possa diferir do modelo de plugin OpenClaw descrito pelo Manifest.
Manifest | UStack