UStackUStack
Manifest icon

Manifest

Manifest est un routeur LLM open source pour OpenClaw : intercepte les requêtes, score localement et oriente vers le modèle le plus économique, avec suivi des coûts.

Manifest

Qu'est-ce que Manifest ?

Manifest est le routeur LLM open source pour OpenClaw. Il intercepte vos requêtes et envoie chaque demande au modèle qu'il détermine être le choix le plus économique, dans le but de réduire les coûts d'utilisation des tokens.

Selon la page du projet, Manifest effectue le scoring des requêtes localement sur votre machine (en moins de 2 ms) puis route la demande vers le modèle le plus adapté. Il suit également les coûts en tokens et messages, avec la possibilité de définir des limites d'utilisation ou des alertes.

Fonctionnalités clés

  • Scoring local des requêtes pour les décisions de routage : Manifest analyse chaque requête localement en moins de 2 ms avant de la transférer.
  • Routage vers le modèle le plus économique : Plutôt que d'envoyer tout le trafic vers un seul modèle, Manifest sélectionne le modèle le plus approprié par requête.
  • Suivi des coûts par message : La page décrit la mesure des coûts en tokens pour les messages et fournit des conseils pour surveiller les économies.
  • Limites d'utilisation et alertes : Vous pouvez définir des limites ou des alertes en cas de dépassement de budget.
  • Télémetrie axée sur la confidentialité : La page indique que Manifest ne collecte pas votre contenu ; il utilise uniquement les métadonnées de télémetrie et effectue le scoring des requêtes sur l'appareil. Elle mentionne également une « version cloud » décrite comme un proxy aveugle pour préserver la confidentialité par conception.
  • Télémetrie compatible OpenTelemetry : Manifest utilise la norme OpenTelemetry pour collecter et exporter les données de télémetrie.
  • Open source et inspectable : Manifest est entièrement open source, conçu pour être inspectable, extensible et auto-hébergeable (pas de boîtes noires).
  • Plugin natif OpenClaw : L'installation est décrite comme un processus en une commande sans codage requis.

Comment utiliser Manifest

  1. Installez Manifest en tant que plugin natif OpenClaw via l'installateur en une commande décrit sur la page.
  2. Configurez OpenClaw pour utiliser Manifest afin que les requêtes soient interceptées avant la sélection du modèle.
  3. Commencez à envoyer des requêtes via OpenClaw ; Manifest scorera chaque requête localement et la routtera vers le modèle sélectionné.
  4. Consultez les données de coûts et tokens produites par Manifest, puis définissez des limites d'utilisation ou des alertes pour respecter votre budget.
  5. Si vous exportez la télémetrie, utilisez le format OpenTelemetry décrit par le projet pour l'intégrer à votre workflow d'observabilité.

Cas d'usage

  • Réduire les dépenses quand les requêtes varient en complexité : Quand certaines tâches sont simples (ou nécessitent moins de capacités) et d'autres plus exigeantes, Manifest peut router chaque requête vers un modèle plus économique.
  • Imposer des budgets en déploiement actif : Les équipes peuvent définir des limites d'utilisation ou des alertes pour que les coûts s'arrêtent ou que des notifications se déclenchent au franchissement des seuils.
  • Opérer avec des contraintes de confidentialité : Si vous préférez la prise de décision sur appareil, la page indique que le scoring des requêtes se fait sur votre machine et que le contenu n'est pas collecté (métadonnées de télémetrie uniquement).
  • Surveiller et auditer les coûts d'utilisation des modèles : En suivant le coût de chaque message et en exportant la télémetrie via OpenTelemetry, vous pouvez comprendre l'évolution des dépenses en tokens.
  • Auto-héberger ou inspecter la logique de routage : Comme Manifest est open source et supporte l'inspection/auto-hébergement, les développeurs peuvent examiner et adapter le comportement à leur environnement.

FAQ

Manifest collecte-t-il mon contenu ?

La page indique que Manifest ne collecte pas votre contenu et utilise uniquement les métadonnées de télémetrie. Elle décrit également le scoring des requêtes comme se déroulant sur votre machine.

Comment Manifest décide-t-il quel modèle utiliser ?

Manifest analyse chaque requête localement (en moins de 2 ms, selon la page) et route la demande vers le modèle le plus adapté/économique en se basant sur ce scoring local.

Puis-je surveiller la consommation de tokens et de coûts ?

Oui. La page décrit le suivi des coûts en tokens/messages et fournit des fonctionnalités pour définir des limites ou alertes en cas de dépassement de budget.

Manifest est-il open source ?

Oui. La page indique que Manifest est entièrement open source et peut être inspecté, étendu ou auto-hébergé.

Comment la télémetrie est-elle gérée ?

Manifest utilise la norme OpenTelemetry pour collecter et exporter les données de télémetrie. La page insiste sur la confidentialité en précisant qu'elle ne collecte que les métadonnées de télémetrie.

Alternatives

  • Services de routage LLM auto-gérés : Au lieu d’un plugin OpenClaw, vous pouvez exécuter votre propre service de routage qui sélectionne les modèles par requête, en troquant la commodité contre un contrôle personnalisé sur le routage et le scoring.
  • Observabilité basée sur OpenTelemetry sans routage : Si votre objectif principal est la surveillance des coûts et de l’utilisation des modèles, vous pouvez vous concentrer sur des outils de télémétrie/observabilité plutôt que sur la sélection et le routage des modèles.
  • Déploiements mono-modèle avec sélection manuelle : Certaines configurations routent toutes les requêtes vers un seul modèle (ou exigent que le client choisisse). C’est plus simple mais ne vise pas à changer de modèle par requête en fonction de l’efficacité coût.
  • Autres approches proxy/gateway IA : Selon votre stack, vous pouvez utiliser un pattern gateway/proxy IA pour intermédier les requêtes, bien que le workflow puisse différer du modèle de plugin OpenClaw décrit par Manifest.
Manifest | UStack