UStackUStack
OpenMolt icon

OpenMolt

OpenMolt te permite crear agentes de IA programáticos en Node.js que piensan, planifican y actúan con herramientas, integraciones y memoria.

OpenMolt

¿Qué es OpenMolt?

OpenMolt es un sistema programático para Node.js que te permite crear agentes de IA que piensan, planifican y actúan desde tu código base. En lugar de ejecutar la lógica de los agentes en una interfaz de usuario separada, defines agentes, conectas herramientas e integraciones, y orquestas su comportamiento directamente desde el código de tu aplicación.

El propósito principal es ayudarte a construir flujos de trabajo de agentes orientados a producción —agentes que usan herramientas, generan salidas estructuradas y son con estado— manteniendo las credenciales de API en tu servidor.

Características clave

  • Creación programática de agentes para Node.js: Crea agentes desde tu código con una API compatible con JavaScript/TypeScript.
  • Soporte multi-proveedor de LLM mediante cadenas de modelo unificadas: Usa un formato de modelo consistente para cambiar entre proveedores como OpenAI GPT-4o, Anthropic Claude y Google Gemini.
  • Modelo de seguridad con permisos basados en ámbito: Las credenciales se almacenan en el servidor; las llamadas a herramientas se convierten en solicitudes HTTP para que el LLM reciba resultados de herramientas y no claves o tokens de API crudos.
  • Herramientas e integraciones declarativas: Define herramientas como datos (punto final, plantilla de autenticación y esquemas) para evitar escribir código HTTP repetitivo.
  • Salida estructurada con esquemas Zod: Proporciona un esquema Zod y recibe un objeto validado y tipado en lugar de analizar manualmente las respuestas del LLM.
  • Programación y automatización estilo cron: Ejecuta agentes en horarios por intervalo o cron diarios con soporte de zona horaria.
  • Visibilidad impulsada por eventos en el bucle de razonamiento: Engancha en pasos del bucle para observar llamadas a herramientas, actualizaciones de planes, salidas del LLM y resultados finales.
  • Memoria persistente con callbacks: Mantén tiendas de memoria a largo y corto plazo y usa callbacks onUpdate para persistir la memoria externamente; los agentes pueden actualizar la memoria durante la ejecución.

Cómo usar OpenMolt

  1. Instala el paquete en tu proyecto de Node.js.
  2. Inicializa OpenMolt con la configuración de tu proveedor de LLM elegido (por ejemplo, establece la clave de API de OpenAI mediante una variable de entorno).
  3. Crea un agente con un nombre, identificador de modelo (usando el formato de cadena de modelo unificado) e instrucciones.
  4. Ejecuta el agente con un prompt de usuario desde el código de tu aplicación.

Flujo de ejemplo mostrado en el sitio:

  • Instala: npm install openmolt
  • Crea y ejecuta un agente: instancia OpenMolt, llama a createAgent(...), luego agent.run('...') y registra el resultado.

Casos de uso

  • Automatización de informes diarios: Programa un agente para extraer métricas (p. ej., de Stripe) cada mañana, generar un resumen y publicar el informe en un canal de Slack.
  • Pipelines de contenido multi-paso: Usa un agente para escribir contenido basado en una descripción de estrategia, generar activos relacionados y guardar salidas en disco como parte de un flujo de trabajo de extremo a extremo.
  • Redacción de correos con revisión humana: Redacta respuestas a mensajes entrantes de Gmail basadas en directrices proporcionadas, manteniendo la revisión y el envío dentro de Gmail.
  • Automatización de flujos de trabajo de desarrolladores: Activa tareas relacionadas con GitHub como clasificar incidencias, aplicar etiquetas, publicar notas de lanzamiento en Slack y generar changelogs como parte de CI/CD.
  • Operaciones y reportes de comercio: Monitorea pedidos de Shopify, actualiza registros en Airtable, envía notificaciones vía Twilio y publica resúmenes diarios de ingresos en un tablero de Notion.

Preguntas frecuentes

¿Qué significa OpenMolt por “agentes de IA programáticos”?

OpenMolt está diseñado para que definas agentes, herramientas y flujos de trabajo desde tu código base de Node.js/TypeScript, en lugar de configurar y ejecutar agentes a través de una interfaz de usuario separada.

¿Puedo usar múltiples proveedores de LLM con el mismo código de agente?

La documentación indica que OpenMolt soporta múltiples proveedores de LLM (incluyendo OpenAI, Anthropic Claude y Google Gemini) mediante un formato de cadena de modelo unificado, permitiendo cambiar de proveedor sin modificar tu código.

¿Cómo maneja OpenMolt las claves de API y el acceso de los agentes a herramientas?

OpenMolt usa un modelo de permisos basado en ámbito: las credenciales se almacenan en el servidor e insertan en solicitudes HTTP vía plantillas Liquid. El LLM recibe resultados de herramientas (salidas de herramientas) en lugar de claves o tokens de API crudos.

¿Qué tipo de salidas puede devolver mi agente?

OpenMolt soporta salida estructurada usando esquemas Zod; puedes proporcionar un esquema y recibir un objeto validado y tipado.

¿OpenMolt soporta ejecuciones recurrentes y automatización?

Sí. Soporta programación con ejecuciones basadas en intervalos y horarios cron diarios, incluyendo soporte de zona horaria.

Alternativas

  • Plataformas de flujos de trabajo de agentes low-code: Herramientas que ofrecen constructores visuales para integrar LLMs, prompts y acciones. Pueden ser más rápidas para prototipar, pero suelen desplazar la configuración fuera de tu código de aplicación.
  • Herramientas generales de flujos de trabajo/orquestación con llamadas a LLMs: Alternativas centradas en construir flujos de trabajo (pasos, programación, reintentos) mientras implementas tú mismo las llamadas a LLMs/herramientas. Comparadas con OpenMolt, podrías necesitar más código de pegamento para salidas estructuradas, definiciones de herramientas y patrones de memoria.
  • Frameworks de agentes de código abierto en otros ecosistemas: Bibliotecas de agentes en Python u otros lenguajes que proporcionan conceptos similares (herramientas, memoria, salidas estructuradas). Las diferencias suelen reducirse a la integración de lenguaje/tiempo de ejecución (Node.js vs otras pilas) y el nivel de integraciones integradas y patrones de seguridad.
  • Servicios personalizados de llamada a herramientas: Construir tu propio ejecutor de agentes y registro de herramientas puede ofrecer el máximo control, pero generalmente requiere más esfuerzo de ingeniería para programación, validación de salidas estructuradas y persistencia de memoria.