Rover
Rover es un agente de IA nativo del navegador que integras con una sola etiqueta de script. Lee tu DOM y guía acciones en tu UI.
¿Qué es Rover?
Rover es un “web agent” integrado que añades a tu sitio web con una sola etiqueta de script. En lugar de responder solo con texto, puede realizar acciones en la página en vivo: hacer clic en botones, rellenar formularios, ejecutar flujos de trabajo y guiar la navegación de los usuarios.
Rover opera directamente en el navegador leyendo el DOM en vivo del sitio web, planificando un conjunto mínimo de acciones y ejecutándolas sin depender de capturas de pantalla ni de un flujo de trabajo con base de conocimientos separada.
Características principales
- Incorporación en una línea (etiqueta script): Añade Rover incluyendo
https://rover.rtrvr.ai/embed.jsen tu sitio, lo que facilita empezar a probar en tu propia UI. - Interacción nativa del DOM: Rover lee y comprende la estructura de tu página en vivo tal como lo hace el navegador, por lo que puede identificar qué hay actualmente en pantalla.
- Planificación de acciones para pasos seguros y mínimos: Selecciona la ruta más corta y segura (p. ej., clics, entradas de formularios, navegación) antes de ejecutar, en lugar de intentar interacciones ad hoc.
- Ejecución de primera parte e in-context: Rover guía a los usuarios dentro de tu interfaz existente, por lo que no necesitan seguir enlaces externos para completar tareas.
- Flujos guiados para incorporación y configuración: Puede ejecutar “tours guiados” y asistencia in-context (p. ej., incorporación, descubrimiento de funciones y listas de verificación de configuración) interactuando con la UI.
Cómo usar Rover
- Incorpora Rover en tu sitio añadiendo la etiqueta de script proporcionada a tus páginas.
- Abre la experiencia de Rover en la UI de tu sitio y describe lo que quieres que los usuarios hagan (por ejemplo, “Ayúdame con el checkout” o “Muéstrame cómo configurar mi primer flujo de trabajo”).
- Configura opciones para tu implementación usando las “boot options” documentadas, incluyendo dominios y branding (como se menciona en la página).
- Si usas flujos de trabajo con fuentes de datos, conecta la fuente de datos y crea/importa campos para que Rover pueda ejecutar el flujo de trabajo previsto dentro de tu producto.
Casos de uso
- Asistencia en checkout sin cambiar de página: Cuando un usuario pide proceder, Rover puede hacer clic y rellenar los pasos de checkout manteniendo al usuario en la misma experiencia del sitio.
- Incorporación guiada y tours del producto: Los usuarios pueden pedir ayuda como “muéstrame cómo” y Rover puede guiarlos a través de los pasos de configuración interactuando con la UI en tiempo real.
- Rellenado de formularios y autocompletado de campos: Rover puede rellenar campos de formularios (y proporcionar actualizaciones tipo estado como “rellenando automáticamente”) como parte de completar una tarea de principio a fin.
- Ejecución de flujos de trabajo dentro de la app: Rover puede ejecutar flujos de trabajo in-context, incluyendo acciones multistep como navegar a una función, crear/actualizar objetos y confirmar la finalización.
- Configuración de equipo con lista de verificación guiada: Para incorporar equipos, Rover puede guiar la secuencia de pasos (p. ej., conectar fuente de datos, importar campos, crear una plantilla de flujo de trabajo, invitar compañeros de equipo) dentro de tu producto.
Preguntas frecuentes
-
¿Requiere Rover capturas de pantalla o una base de conocimientos? La página indica que Rover no usa capturas de pantalla ni base de conocimientos para la experiencia de “embed”.
-
¿Cómo sabe Rover qué clicar o rellenar? Lee tu DOM en vivo en el navegador, luego planifica y ejecuta un conjunto mínimo de acciones como clics, entradas y navegación.
-
¿Dónde se ejecuta Rover, dentro del sitio web o de forma remota? Rover se describe como integrado y nativo del navegador, con mención en la página de “no remote browser”.
-
¿Qué configuración se necesita para empezar? El sitio enfatiza la configuración mediante una sola etiqueta de script y menciona “boot options” (incluyendo dominios y branding) para la configuración.
-
¿Puede Rover manejar incorporación guiada y pasos de configuración? Sí. La página describe tours guiados y listas de verificación/configuración in-context donde Rover interactúa con la UI.
Alternativas
- Agentes de navegador basados en capturas de pantalla/visión: Estos sistemas suelen razonar a partir de capturas de pantalla y pueden ser más lentos por acción o más difíciles de integrar en una UI de primera parte.
- Chatbots estilo RAG para preguntas y respuestas: Una alternativa común es un chatbot que responde preguntas usando una base de conocimientos, pero puede no realizar acciones directas dentro de tu DOM.
- Automatización de formularios basada en reglas o macros de UI: Pueden automatizar flujos de trabajo específicos, pero suelen carecer de guía en lenguaje natural y planificación de acciones flexible y consciente de la página.
- Herramientas de soporte asistidas por humanos tradicionales (chat + pasos manuales): Algunos equipos dependen de representantes de soporte para guiar a los usuarios, mientras que Rover busca realizar acciones directamente en la interfaz.
Alternativas
AgentMail
AgentMail es una API de bandeja de entrada por correo para agentes de IA: crear, enviar, recibir y buscar mensajes por REST para conversaciones bidireccionales.
LobeHub
LobeHub es una plataforma de código abierto diseñada para construir, desplegar y colaborar con compañeros de equipo de agentes de IA, funcionando como una interfaz web universal para LLM.
Codex Plugins
Usa Codex Plugins para combinar skills, integraciones de apps y servidores MCP en flujos reutilizables que amplían el acceso de Codex a Gmail, Drive y Slack.
Prompty Town
Prompty Town: una pequeña ciudad web de enlaces. Compra un tile, adjunta tu link y pruéntalo con texto o contenido para que otros naveguen.
Make Real
Dibuja una UI y hazla real usando el SDK de tldraw.
Tavus
Tavus crea sistemas de IA que ven, oyen y responden en tiempo real para interacciones cara a cara, con agentes de vídeo y gemelos digitales vía APIs.