Rover
Rover ist ein browser-nativer KI-Agent, den du per einzeiligem Script-Tag einbindest. Er liest den Live-DOM, klickt, füllt Formulare und führt Nutzer in deinem UI.
Was ist Rover?
Rover ist ein eingebetteter „Web-Agent“, den du mit einem einzigen Script-Tag zu deiner Website hinzufügst. Statt nur mit Text zu antworten, kann er Aktionen auf der Live-Seite ausführen – Buttons klicken, Formulare ausfüllen, Workflows starten und Nutzer bei der Navigation leiten.
Rover arbeitet direkt im Browser, indem es den Live-DOM der Website liest, einen minimalen Satz Aktionen plant und diese ausführt – ohne Screenshots oder eine separate Wissensdatenbank.
Wichtige Funktionen
- Einzeilige Einbindung (Script-Tag): Füge Rover hinzu, indem du
https://rover.rtrvr.ai/embed.jsauf deiner Site einbindest – so kannst du einfach in deinem eigenen UI testen. - DOM-native Interaktion: Rover liest und versteht die Struktur deiner Live-Seite so, wie der Browser es tut, und erkennt, was gerade auf dem Bildschirm ist.
- Aktionsplanung für sichere, minimale Schritte: Es wählt den kürzesten sicheren Pfad (z. B. Klicks, Formulareingaben, Navigation) vor der Ausführung, statt ad-hoc-Interaktionen zu versuchen.
- First-Party, kontextuelle Ausführung: Rover leitet Nutzer in deiner bestehenden Oberfläche – ohne dass externe Links für die Aufgabenabsolvierung nötig sind.
- Geführte Flows für Onboarding und Setup: Es kann „Geführte Touren“ und kontextuelle Hilfe (z. B. Onboarding, Feature-Entdeckung, Setup-Checklisten) durch UI-Interaktionen anbieten.
So nutzt du Rover
- Rover auf deiner Site einbinden, indem du das bereitgestellte Script-Tag zu deinen Seiten hinzufügst.
- Rover-Erlebnis in deinem Site-UI öffnen und beschreiben, was Nutzer tun sollen (z. B. „Hilf mir beim Checkout“ oder „Zeig mir, wie ich meinen ersten Workflow einrichte“).
- Optionen für dein Deployment konfigurieren mit den dokumentierten „Boot-Optionen“, inklusive Domains und Branding (wie auf der Seite referenziert).
- Bei Workflows mit Datenquellen die Datenquelle verbinden und Felder erstellen/importieren, damit Rover den Workflow in deinem Produkt ausführen kann.
Anwendungsfälle
- Checkout-Hilfe ohne Seitenwechsel: Wenn ein Nutzer fortfahren möchte, klickt Rover durch und füllt Checkout-Schritte aus, während der Nutzer auf der gleichen Site-Erfahrung bleibt.
- Geführtes Onboarding und Product Tours: Nutzer können nach „Zeig mir, wie“ fragen, und Rover leitet sie in Echtzeit durch Setup-Schritte per UI-Interaktion.
- Formularausfüllung und Feld-Autofill: Rover füllt Formularfelder aus (mit Status-Updates wie „wird autofilled“) als Teil einer End-to-End-Aufgabe.
- Workflow-Ausführung in der App: Rover führt Workflows kontextuell aus, inklusive mehrstufiger Aktionen wie Navigation zu Features, Erstellen/Aktualisieren von Objekten und Abschlussbestätigung.
- Team-Setup mit geführter Checkliste: Für Team-Onboarding leitet Rover Schrittfolgen (z. B. Datenquelle verbinden, Felder importieren, Workflow-Vorlage erstellen, Teammitglieder einladen) innerhalb deines Produkts.
FAQ
-
Benötigt Rover Screenshots oder eine Wissensdatenbank? Die Seite gibt an, dass Rover für das „Embed“-Erlebnis keine Screenshots oder Wissensdatenbank nutzt.
-
Wie weiß Rover, was es klicken oder ausfüllen soll? Es liest deinen Live-DOM im Browser, plant dann einen minimalen Satz Aktionen wie Klicks, Eingaben und Navigation und führt sie aus.
-
Wo läuft Rover – in der Website oder remote? Rover wird als eingebettet und browser-nativ beschrieben, mit Hinweis auf „kein Remote-Browser“ auf der Seite.
-
Welche Einrichtung ist zum Start nötig? Die Site betont die Einrichtung per einzelnem Script-Tag und „Boot-Optionen“ (inkl. Domains und Branding) zur Konfiguration.
-
Kann Rover geführtes Onboarding und Setup-Schritte handhaben? Ja. Die Seite beschreibt geführte Touren und kontextuelle Setup-/Checklisten, bei denen Rover mit der UI interagiert.
Alternativen
- Screenshot-/Vision-basierte Browser-Agenten: Diese Systeme reasonieren meist aus Screenshots und können pro Aktion langsamer sein oder schwerer in eine First-Party-UI einzubinden.
- RAG-Style-Chatbots für Q&A: Eine gängige Alternative sind Chatbots, die mit Wissensdatenbank Fragen beantworten, aber keine direkten DOM-Aktionen ausführen.
- Regelbasierte Formularautomatisierung oder UI-Makros: Diese automatisieren spezifische Workflows, fehlen aber oft natürlicher Sprachführung und flexibler, seitenbewusster Aktionsplanung.
- Traditionelle menschliche Support-Tools (Chat + manuelle Schritte): Manche Teams nutzen Support-Mitarbeiter zur Nutzerführung, während Rover Aktionen direkt in der Oberfläche ausführt.
Alternativen
AgentMail
AgentMail ist eine E-Mail-Postfach-API für AI Agents: E-Mails per REST erstellen, senden, empfangen und durchsuchen für bidirektionale Gespräche.
LobeHub
LobeHub ist eine Open-Source-Plattform, die für die Entwicklung, Bereitstellung und Zusammenarbeit mit KI-Agenten-Teamkollegen konzipiert ist und als universelle LLM Web UI fungiert.
Codex Plugins
Mit Codex Plugins bündelst du Skills, App-Integrationen und MCP-Server zu wiederverwendbaren Workflows und erweiterst Codex für Tools wie Gmail, Google Drive und Slack.
Prompty Town
Prompty Town ist eine kleine Internet-Stadt aus Links: Tile kaufen, Link anheften und mit Text/Inhalten prompten – zum Durchstöbern für alle.
Make Real
Zeichnen Sie eine UI und machen Sie sie mit dem tldraw SDK real.
Tavus
Tavus entwickelt KI für Echtzeit-Gespräche von Mensch zu Mensch: sie sieht, hört und reagiert. Zudem Video-Agents, Digital Twins & AI Companions via APIs.