Rover 是什麼?
Rover 是一款嵌入式「網頁代理程式」,只需一個 script tag 即可加入您的網站。它不僅能以文字回應,還能在即時頁面中執行動作,例如點擊按鈕、填寫表單、執行工作流程,並引導使用者導航。
Rover 直接在瀏覽器中運作,透過讀取網站的即時 DOM,規劃最少動作集,並執行之,而無需依賴截圖或獨立的知識庫工作流程。
主要功能
- 一行嵌入(script tag):只需在網站加入
https://rover.rtrvr.ai/embed.js,即可輕鬆在自家 UI 中開始測試。 - DOM 原生互動:Rover 以瀏覽器相同方式讀取並理解即時頁面結構,因此能辨識螢幕上目前內容。
- 安全、最少步驟的動作規劃:執行前會選擇最短安全路徑(例如點擊、表單輸入、導航),而非嘗試即興互動。
- 第一方、情境內執行:Rover 在您現有介面內引導使用者,讓使用者無需追蹤外部連結即可完成任務。
- 引導流程用於入門與設定:它能執行「引導巡覽」與情境內協助(例如入門、功能探索及設定清單),透過與 UI 互動。
如何使用 Rover
- 在網站嵌入 Rover,將提供的 script tag 加入頁面。
- 在網站 UI 開啟 Rover 體驗,描述您希望使用者執行的動作(例如「幫我結帳」或「示範如何設定第一個工作流程」)。
- 使用文件化的「啟動選項」設定部署,包含網域與品牌化(參照頁面所述)。
- 若使用含資料來源的工作流程,請連接資料來源並建立/匯入欄位,讓 Rover 能在產品內執行預期工作流程。
使用情境
- 無頁面切換的結帳協助:當使用者要求繼續時,Rover 可點擊並填寫結帳步驟,同時保持使用者在相同網站體驗中。
- 引導入門與產品巡覽:使用者可要求「示範如何」,Rover 即能即時透過 UI 互動引導設定步驟。
- 表單填寫與欄位自動填入:Rover 可填寫表單欄位(並提供如「自動填入」等狀態更新),作為完成端到端任務的一部分。
- 應用程式內工作流程執行:Rover 可情境內執行工作流程,包含多步驟動作,如導航至功能、建立/更新物件及確認完成。
- 團隊設定的引導清單:用於團隊入門,Rover 可在產品內引導步驟順序(例如連接資料來源、匯入欄位、建立工作流程範本、邀請團隊成員)。
常見問題
-
Rover 需要截圖或知識庫嗎? 頁面指出 Rover 在「嵌入」體驗中不使用截圖或知識庫。
-
Rover 如何知道該點擊或填寫什麼? 它在瀏覽器中讀取即時 DOM,然後規劃並執行最少動作集,例如點擊、輸入及導航。
-
Rover 在哪裡執行—網站內或遠端? Rover 被描述為嵌入式且瀏覽器原生,頁面提及「無遠端瀏覽器」。
-
開始使用需要哪些設定? 網站強調僅需單一 script tag 即可設定,並提及用於設定的「啟動選項」(包含網域與品牌化)。
-
Rover 能處理引導入門與設定步驟嗎? 可以。頁面描述 Rover 透過與 UI 互動的引導巡覽及情境內設定/清單。
替代方案
- 基於截圖/視覺的瀏覽器代理:這些系統通常從截圖推理,每個動作可能較慢,或難以嵌入第一方 UI。
- RAG 風格的問答聊天機器人:常見替代方案是使用知識庫回答問題的聊天機器人,但無法直接在您的 DOM 中執行動作。
- 基於規則的表單自動化或 UI 巨集:這些可自動化特定工作流程,但通常缺乏自然語言引導及彈性、頁面感知的動作規劃。
- 傳統人工輔助支援工具(聊天 + 手動步驟):有些團隊依賴支援代表引導使用者,而 Rover 旨在直接在介面中執行動作。
替代品
AgentMail
AgentMail 是供 AI 代理使用的電子郵件收件匣 API:透過 REST 建立、寄送、接收與搜尋郵件,支援雙向對話。
LobeHub
LobeHub 是一個開源平台,專為構建、部署和協作 AI 代理隊友而設計,可作為通用的 LLM Web UI。
Codex Plugins
使用 Codex Plugins 將技能、應用程式整合與 MCP 伺服器打包成可重複使用的工作流程,讓 Codex 存取 Gmail、Google Drive、Slack 等工具。
Prompty Town
Prompty Town:把網址變成磚塊建築,購買並附上連結,撰寫文字/內容提示,讓你在小小網路城市中被瀏覽。
Make Real
使用 tldraw SDK 繪製 UI 並將其變為現實。
Tavus
Tavus 提供用於即時、面對面互動的 AI,能看、聽並回應;也透過 API 支援可部署影片代理、數位分身與 AI 夥伴。