UStackUStack
Rover favicon

Rover

Rover 是一个原生的 DOM 嵌入式网页代理,它能将任何网站转变为一个交互式助手,通过单行脚本标签即可读取实时 DOM、点击按钮、填写表单,并引导用户完成复杂的工作流程。

Rover

什么是 Rover?

什么是 Rover?

Rover 正在通过将静态页面转变为由 AI 驱动的动态、可操作界面来彻底改变网站交互方式。与依赖链接、静态知识库或缓慢的视觉识别(截图)的传统聊天机器人不同,Rover 是一个原生的 DOM 代理,它通过单行 JavaScript 直接驻留在您的网站内部。这种根本性的差异使 Rover 能够实时理解页面结构(DOM),从而能够执行精确的、毫秒级的操作,例如导航、输入数据、验证字段和完成多步骤流程,而无需将用户带离当前视图。

Rover 由前 Google 团队构建,专注于完成任务而非对话表演。其核心目的是推动成果——无论是新用户入职、完成购买,还是配置复杂的 B2B 门户。通过读取浏览器的语义树,Rover 确保操作的准确性、即时性,并感觉像是用户体验的自然组成部分,与基于链接的支持或缓慢的视觉自动化工具相比,大大减少了摩擦并提高了转化率。

核心功能

  • 原生的 DOM 执行: Rover 读取您网站的实时文档对象模型 (DOM),确保操作基于当前结构,而非过时的截图或视觉猜测。这带来了毫秒级的操作速度和高可靠性。
  • 单行嵌入: 部署极其简单。将 Rover 添加到您的网站只需粘贴一个 <script> 标签,无需复杂的知识库设置、RAG 管道或外部虚拟机维护。
  • 面向操作的指导: Rover 擅长引导用户完成复杂任务,例如结账流程、设置清单和功能发现,它会实时与用户一起主动点击和填写表单。
  • 零知识库维护: 由于 Rover 读取实时网站结构,它会自动适应 UI 更改(如菜单更新或表单字段修改),而无需像传统 RAG 聊天机器人那样进行手动再训练或知识库更新。
  • 高基准成功率: 在网页自动化任务中展示出卓越的可靠性,Rover 实现了 81.39% 的基准成功率,明显优于依赖像素猜测的基于视觉的代理。
  • 范围限定的安全: 操作严格限制在宿主网站的 DOM 内,提供安全的第一方用户体验,没有范围泄露的风险。

如何使用 Rover

让 Rover 在您的网站上运行起来被设计成一个快速的两分钟过程:

  1. 安装: 复制提供的单行 JavaScript 嵌入代码(<script src="https://rover.rtrvr.ai/embed.js" async></script>)并将其粘贴到您网站 HTML 的 <head> 标签内或关闭 </body> 标签之前。
  2. 配置(可选): 使用启动选项配置初始设置,例如品牌、允许的域名或特定的初始提示,以定制代理的行为。
  3. 激活: 脚本加载后,Rover 在您的网站上即处于活动状态。用户可以通过输入自然语言请求(例如,“帮我结账”或“向我展示如何连接 Salesforce”)与其进行交互。
  4. 执行操作: Rover 解析请求,规划最小的 DOM 交互序列(点击、输入、导航),并在实时浏览器窗口中即时执行它们,引导用户完成任务。

使用场景

  1. B2B SaaS 入职和激活: 直接在应用程序界面内引导新用户完成复杂的设置清单、数据源连接和初始工作流程创建,从而使激活速度提高 60%。
  2. 电子商务结账协助: 当用户犹豫时,让 Rover 介入,防止购物车放弃。Rover 可以根据请求导航到结账页面、填写送货和付款详细信息,并确认订单,确保无缝的购买完成。
  3. 情境内产品导览和功能发现: 用交互式的实时指导取代静态视频教程。当用户询问“如何使用新的报告功能?”时,Rover 会导航到该功能并与用户一起点击必要的步骤。
  4. 复杂的表单填写和数据提交: 通过让 Rover 根据用户指令准确输入所需数据,自动化完成冗长或令人困惑的表单(例如,保险索赔、政府门户或详细的商家申请)。
  5. 实时客户支持解决方案: 通过允许代理直接在客户的实时会话中执行必要的后端操作(如更新订单状态或修改账户设置),即时解决高摩擦的支持问题。

常见问题 (FAQ)

问:Rover 与标准的 AI 聊天机器人或 RAG 系统有何不同? 答:标准聊天机器人会交谈并提供链接;Rover 会采取行动。RAG 系统依赖于静态文档,只能回答问题。Rover 读取实时 DOM,使其能够即时执行点击按钮和填写表单等物理操作,使其成为一个代理,而不仅仅是一个信息检索工具。

问:Rover 是否要求我维护知识库或更新文档? 答:不需要。Rover 的智能来自于读取您网站的实时结构(DOM)。如果您更新了按钮的 ID 或移动了字段,Rover 会自动适应,消除了与依赖知识库的解决方案相关的维护开销。

问:在操作速度方面,我能期待什么样的性能? 答:由于 Rover 使用原生的浏览器精度直接与 DOM 交互,操作以毫秒为单位执行。这比必须捕获屏幕截图、处理图像、推理然后执行点击的视觉代理要快得多。

问:让 AI 代理在我的网站上点击操作安全吗? 答:是的。Rover 被设计为严格限制在您网站的 DOM 内。它在用户浏览器会话的上下文中运行,并专注于精确性,只关注完成用户所述目标所需的必要步骤,确保安全的第一方用户体验。

问:设置需要多长时间? 答:设置非常快。将 Rover 添加到您的网站通常需要不到三分钟,只需要粘贴一行 JavaScript 代码。

Rover | UStack