Rover
Roverはスクリプト1行で埋め込めるブラウザネイティブAIエージェント。DOMを読み取りクリック/フォーム入力でUI内を案内。
Roverとは?
Roverは、ウェブサイトにスクリプトタグ1行で追加できる埋め込み型の「ウェブエージェント」です。テキスト回答のみではなく、ライブページ内でアクションを実行できます—ボタンをクリック、フォーム入力、ワークフローの実行、ユーザーのナビゲーション案内です。
Roverはブラウザ内でウェブサイトのライブDOMを読み取り、最小限のアクションを計画・実行します。スクリーンショットや別途のナレッジベースに依存しません。
主な機能
- 1行埋め込み(スクリプトタグ): サイトに
https://rover.rtrvr.ai/embed.jsを追加するだけでRoverを導入でき、自身のUIで簡単にテスト開始できます。 - DOMネイティブインタラクション: ブラウザと同じようにライブページの構造を読み取り理解するため、画面上の要素を特定できます。
- 安全で最小限のステップ向けアクション計画: 実行前に最短の安全パス(例: クリック、フォーム入力、ナビゲーション)を選び、あと付けのインタラクションを避けます。
- ファーストパーティ、コンテキスト内実行: 既存のインターフェース内でユーザーを案内するため、タスク完了に外部リンクを追う必要がありません。
- オンボーディング・セットアップ向けガイドフロー: UIインタラクションにより「ガイドツアー」やコンテキスト内支援(例: オンボーディング、機能発見、セットアップチェックリスト)を実行できます。
Roverの使い方
- サイトにRoverを埋め込み、提供されたスクリプトタグをページに追加します。
- サイトUIでRoverエクスペリエンスを開き、ユーザーにさせたいことを記述します(例: 「チェックアウトを手伝って」「最初のワークフローのセットアップ方法を教えて」)。
- デプロイメントのオプションを設定、ドキュメントの「boot options」を使い、ドメインやブランディングなどを構成します(ページ参照)。
- データソース付きワークフローを使う場合、データソースを接続し、フィールドを作成/インポートして、Roverが製品内で意図したワークフローを実行できるようにします。
ユースケース
- ページ切り替えなしのチェックアウト支援: ユーザーが進行を求めると、Roverが同じサイト体験内でチェックアウトステップをクリック・入力します。
- ガイド付きオンボーディングとプロダクトツアー: ユーザーが「方法を教えて」と求めると、RoverがリアルタイムでUIインタラクションによりセットアップステップを案内します。
- フォーム完了とフィールド自動入力: エンドツーエンドタスクの一環としてフォームフィールドを入力(「自動入力中」などのステータス更新付き)。
- アプリ内ワークフロー実行: コンテキスト内でワークフローを実行、多段階アクション(機能への移動、オブジェクト作成/更新、完了確認)を含む。
- ガイド付きチェックリストでのチームセットアップ: チームオンボーディング向けにステップ順序を案内(例: データソース接続、フィールドインポート、ワークフローテンプレート作成、チームメンバー招待)を製品内で。
FAQ
-
Roverはスクリーンショットやナレッジベースが必要ですか? ページによると、「embed」エクスペリエンスではスクリーンショットやナレッジベースを使いません。
-
Roverはクリックや入力する内容をどう知るのですか? ブラウザ内のライブDOMを読み取り、最小限のアクション(クリック、入力、ナビゲーション)を計画・実行します。
-
Roverはウェブサイト内かリモートで動作しますか? ページでは埋め込み型・ブラウザネイティブと記述、「リモートブラウザなし」と記載。
-
開始に必要なセットアップは? サイトではスクリプトタグ1行でのセットアップを強調、「boot options」(ドメイン・ブランディング含む)で構成。
-
Roverはガイド付きオンボーディングやセットアップステップを扱えますか? はい。ページではUIインタラクションによるガイドツアーやコンテキスト内セットアップ/チェックリストを記述。
代替案
- スクリーンショット/ビジョンベースのブラウザエージェント: これらはスクリーンショットから推論し、アクションごとの速度が遅く、ファーストパーティUIへの埋め込みが難しい場合があります。
- RAGスタイルのQ&Aチャットボット: ナレッジベースで質問に答える一般的な代替ですが、DOM内で直接アクションを取れません。
- ルールベースのフォーム自動化やUIマクロ: 特定ワークフローを自動化できますが、自然言語ガイドや柔軟なページ認識アクション計画が不足。
- 従来の人間支援サポートツール(チャット+手動ステップ): 一部のチームはサポート担当者がユーザーを案内しますが、Roverはインターフェース内で直接アクションを実行。
代替品
AgentMail
AgentMailはAIエージェント向けメール受信API。RESTで作成・送受信・検索し、双方向の会話を実現します。
LobeHub
LobeHubは、AIエージェントチームメイトを構築、デプロイ、共同作業するために設計されたオープンソースプラットフォームであり、ユニバーサルなLLM Web UIとして機能します。
Codex Plugins
Codex Pluginsでスキル、アプリ連携、MCPサーバーを再利用可能なワークフローにまとめ、Gmail・Google Drive・Slack等のツールにアクセス。
Prompty Town
Prompty Townはリンクをタイルにして購入・プロンプト文/コンテンツを付け、みんなで街のように閲覧できる小さなWeb空間です。
Make Real
tldraw SDKを使用してUIを描き、実現します。
Tavus
TavusはAIがリアルタイムの対面コミュニケーションで見て・聞いて・応答。動画エージェントやデジタルツイン、AIコンパニオンをAPIで提供。