Rover
Roverは、あらゆるウェブサイトを、ライブDOMを読み取り、ボタンをクリックし、フォームに入力し、単一のスクリプトタグを使用して複雑なワークフローを通じてユーザーをガイドできる対話型アシスタントに変える、DOMネイティブの組み込み型ウェブエージェントです。
Roverとは?
Roverとは?
Roverは、静的なページをAIを搭載した動的で実行可能なインターフェースに変革することで、ウェブサイトのインタラクションに革命をもたらしています。リンク、静的なナレッジベース、または遅い視覚認識(スクリーンショット)に依存する従来のチャットボットとは異なり、Roverは単一のJavaScriptコードを通じてウェブサイトの内部に存在するDOMネイティブエージェントです。この根本的な違いにより、Roverはページの構造(DOM)をリアルタイムで理解し、ユーザーを現在のビューから移動させることなく、ナビゲーション、データ入力、フィールドの検証、複数ステップのプロセスの完了といった正確でサブセカンド(1秒未満)のアクションを実行できます。
元Googleチームによって構築されたRoverは、「会話の劇場」よりも完了に焦点を当てています。その核となる目的は、新規ユーザーのオンボーディング、購入の完了、複雑なB2Bポータルの設定など、成果を推進することです。ブラウザのセマンティックツリーを読み取ることで、Roverはアクションが正確で即時的であり、ユーザーエクスペリエンスのネイティブな部分であると感じられるようにし、リンクベースのサポートや遅い視覚自動化ツールと比較して摩擦を劇的に減らし、コンバージョン率を向上させます。
主な特徴
- DOMネイティブ実行: RoverはサイトのライブDocument Object Model (DOM) を読み取り、アクションが最新のスクリーンショットや視覚的な推測ではなく、現在の構造に基づいていることを保証します。これにより、サブセカンドのアクション速度と高い信頼性が得られます。
- ワンライナー埋め込み: デプロイは信じられないほど簡単です。Roverをサイトに追加するには、単一の
<script>タグを貼り付けるだけでよく、複雑なナレッジベースのセットアップ、RAGパイプライン、または外部VMのメンテナンスが不要になります。 - アクション指向のガイダンス: Roverは、チェックアウトフロー、セットアップチェックリスト、機能発見などの複雑なタスクを通じてユーザーをガイドすることに優れており、リアルタイムでユーザーと並行してアクティブにクリックおよびフォーム入力を行います。
- ナレッジベースのメンテナンスゼロ: Roverはライブサイト構造を読み取るため、従来のRAGチャットボットとは異なり、手動での再トレーニングやナレッジベースの更新を必要とせずに、UIの変更(メニューの更新やフォームフィールドの変更など)に自動的に適応します。
- 高いベンチマーク成功率: ウェブ自動化タスクにおいて優れた信頼性を示すRoverは、81.39%のベンチマーク成功率を達成しており、ピクセル推測に依存するビジョンベースのエージェントを大幅に上回ります。
- スコープ化されたセキュリティ: アクションはホストウェブサイトのDOMに厳密に限定されており、スコープの漏洩がない安全なファーストパーティのユーザーエクスペリエンスを提供します。
Roverの使用方法
ウェブサイトでRoverを動作可能にするプロセスは、迅速な2分間のプロセスとして設計されています。
- インストール: 提供された単一行のJavaScript埋め込みコード(
<script src="https://rover.rtrvr.ai/embed.js" async></script>)をコピーし、ウェブサイトのHTMLの<head>タグ内または終了</body>タグの前に貼り付けます。 - 設定(オプション): ブートオプションを使用して、ブランディング、許可されたドメイン、または特定の初期プロンプトなどの初期設定を構成し、エージェントの動作を調整します。
- アクティベーション: スクリプトがロードされると、Roverはサイト上でアクティブになります。ユーザーは、自然言語のリクエスト(例:「チェックアウトを手伝って」または「Salesforceへの接続方法を表示して」)を入力することで対話できます。
- アクション実行: Roverはリクエストを解釈し、DOMインタラクション(クリック、入力、ナビゲーション)の最小シーケンスを計画し、ライブブラウザウィンドウ内で即座に実行し、ユーザーを完了までガイドします。
ユースケース
- B2B SaaSのオンボーディングとアクティベーション: 複雑なセットアップチェックリスト、データソース接続、初期ワークフロー作成を通じて、アプリケーションインターフェース内で直接新規ユーザーをガイドし、アクティベーション率を60%高速化します。
- Eコマースのチェックアウト支援: ユーザーが躊躇した際にRoverが介入することで、カート放棄を防ぎます。Roverはリクエストに応じてチェックアウトに移動し、配送先住所と支払い情報を入力し、注文を確認することで、シームレスな購入完了を保証できます。
- コンテキスト内製品ツアーと機能発見: 静的なビデオチュートリアルを、インタラクティブなリアルタイムガイダンスに置き換えます。「新しいレポート機能の使い方」とユーザーが尋ねた場合、Roverはその機能に移動し、ユーザーと並行して必要なステップをクリックして実行します。
- 複雑なフォーム入力とデータ送信: 長大または紛らわしいフォーム(保険請求、政府ポータル、または詳細なマーチャント申請など)への入力を、ユーザーの指示に基づいてRoverが正確にデータを入力することで自動化します。
- リアルタイムのカスタマーサポート解決: エージェントが顧客のライブセッション内で必要なバックエンドアクション(注文ステータスの更新やアカウント設定の変更など)を直接実行できるようにすることで、高い摩擦を伴うサポート問題を即座に解決します。
FAQ
Q: Roverは標準のAIチャットボットやRAGシステムとどう違いますか? A: 標準のチャットボットは対話し、リンクを提供します。Roverは行動します。RAGシステムは静的なドキュメントに依存し、質問に答えることしかできません。RoverはライブDOMを読み取るため、ボタンのクリックやフォーム入力といった物理的なアクションを即座に実行でき、単なる情報検索ツールではなくエージェントとなります。
Q: Roverを使用するためにナレッジベースやドキュメントを維持する必要がありますか? A: いいえ。Roverのインテリジェンスは、ウェブサイトのライブ構造(DOM)を読み取ることに由来します。ボタンのIDが更新されたり、フィールドが移動したりしても、Roverは自動的に適応するため、ナレッジベース依存のソリューションに伴うメンテナンスの負担がなくなります。
Q: アクション速度に関して、どのようなパフォーマンスが期待できますか? A: Roverはネイティブブラウザの精度を使用してDOMと直接対話するため、アクションはミリ秒単位で実行されます。これは、スクリーンショットのキャプチャ、画像の処理、推論、そしてクリックの実行を必要とするビジョンエージェントよりも大幅に高速です。
Q: AIエージェントにウェブサイト内を自由にクリックさせるのは安全ですか? A: はい。RoverはウェブサイトのDOMに厳密にスコープが限定されるように設計されています。ユーザーのブラウザセッションのコンテキスト内で動作し、ユーザーが述べた目標を達成するために必要な最小限のステップにのみ焦点を当てる精度を重視しているため、安全なファーストパーティのUXを保証します。
Q: セットアップにはどのくらい時間がかかりますか? A: セットアップは非常に迅速です。サイトにRoverを追加するには、通常3分もかからず、JavaScriptコードを1行貼り付けるだけで済みます。
Alternatives
Biji
Bijiは、革新的なツールと機能を通じて生産性を向上させるために設計された多目的プラットフォームです。
Prompty Town
Prompty Townは、ユーザーがリンクを仮想の建物に変換し、コンテンツを共有し、対話するためのユニークで魅力的な方法を創造する革新的なプラットフォームです。
HiringPartner.ai
HiringPartner.ai は、自律型の AI エージェントが 24 時間 365 日稼働し、候補者のサーチ、スクリーニング、電話連絡、面接までを自動化する採用プラットフォームです。従来は数週間かかっていた採用リードタイムを、最短 48 時間まで短縮します。
AakarDev AI
AakarDev AIは、シームレスなベクターデータベース統合を通じてAIアプリケーションの開発を簡素化し、迅速な展開とスケーラビリティを実現する強力なプラットフォームです。
Planndu: Daily Task Planner
Plannduは、AI生成や内蔵のポモドーロタイマーなどのツールを活用して、ユーザーがタスクを整理し、プロジェクトを管理し、ルーチンを構築し、集中力を高めるのに役立つように設計された直感的な生産性アプリケーションです。
Devin
Devinは、開発者がより良いソフトウェアをより早く構築するのを支援するAIコーディングエージェントおよびソフトウェアエンジニアです。