Long Horizon

Long Horizon 是代理式前端測試工具，可規劃、撰寫並在真實瀏覽器執行測試，產出可分享報告（含日誌與截圖）以提升交付信心。

Long Horizon

Long Horizon 是什麼？

Long Horizon 是一款代理式前端測試工具，讓程式碼代理規劃、撰寫並執行網頁應用程式的瀏覽器測試。其核心目的是幫助團隊在真實瀏覽器中驗證功能，並以可審核證據浮現問題。

Long Horizon 不僅產生測試，還在真實瀏覽器工作階段中執行測試，並產出可分享的執行報告。這些報告包含執行日誌及附件，如截圖和網路細節，支持除錯及可重現測試執行。

主要功能

基於功能與儲存庫脈絡的代理式測試規劃
- 代理根據功能與儲存庫輸入，草擬測試內容（核心路徑、邊緣案例及失敗情境）。
自動化瀏覽器測試執行
- 測試在真實瀏覽器中執行，因此斷言反映實際 UI 行為及網路互動。
含日誌與附件的可分享執行報告
- 輸出設計供審核，包含執行日誌及截圖等產物。
可靠、可重現執行
- 工作流程強調可重複工作階段，讓失敗可被重訪並理解。
撰寫至專案測試檔案的測試創作
- 代理將測試寫入專案（範例包含多個結帳相關測試檔案）。
失敗測試的除錯工作流程
- 執行失敗時，代理可辨識問題並提出變更；開發者可審核日誌並協助複雜情境。
手動檢查的慢速模式 / 步驟模式
- 執行可切換至幫助開發者觀察失敗或複雜流程行為的模式。
引導代理變更的 UI 回饋
- 使用者可直接在 UI 上以元素層級註解提供回饋；代理會納入截圖及元素 HTML 等脈絡。

如何使用 Long Horizon

從開發中功能開始，並提供相關儲存庫脈絡給代理。
要求代理為功能草擬測試計畫（包含快樂路徑、邊緣案例及錯誤情境）。
讓代理將測試寫入專案，然後在真實瀏覽器中執行測試。
審核產生的執行報告，包含日誌及附件截圖。
若測試失敗，使用除錯工作流程—審核失敗輸出，讓代理提出修正，然後重新執行。

在提供的範例中，工作流程包含結帳情境規劃（例如「結帳 — 快樂路徑」、「購物車 — 空購物車阻擋結帳」及「付款 — 拒絕並重試」），在瀏覽器工作階段中執行，並驗證斷言如確認 ID 及 DOM 可見性。

使用案例

登入使用者結帳快樂路徑回歸測試
- 執行代理規劃情境，讓登入使用者完成購買，並驗證確認路由呈現預期識別碼（例如 DOM 中的訂單 ID 及電子郵件）。
空購物車時防止結帳
- 驗證空購物車時結帳呼叫按鈕保持停用，且不觸發付款相關網路呼叫。
處理卡片拒絕及重試流程
- 模擬卡片拒絕，確認浮現內嵌錯誤，並驗證使用者可變更付款方式並成功完成訂單。
測試訪客結帳及僅電子郵件付款流程
- 檢查無帳戶使用者推進結帳情境，並確保付款前檢查（例如來源提及的詐欺檢查）發生。
複雜流程中除錯及修正失敗
- 當瀏覽器測試因意外阻擋條件失敗（例如庫存閘道阻擋結帳）時，使用日誌辨識問題，更新模擬/存根（例如庫存可用性），並重新執行。

常見問題

Long Horizon 是產生測試還是僅執行測試？

兩者皆是。代理會草擬測試計畫、在專案中撰寫測試，然後在真實瀏覽器中執行這些測試。

Long Horizon 在測試執行後產生何種輸出？

執行報告可分享，包含完整執行日誌與附件如截圖，並提及網路資訊等額外細節。

開發者能否檢視失敗並逐步執行情境？

可以。工作流程包含開發者檢視執行日誌，以及慢速模式與步進模式等手動檢查選項。

代理除錯如何運作？

測試失敗時，代理可找出問題並建議修正；開發者也可協助，例如調整模擬資料（如庫存）並重新執行相同測試。

團隊成員如何在修正期間提供指導給代理？

原始描述為 UI 回饋介面，使用者可在 UI 元素上留言。代理使用截圖、留言與元素 HTML。

替代方案

傳統前端端到端測試框架
- E2E 類工具可執行瀏覽器測試，但通常需更多手動測試規劃與撰寫，而非代理驅動的規劃、撰寫與執行。
具手動分類的腳本化 QA 測試套件
- 團隊可撰寫與執行腳本化測試，並使用日誌除錯；差異在於 Long Horizon 強調代理輔助的工作流程，用於規劃、撰寫與除錯。
產生測試但無真實瀏覽器執行的代理式工作流程工具
- 某些方法著重產生測試程式碼或報告；Long Horizon 的定位特別在真實瀏覽器執行與可檢視的執行報告。
基於 CI 的瀏覽器測試管線
- 持續整合設定可重複執行瀏覽器測試；Long Horizon 著重代理式測試建立與可分享執行報告，以支援功能交付與除錯。

替代品

PromptLayer

PromptLayer 協助團隊用 evals、tracing 與 regression sets 版本管理、測試 AI agents 與 prompts，並提供視覺編輯器促進協作。

Evidently AI

Evidently AI 是 AI 評估與 LLM 可觀測平台，用於測試並監控正式環境 AI 系統，支援 LLM 評估、RAG 評估與持續追蹤。

Crikket

Crikket：開源蟲回報工具，助團隊快速捕捉技術細節，加速問題排除。立即體驗！

Roo Code

Roo Code 在編輯器內與雲端代理提供 AI 軟體工程團隊，含角色式 Modes、可設定控制，並串接 GitHub 進行編碼、除錯與測試。

Logic

Logic 是規格驅動的代理平台，把文字代理規格轉為可投入生產的 API，內建測試、版本管理、模型路由與執行紀錄。

TestLaunch Pro

TestLaunch Pro 付費應用測試市集，協助開發者找Google Play封閉測試已同意測試者；測試者下載應用回饋並透過PayPal領款。