Long Horizon 是什麼?
Long Horizon 是一款代理式前端測試工具,讓程式碼代理規劃、撰寫並執行網頁應用程式的瀏覽器測試。其核心目的是幫助團隊在真實瀏覽器中驗證功能,並以可審核證據浮現問題。
Long Horizon 不僅產生測試,還在真實瀏覽器工作階段中執行測試,並產出可分享的執行報告。這些報告包含執行日誌及附件,如截圖和網路細節,支持除錯及可重現測試執行。
主要功能
- 基於功能與儲存庫脈絡的代理式測試規劃
- 代理根據功能與儲存庫輸入,草擬測試內容(核心路徑、邊緣案例及失敗情境)。
- 自動化瀏覽器測試執行
- 測試在真實瀏覽器中執行,因此斷言反映實際 UI 行為及網路互動。
- 含日誌與附件的可分享執行報告
- 輸出設計供審核,包含執行日誌及截圖等產物。
- 可靠、可重現執行
- 工作流程強調可重複工作階段,讓失敗可被重訪並理解。
- 撰寫至專案測試檔案的測試創作
- 代理將測試寫入專案(範例包含多個結帳相關測試檔案)。
- 失敗測試的除錯工作流程
- 執行失敗時,代理可辨識問題並提出變更;開發者可審核日誌並協助複雜情境。
- 手動檢查的慢速模式 / 步驟模式
- 執行可切換至幫助開發者觀察失敗或複雜流程行為的模式。
- 引導代理變更的 UI 回饋
- 使用者可直接在 UI 上以元素層級註解提供回饋;代理會納入截圖及元素 HTML 等脈絡。
如何使用 Long Horizon
- 從開發中功能開始,並提供相關儲存庫脈絡給代理。
- 要求代理為功能草擬測試計畫(包含快樂路徑、邊緣案例及錯誤情境)。
- 讓代理將測試寫入專案,然後在真實瀏覽器中執行測試。
- 審核產生的執行報告,包含日誌及附件截圖。
- 若測試失敗,使用除錯工作流程—審核失敗輸出,讓代理提出修正,然後重新執行。
在提供的範例中,工作流程包含結帳情境規劃(例如「結帳 — 快樂路徑」、「購物車 — 空購物車阻擋結帳」及「付款 — 拒絕並重試」),在瀏覽器工作階段中執行,並驗證斷言如確認 ID 及 DOM 可見性。
使用案例
- 登入使用者結帳快樂路徑回歸測試
- 執行代理規劃情境,讓登入使用者完成購買,並驗證確認路由呈現預期識別碼(例如 DOM 中的訂單 ID 及電子郵件)。
- 空購物車時防止結帳
- 驗證空購物車時結帳呼叫按鈕保持停用,且不觸發付款相關網路呼叫。
- 處理卡片拒絕及重試流程
- 模擬卡片拒絕,確認浮現內嵌錯誤,並驗證使用者可變更付款方式並成功完成訂單。
- 測試訪客結帳及僅電子郵件付款流程
- 檢查無帳戶使用者推進結帳情境,並確保付款前檢查(例如來源提及的詐欺檢查)發生。
- 複雜流程中除錯及修正失敗
- 當瀏覽器測試因意外阻擋條件失敗(例如庫存閘道阻擋結帳)時,使用日誌辨識問題,更新模擬/存根(例如庫存可用性),並重新執行。
常見問題
Long Horizon 是產生測試還是僅執行測試?
兩者皆是。代理會草擬測試計畫、在專案中撰寫測試,然後在真實瀏覽器中執行這些測試。
Long Horizon 在測試執行後產生何種輸出?
執行報告可分享,包含完整執行日誌與附件如截圖,並提及網路資訊等額外細節。
開發者能否檢視失敗並逐步執行情境?
可以。工作流程包含開發者檢視執行日誌,以及慢速模式與步進模式等手動檢查選項。
代理除錯如何運作?
測試失敗時,代理可找出問題並建議修正;開發者也可協助,例如調整模擬資料(如庫存)並重新執行相同測試。
團隊成員如何在修正期間提供指導給代理?
原始描述為 UI 回饋介面,使用者可在 UI 元素上留言。代理使用截圖、留言與元素 HTML。
替代方案
- 傳統前端端到端測試框架
- E2E 類工具可執行瀏覽器測試,但通常需更多手動測試規劃與撰寫,而非代理驅動的規劃、撰寫與執行。
- 具手動分類的腳本化 QA 測試套件
- 團隊可撰寫與執行腳本化測試,並使用日誌除錯;差異在於 Long Horizon 強調代理輔助的工作流程,用於規劃、撰寫與除錯。
- 產生測試但無真實瀏覽器執行的代理式工作流程工具
- 某些方法著重產生測試程式碼或報告;Long Horizon 的定位特別在真實瀏覽器執行與可檢視的執行報告。
- 基於 CI 的瀏覽器測試管線
- 持續整合設定可重複執行瀏覽器測試;Long Horizon 著重代理式測試建立與可分享執行報告,以支援功能交付與除錯。
替代品
PromptLayer
PromptLayer 協助團隊用 evals、tracing 與 regression sets 版本管理、測試 AI agents 與 prompts,並提供視覺編輯器促進協作。
Evidently AI
Evidently AI 是 AI 評估與 LLM 可觀測平台,用於測試並監控正式環境 AI 系統,支援 LLM 評估、RAG 評估與持續追蹤。
Crikket
Crikket:開源蟲回報工具,助團隊快速捕捉技術細節,加速問題排除。立即體驗!
Roo Code
Roo Code 在編輯器內與雲端代理提供 AI 軟體工程團隊,含角色式 Modes、可設定控制,並串接 GitHub 進行編碼、除錯與測試。
Logic
Logic 是規格驅動的代理平台,把文字代理規格轉為可投入生產的 API,內建測試、版本管理、模型路由與執行紀錄。
TestLaunch Pro
TestLaunch Pro 付費應用測試市集,協助開發者找Google Play封閉測試已同意測試者;測試者下載應用回饋並透過PayPal領款。