Latitude
Latitude 是 Claude Code 的開源可觀測性:監控每個 agent turn,完整 session traces,偵測失敗並掌握成本/用量可視性。
Latitude 是什麼?
Latitude 是一個開源 AI 代理可觀測性和監控平台,專為監控 Claude Code 的每個步驟而設計。它捕捉代理工作階段的詳細追蹤—例如提示、工具呼叫、命令輸出和觸及的檔案—讓團隊能夠了解生產環境中的失敗,並驗證修復是否生效。
Latitude 的核心目的是讓代理行為從端到端可觀測。它幫助您偵測潛在問題、調查工作階段實際發生的事,並追蹤工作階段層級的成本和使用量。
主要功能
- 每個 turn 的工作階段追蹤:Latitude 記錄 Claude Code 在工作階段中執行的內容,包括每個步驟的提示、工具呼叫、Bash 輸出,以及代理觸及的檔案。
- 運行時捕捉系統提示和工具 schema:追蹤包含 Claude Code 在運行時實際組成的系統提示和工具 schema,而非您預期的內容。
- 失敗偵測與問題監控:平台呈現生產環境中失敗的監控訊號,讓您調查根本問題。
- 每個工作階段的成本可視性:您可以查看基於捕捉工作階段活動的提示、工作階段和工作區層級成本。
- 使用量統計與費用管控:Latitude 追蹤 token 使用量,幫助長期管控費用。
- 即時流量捕捉用於評估:它能從即時流量捕捉真實輸入、輸出和上下文,支持失敗發現、評估式分析和人工回饋工作流程。
如何使用 Latitude
- 在本機安裝遙測:執行提供的命令安裝 Claude Code 的 Latitude 遙測(網站顯示
npx -y @latitude-data/claude-code-telemetry install命令)。 - 設定 hook/preload 和代理啟動器:安裝程式會設定 hook、preload 和
launchctl .plist,作為在本機設定監控的一部分。 - 建立免費 Latitude 帳戶:註冊 Latitude 以跨專案監控代理行為。
- 開始監控並檢視追蹤:設定完成後,使用追蹤和監控檢視來檢查 turn、工具呼叫、輸出和相關檔案,並追蹤使用量與成本。
使用情境
- 除錯生產環境中的代理失敗:當 Claude Code 失敗時,使用 Latitude 捕捉的追蹤(提示、工具呼叫、Bash 輸出和觸及檔案)來辨識特定工作階段的問題。
- 驗證修復是否生效:在提示、工具或工作流程變更後,比較產生的工作階段追蹤,確認新的系統提示/工具 schema 及後續工具呼叫是否如預期運作。
- 審核代理實際行為:透過檢視代理觸及的精確檔案和每個 turn 的確切命令輸出,調查合規或安全相關問題。
- 管理 token 支出:使用每個工作階段成本可視性和 token 使用統計,了解提示/工作階段/工作區層級的任務成本,並管控費用。
- 從真實流量建置評估:從即時工作階段捕捉真實輸入、輸出和上下文,支持人工回饋、失敗發現和評估工作流程。
常見問題
Latitude 是否專屬於 Claude Code?
Latitude 被描述為監控 Claude Code 行為,包括其在運行時組成的系統提示和工具 schema。
Latitude 在工作階段中收集哪些資料?
頁面指出它捕捉提示、工具呼叫、Bash 輸出和代理觸及的檔案,並記錄運行時使用的系統提示和工具 schema。
如何開始監控?
網站指示使用 npx 安裝命令在本機安裝 Latitude 遙測,然後註冊 Latitude 以跨專案監控行為。
Latitude 是否提供成本可視性?
是的。它列出「每個工作階段成本」,描述提示、工作階段和工作區層級的可視性。
Latitude 是否支援評估和回饋工作流程?
頁面提到從即時流量捕捉真實輸入/輸出/上下文,支持「人工回饋」、「失敗發現」、「Playground」和「Evals」。
替代方案
- 基於 OpenTelemetry 的 LLM 應用程式儀表化:如果您想要以 OpenTelemetry 為中心的可觀測性堆疊,可以在 agent 執行周圍建置自訂追蹤。Latitude 定位為專注於 Claude Code 行為的 agent 可觀測性層。
- 一般應用程式監控(日誌/指標/追蹤):專注於系統健康的工具(日誌/指標/APM)有助於偵測失敗,但可能無法擷取 agent 特定脈絡,如系統提示、工具 schema 以及每個 turn 的工具呼叫細節。
- Agent 評估框架:評估導向的工具有助於針對資料集測試提示和 agent 行為,但通常需要合成輸入;Latitude 強調從即時流量擷取真實輸入和輸出。
替代品
ClawTick
ClawTick 是以 CLI 為核心的 AI 代理自動化平台,可用 cron 排程 webhook 任務,提供監控、警報、重試與執行紀錄。
OpenFlags
OpenFlags 是開源、可自架設的功能旗標系統,支援逐步交付;App SDK 可本地評估,控制平面提供安全、精準的發佈。
BenchSpan
BenchSpan 以並行方式執行 AI agent 基準測試,記錄分數與失敗,並以 commit 標記可重現結果,降低失敗重跑的 token 浪費。
Rectify
Rectify 是一站式 SaaS 作業平台,整合監控、分析、支援、路線圖/更新日誌與代理管理,透過對話介面統一操作。
PromptScout
PromptScout 追蹤 Prompt 影響力:監測 ChatGPT、Gemini、Google AI Overviews、Perplexity 的品牌提及、競品推薦與引用來源,並結合網站稽核與內容簡報。
Sleek Analytics
Sleek Analytics 提供輕量、重視隱私的即時訪客追蹤,顯示訪客來源、瀏覽內容與停留時間,掌握站點現況互動。