UStackUStack
MartinLoop icon

MartinLoop

MartinLoop 是專為 AI 程式碼代理打造的受治理 runtime,執行前先加規則、完成前先檢查、每次執行後保留紀錄,適用於 Claude、Codex 或自訂 agent 的生產環境團隊。

MartinLoop

MartinLoop 是什麼?

MartinLoop 是專為 AI 程式碼代理打造的受治理 runtime。它設計為包覆在 Claude、Codex 或自訂模型等 agent 外層,提供執行變更程式碼任務所需的控管:執行前加規則、完成前先檢查,並在每次執行後保留紀錄。

這個產品著重於讓團隊情境中的 agent 工作更容易管理。MartinLoop 不把模型本身當作系統,而是負責 retry 邏輯、預算管控、執行紀錄與完成檢查,讓團隊能回顧發生了什麼,並判斷輸出是否已可合併。

主要功能

  • 更聰明的重試:失敗嘗試會被壓縮成結構化訊號,而不是原樣送回,有助於讓每次重試的 token 用量保持穩定。
  • 精準的失敗處理:MartinLoop 將失敗分成 12 類,並依問題套用不同修正,例如針對語法錯誤做約束修復、針對幻覺做 grounding 檢查。
  • 硬性預算上限:使用者可在執行開始前設定美元上限,MartinLoop 會即時監控支出,並在達到上限時停止。
  • 智慧退出:當效益遞減或接近預算上限時,系統可乾淨地結束執行,而不是不必要地持續下去。
  • 準確的成本計算:會計入執行中的所有 token,包括 thinking tokens 與 sub-agent 花費,以降低低估情況。
  • 執行紀錄與受治理完成:來源提到 JSONL 執行紀錄與 evidence-gated completions,讓團隊保有稽核軌跡,並能在執行被視為完成前驗證結果。

如何使用 MartinLoop

典型流程是把 MartinLoop 接在你已在使用的 AI 程式碼代理外層,定義此次執行的規則與預算,然後開始任務。接著 MartinLoop 會管理重試、監控成本、套用針對失敗類型的處理,並記錄執行結果。

執行結束後,團隊可以檢視紀錄與任何完成證據,了解發生了什麼、修正了什麼,以及結果是否可接受用於合併或繼續開發。

使用情境

  • 生產環境的 AI 程式碼工作流程:工程團隊可在受控規則下執行 Claude、Codex 或其他 agent,當輸出可能會合併進儲存庫時特別適用。
  • 可控預算的 agent 執行:平台或工程主管可為任務設定美元上限,讓 agent 花費在較長或反覆執行時仍保持可預測。
  • 除錯重複性的 agent 失敗:團隊可使用針對性失敗處理,對語法錯誤、幻覺與其他失敗類型採取不同回應,而不是盲目重試。
  • 可稽核性與審查:需要記錄 agent 做了什麼的組織,可使用 JSONL 執行日誌與執行後紀錄來檢視變更與決策。
  • 圍繞 agent 工作的團隊治理:希望在完成前加入檢查的團隊,可用 MartinLoop 在自主程式生成外加上核准或證據步驟。

常見問題

MartinLoop 是另一個 coding agent 嗎?
不是。來源將 MartinLoop 描述為包在 AI coding agents 外層的系統,而不是實際撰寫程式碼的工作者。

它支援哪些 agents?
頁面明確提到 Claude、Codex 與自訂 agents。除此之外,來源沒有列出其他相容工具。

MartinLoop 是開源嗎?
是。核心採用 Apache 2.0 授權。託管儀表板與受管理控制平面則被描述為商業產品。

有包含價格資訊嗎?
開源核心標示為免費。付費方案標為即將推出與搶先體驗,但頁面未提供具體價格。

它是給誰用的?
FAQ 與頁面文案指出,它適合在生產環境中使用 AI 程式碼代理、並需要控制、可稽核性與紀錄的工程團隊、平台團隊與 CTO。

替代方案

  • 直接使用 AI 程式碼代理:像 Claude 或 Codex 這類工具可以生成與編輯程式碼,但不提供 MartinLoop 設計要加入的周邊治理層。
  • 一般 CI/CD 或程式碼審查流程:傳統管線可在事後驗證程式碼,但它們不是為在執行期間管理自主 agent 而設計。
  • Agent orchestration framework:更廣泛的 orchestration 工具可協調跨模型與工具的任務,但未必特別聚焦於程式碼代理的預算上限、失敗類別處理與執行紀錄。
  • 自建內部 wrapper:團隊可以自行為 agents 建立控制機制,但 MartinLoop 將 runtime、記錄、預算管理與完成檢查整合成一套系統。
MartinLoop | UStack