MartinLoop
MartinLoopは、AIコーディングエージェント向けのガバナンス付きランタイムです。実行前のルール、完了前のチェック、各実行後の記録で、Claude、Codex、独自エージェントの運用を支援します。
MartinLoopとは?
MartinLoopは、AIコーディングエージェント向けのガバナンス付きランタイムです。Claude、Codex、またはカスタムモデルの周囲で動作し、コード変更を伴うタスクをより厳密に管理するための制御を提供します。実行前のルール、完了前のチェック、各実行後の記録を備えています。
この製品は、チーム環境でのエージェント作業を管理しやすくすることに重点を置いています。モデルをシステムそのものとして扱うのではなく、MartinLoopがリトライロジック、予算の強制、実行記録、完了チェックを処理することで、チームは何が起きたかを確認し、出力がマージ可能かどうかを判断できます。
主な機能
- より賢いリトライ: 失敗した試行はそのまま送り返さず、構造化されたシグナルに圧縮されるため、リトライを重ねてもトークン使用量を一定に保ちやすくなります。
- 対象を絞った失敗処理: MartinLoopは失敗を12のクラスに分類し、問題に応じて異なる修正を適用します。たとえば、構文エラーには制約修復、幻覚には根拠確認を行います。
- 厳格な予算上限: ユーザーは実行開始前にドル上限を設定でき、MartinLoopが支出をリアルタイムで監視し、上限に達すると停止します。
- スマートな終了: システムは、成果が逓減している場合や予算上限に近づいている場合に、無駄に継続せず、実行をきれいに終了できます。
- 正確なコスト計上: 思考トークンやサブエージェントの支出も含め、実行に関わるすべてのトークンを計上し、過少報告を抑えます。
- 実行記録とガバナンス付き完了: ソースではJSONLの実行記録と証拠ベースの完了が言及されており、監査証跡と、実行完了とみなす前に結果を確認する手段をチームに提供します。
MartinLoopの使い方
一般的なワークフローは、すでに使っているAIコーディングエージェントの周囲にMartinLoopを接続し、実行のルールと予算を定義して、タスクを開始するというものです。その後、MartinLoopがリトライを管理し、コストを監視し、失敗に応じた処理を適用し、実行結果を記録します。
実行後、チームは記録と完了の証拠を確認して、何が起きたか、何が修正されたか、結果がマージしてよいか、あるいは作業を継続すべきかを把握できます。
使用例
- 本番のAIコーディングワークフロー: エンジニアリングチームは、出力がリポジトリにマージされる可能性がある場合、Claude、Codex、または他のエージェントを制御されたルールの下で実行できます。
- 予算管理されたエージェント実行: プラットフォームやエンジニアリングの責任者は、タスクにドル上限を設定して、長時間または反復実行でもエージェントの支出を予測可能に保てます。
- 繰り返し発生するエージェント失敗のデバッグ: チームは対象を絞った失敗処理を使い、構文エラー、幻覚、その他の失敗クラスに対して、盲目的にリトライするのではなく異なる対応ができます。
- 監査可能性とレビュー: エージェントが何をしたかの記録が必要な組織は、JSONLの実行ログと実行後レコードを使って、変更や判断を確認できます。
- エージェント作業に対するチームガバナンス: 完了前のチェックを求めるチームは、MartinLoopを使って自律的なコード生成の周囲に承認または証拠確認のステップを追加できます。
FAQ
MartinLoopは別のコーディングエージェントですか?
いいえ。ソースではMartinLoopはコードを書く作業者ではなく、AIコーディングエージェントの周囲にあるシステムとして説明されています。
どのエージェントで使えますか?
ページではClaude、Codex、カスタムエージェントが明示されています。それ以外の対応ツールについてはソースに記載がありません。
MartinLoopはオープンソースですか?
はい。コア部分はApache 2.0ライセンスです。ホスト型ダッシュボードと管理されたコントロールプレーンは商用として説明されています。
価格は含まれていますか?
オープンソースのコアは無料と記載されています。有料プランは近日公開および早期アクセスとして示されていますが、ページには具体的な価格はありません。
誰向けですか?
FAQとページの説明は、本番環境でAIコーディングエージェントを運用し、制御、監査可能性、記録を必要とするエンジニアリングチーム、プラットフォームチーム、CTOを指しています。
代替案
- AIコーディングエージェントを直接使う: ClaudeやCodexのようなツールはコードを生成・編集できますが、MartinLoopが追加するよう設計されている周辺のガバナンス層はありません。
- 一般的なCI/CDやコードレビューのワークフロー: 従来のパイプラインは事後的にコードを検証できますが、実行中の自律的なエージェントを管理するためには作られていません。
- エージェントオーケストレーションフレームワーク: より広範なオーケストレーションツールはモデルやツール間のタスクを調整できますが、コードエージェント向けの予算上限、失敗クラス処理、実行記録には重点を置いていない場合があります。
- 独自の内部ラッパー: チームはエージェントの周囲に独自の制御を構築できますが、MartinLoopはランタイム、ログ記録、予算管理、完了チェックを1つのシステムにまとめています。
代替品
AakarDev AI
AakarDev AIは、シームレスなベクターデータベース統合を通じてAIアプリケーションの開発を簡素化し、迅速な展開とスケーラビリティを実現する強力なプラットフォームです。
Arduino VENTUNO Q
Arduino VENTUNO Qはロボット向けエッジAIコンピュータ。AI推論とマイコン制御を統合し、Arduino App Labで埋め込み/ Linux/エッジAI開発。
Devin
Devinは、AIコーディングエージェントとして移行や大規模リファクタのサブタスクを並列実行。人が管理し変更を承認。
MakerLoft
MakerLoftは開発不要でAIがGitHub連携し、認証・決済・ファイルアップロード・定期処理・管理画面などの機能付きアプリを生成。
open-codex-computer-use
open-codex-computer-use は、MCPサーバーで「Computer Use」機能を提供するオープンソース。macOS/Linux/WindowsでGUI操作を実行可能。
Codex Plugins
Codex Pluginsでスキル、アプリ連携、MCPサーバーを再利用可能なワークフローにまとめ、Gmail・Google Drive・Slack等のツールにアクセス。