UStackUStack
Edgee icon

Edgee

Edgee Fallback Modelsは、Anthropic障害や利用上限到達時に自動で他モデルへ切り替え、Claude Codeを止めずに動かすルーティング層。コード変更なしで導入できます。

Edgee

Edgee Fallback Modelsとは?

Edgee Fallback Modelsは、Claude Codeセッション向けのルーティング層で、主モデルが失敗したり、クォータに達したり、利用不可になった場合でもリクエストを止めずに流し続けます。Claude Codeとモデル提供元の間に入り、開発者のワークフローやコードを変えずに、設定済みのフォールバックモデルへ再試行できます。

この製品は、継続的な作業でClaude Codeを利用し、Edgeeホストモデル、BYOKプロバイダー、クラウドホスト型AIエンドポイントなどへの自動フェイルオーバーを求めるユーザー向けに設計されています。また、標準化やコスト管理のために、特定のモデルへリクエストを再ルーティングすることもできます。

主な機能

  • 429および5xx応答で自動フォールバック: 主モデルがレート制限に達するかエラーを返すと、Edgeeは設定済みチェーンの次のモデル経由で同じリクエストを再試行します。
  • レート制限とクォータの検知: Edgeeは週次プラン上限やその他の利用閾値に達したときにモデルを切り替えられるため、長時間のコーディングセッション中の中断を減らせます。
  • 優先順のモデルチェーン: ユーザーはダッシュボードで希望するモデル順を設定でき、Edgeeはその順序に従ってリクエストをルーティングします。
  • 複数のクライアントツールに対応: ページではClaude Code、Codex、OpenCodeで動作するとされており、複数のコーディングクライアントでこのルーティング方式を使えます。
  • Edgeeホストのフォールバックモデル: このサービスには、Gemma、GLM、Qwen、Kimi、MiniMaxのオプションを含む、個別のAPIキーなしですぐ使えるホスト済みモデルが6つ含まれています。
  • Bring Your Own Key と Bring Your Own Cloudのオプション: ユーザーは自分の認証情報を使って、OpenAI、Anthropic、Mistral、DeepSeek、xAI、AWS Bedrock、Google Vertex AI、Azure OpenAIなどのプロバイダーへフォールバックトラフィックをルーティングできます。
  • ダッシュボードベースの設定: ワークフローはEdgeeのダッシュボードとCLIで設定され、プロキシ設定やコード変更は不要です。
  • 透過的な再ルーティング: リクエストは同じセッションコンテキストを保ったままフォールバック経路を通るため、開発者が手動でワークフローを再起動する必要はありません。

Edgee Fallback Modelsの使い方

まずEdgee CLIをインストールし、Anthropicへ直接送信する代わりにEdgee経由でClaude Codeを接続します。次に、ダッシュボードで優先順のフォールバックチェーンを設定し、必要に応じてホスト済みモデル、BYOKプロバイダー、クラウドエンドポイントを選択します。その後は、Edgeeがリクエストを監視し、主モデルが失敗したり制限に達したりしたときに自動で再ルーティングします。

ユースケース

  • アクティブなコーディング作業中のプロバイダー障害への対応: Claude Opusや他の主モデルが利用不可になっても、Edgeeが次のモデルへリクエストを移し、セッションを継続できます。
  • プランや利用上限からの復旧: 週次上限に達しても、リセットまで待たずにClaude Codeを使い続けられます。
  • チーム全体でのモデル選択の標準化: 各クライアントに任せず、グループで承認済みの単一フォールバックモデルへリクエストをルーティングできます。
  • 組織のクラウドアカウントの活用: フォールバックトラフィックを自社のAWS、Google Cloud、Azure環境内に留めたいチームは、Bedrock、Vertex AI、Azure OpenAIを設定できます。
  • ポリシーや請求変更に備えたPlan Bの追加: Claude Codeに依存する組織は、代替モデルを事前に設定して、クォータや請求の変更に備えられます。

FAQ

Edgeeを使うのにClaude Codeのプロンプトやソースコードの変更は必要ですか?
いいえ。ページでは、設定はEdgee CLIとダッシュボードを使い、コード変更は不要とされています。

どの製品で使えますか?
ページでは、Claude Code、Codex、OpenCodeが明記されています。

Edgeeホストモデルの代わりに自分のモデルプロバイダーを使えますか?
はい。ページでは、AWS Bedrock、Google Vertex AI、Azure OpenAIを含め、独自のキーを持ち込むか自分のクラウドアカウント経由でルーティングできるとしています。

主モデルが失敗したらどうなりますか?
Edgeeは429や5xx応答、またはクォータ閾値のようなエラーを検知し、同じリクエストをフォールバックチェーン内の次の利用可能なモデルへルーティングします。

フォールバックルーティングはすべてのプランに含まれますか?
いいえ。ページでは、自動フォールバックと再ルーティングはTeamプランに含まれるとされています。

代替案

  • Claude Code または他のクライアントで手動でモデルを切り替える: ワークフローはシンプルなままですが、障害に気づいて手動でモデルを変更する人が必要です。
  • 単一のAIプロバイダーを直接使う: 追加のルーティング層を避けられますが、ワークフローが1社の稼働状況とクオータポリシーに依存します。
  • カスタムのプロキシやゲートウェイ基盤: チームは独自のルーティングロジックを構築できますが、通常はインフラ、ヘルスチェック、プロバイダー固有のフェイルオーバー規則を自分たちで維持する必要があります。
  • 統一されたフォールバック層のないクラウドネイティブAIエンドポイント: AWS Bedrock、Google Vertex AI、Azure OpenAI でモデルをホストできますが、単体では完全な Claude Code フェイルオーバーシステムとしてはここでは扱われていません。
Edgee | UStack