UStackUStack
Edgee icon

Edgee

Edgee Fallback Models 是面向 Claude Code 会话的路由层,当 Anthropic 中断或达到用量限制时,可自动切换到其他模型,持续运行开发流程,无需改代码或重启工作流。

Edgee

什么是 Edgee Fallback Models?

Edgee Fallback Models 是 Claude Code 会话的路由层,在主模型失败、达到配额或不可用时,能持续推进请求。它位于 Claude Code 与模型提供方之间,因此请求可在不改变开发者工作流或代码的情况下,重试到已配置的备用模型。

该产品面向依赖 Claude Code 持续工作的用户,提供自动故障转移到其他模型的能力,例如 Edgee 托管模型、BYOK 提供方或云端 AI 端点。它也支持将请求重新路由到特定模型,用于标准化或成本控制。

主要功能

  • 在 429 和 5xx 响应时自动切换:如果主模型被限流或报错,Edgee 会通过已配置链中的下一个模型重试同一请求。
  • 速率限制和配额检测:当达到每周方案上限或其他使用阈值时,Edgee 可以切换模型,减少长时间编码会话中的中断。
  • 按优先级排序的模型链:用户在控制台中配置首选模型顺序,Edgee 按该顺序路由请求。
  • 支持多个客户端工具:页面说明它可与 Claude Code、Codex 和 OpenCode 配合使用,使该路由方案可用于多个编码客户端。
  • Edgee 托管备用模型:服务包含 6 个可直接使用、无需单独 API 密钥的托管模型,包括 Gemma、GLM、Qwen、Kimi 和 MiniMax 选项。
  • 自带密钥和自带云选项:用户可使用自己的凭据,将备用流量路由到 OpenAI、Anthropic、Mistral、DeepSeek、xAI、AWS Bedrock、Google Vertex AI 和 Azure OpenAI 等提供方。
  • 基于控制台的设置:工作流通过 Edgee 控制台和 CLI 配置,无需代理设置或代码修改。
  • 透明重路由:请求会沿备用路径继续,并保留相同的会话上下文,因此开发者无需手动重启工作流。

如何使用 Edgee Fallback Models

先安装 Edgee CLI,并通过 Edgee 连接 Claude Code,而不是直接向 Anthropic 发送请求。然后在控制台中配置按优先级排序的备用链,按需选择托管模型、BYOK 提供方或云端端点。之后,Edgee 会监控请求,并在主模型失败或达到限制时自动重路由。

使用场景

  • 在活跃编码过程中处理提供方中断:如果 Claude Opus 或其他主模型不可用,Edgee 可将请求移到下一个模型,让会话继续。
  • 从方案或使用上限中恢复:当达到每周限制时,团队无需等待重置窗口即可继续使用 Claude Code。
  • 在团队内统一模型选择:团队可以将请求路由到一个已批准的备用模型,而不是让每个客户端各自选择。
  • 使用组织自己的云账户:希望备用流量留在自身 AWS、Google Cloud 或 Azure 环境中的团队,可以配置 Bedrock、Vertex AI 或 Azure OpenAI。
  • 为政策或计费变更预留 Plan B:依赖 Claude Code 的组织可以提前设置备用模型,以应对配额或计费变化。

常见问题

Edgee 是否需要更改 Claude Code 提示词或源代码? 不需要。页面说明设置通过 Edgee CLI 和控制台完成,无需代码改动。

它支持哪些产品? 页面明确提到了 Claude Code、Codex 和 OpenCode。

我能使用自己的模型提供方,而不是 Edgee 托管模型吗? 可以。页面说明你可以自带密钥,或通过自己的云账户路由,包括 AWS Bedrock、Google Vertex AI 和 Azure OpenAI。

当主模型失败时会发生什么? Edgee 会检测 429 和 5xx 响应等错误,或配额阈值,并将同一请求路由到备用链中下一个可用的模型。

所有方案都包含备用路由吗? 不包含。页面说明自动故障转移和重路由属于 Team 方案。

替代方案

  • 在 Claude Code 或其他客户端中手动切换模型:这样能保持工作流简单,但需要有人及时发现故障并手动更换模型。
  • 直接使用单一 AI 提供商:这样可以避免额外的路由层,但工作流会依赖单一厂商的可用性和配额策略。
  • 自定义代理或网关基础设施:团队可以自行构建路由逻辑,但通常意味着需要自己维护基础设施、健康检查和各提供商特定的故障切换规则。
  • 没有统一回退层的云原生 AI 端点:AWS Bedrock、Google Vertex AI 或 Azure OpenAI 可以托管模型,但这里并未将它们单独呈现为完整的 Claude Code 故障切换系统。
Edgee | UStack