UStackUStack
Edgee icon

Edgee

Edgee Fallback Models mantém sessões do Claude Code ativas com failover automático para outros modelos quando a Anthropic fica indisponível ou o limite é atingido.

Edgee

O que é o Edgee Fallback Models?

O Edgee Fallback Models é uma camada de roteamento para sessões do Claude Code que mantém as requisições em andamento quando o modelo principal falha, atinge uma cota ou fica indisponível. Ele fica entre o Claude Code e os provedores de modelos, permitindo que uma requisição seja reenviada para um modelo de fallback configurado sem alterar o fluxo de trabalho ou o código do desenvolvedor.

O produto foi projetado para usuários que dependem do Claude Code em trabalhos contínuos e querem failover automático para outros modelos, como modelos hospedados pela Edgee, provedores BYOK ou endpoints de IA hospedados na nuvem. Ele também permite redirecionar requisições para um modelo específico para padronização ou controle de custos.

Principais recursos

  • Fallback automático em respostas 429 e 5xx: se o modelo principal estiver com limitação de taxa ou apresentar erro, a Edgee tenta novamente a mesma requisição pelo próximo modelo na cadeia configurada.
  • Detecção de limite de taxa e cota: a Edgee pode trocar de modelo quando um teto do plano semanal ou outro limite de uso é atingido, reduzindo interrupções em sessões longas de programação.
  • Cadeias de modelos em ordem de prioridade: os usuários configuram uma sequência preferida de modelos no painel, e a Edgee roteia as requisições conforme essa ordem.
  • Suporte a várias ferramentas cliente: a página diz que funciona com Claude Code, Codex e OpenCode, o que torna a abordagem de roteamento utilizável em mais de um cliente de programação.
  • Modelos de fallback hospedados pela Edgee: o serviço inclui seis modelos hospedados prontos para uso sem chaves de API separadas, incluindo opções como Gemma, GLM, Qwen, Kimi e MiniMax.
  • Opções Bring Your Own Key e Bring Your Own Cloud: os usuários podem rotear o tráfego de fallback para provedores como OpenAI, Anthropic, Mistral, DeepSeek, xAI, AWS Bedrock, Google Vertex AI e Azure OpenAI usando suas próprias credenciais.
  • Configuração baseada no painel: o fluxo de trabalho é configurado no painel e na CLI da Edgee, sem necessidade de proxy ou alterações no código.
  • Redirecionamento transparente: as requisições continuam pelo caminho de fallback com o mesmo contexto da sessão, então o desenvolvedor não precisa reiniciar o fluxo de trabalho manualmente.

Como usar o Edgee Fallback Models

Comece instalando a CLI da Edgee e conectando o Claude Code pela Edgee, em vez de enviar requisições diretamente para a Anthropic. Depois, configure uma cadeia de fallback em ordem de prioridade no painel, selecionando modelos hospedados, provedores BYOK ou endpoints de nuvem conforme necessário. Em seguida, a Edgee monitora as requisições e as redireciona automaticamente quando o modelo principal falha ou atinge um limite.

Casos de uso

  • Lidar com uma indisponibilidade de provedor durante um trabalho ativo de programação: se o Claude Opus ou outro modelo principal ficar indisponível, a Edgee pode mover a requisição para o próximo modelo para que a sessão continue.
  • Recuperar-se de limites de plano ou uso: quando um limite semanal é atingido, as equipes podem continuar usando o Claude Code sem esperar a janela de redefinição.
  • Padronizar a seleção de modelos em uma equipe: um grupo pode rotear requisições para um único modelo de fallback aprovado, em vez de deixar cada cliente escolher de forma independente.
  • Usar as próprias contas de nuvem da organização: equipes que querem que o tráfego de fallback permaneça no ambiente AWS, Google Cloud ou Azure podem configurar Bedrock, Vertex AI ou Azure OpenAI.
  • Adicionar um plano B para mudanças de política ou cobrança: organizações que dependem do Claude Code podem se preparar para mudanças de cota ou cobrança configurando modelos alternativos com antecedência.

FAQ

O Edgee exige mudanças nos prompts do Claude Code ou no código-fonte? Não. A página informa que a configuração usa a CLI e o painel da Edgee, sem necessidade de alterações no código.

Com quais produtos ele funciona? A página menciona explicitamente Claude Code, Codex e OpenCode.

Posso usar meus próprios provedores de modelo em vez dos modelos hospedados pela Edgee? Sim. A página diz que você pode trazer sua própria chave ou rotear por suas próprias contas de nuvem, incluindo AWS Bedrock, Google Vertex AI e Azure OpenAI.

O que acontece quando o modelo principal falha? A Edgee detecta erros como respostas 429 e 5xx, ou um limite de cota, e roteia a mesma requisição para o próximo modelo disponível na sua cadeia de fallback.

O roteamento de fallback está incluído em todos os planos? Não. A página diz que o fallback automático e o redirecionamento fazem parte do plano Team.

Alternativas

  • Alternar modelos manualmente no Claude Code ou noutro cliente: mantém o fluxo de trabalho simples, mas exige que alguém perceba as falhas e troque de modelo manualmente.
  • Uso direto de um único fornecedor de IA: evita uma camada extra de roteamento, mas deixa o fluxo de trabalho dependente da disponibilidade e das políticas de quota de um único fornecedor.
  • Infraestrutura personalizada de proxy ou gateway: as equipas podem criar a sua própria lógica de roteamento, mas isso normalmente significa manter por conta própria a infraestrutura, as verificações de saúde e as regras de failover específicas de cada fornecedor.
  • Endpoints de IA cloud-native sem uma camada de fallback unificada: AWS Bedrock, Google Vertex AI ou Azure OpenAI podem alojar modelos, mas aqui não são apresentados como um sistema completo de failover para o Claude Code por si só.
Edgee | UStack