UStackUStack
Edgee icon

Edgee

Edgee Fallback Models enruta sesiones de Claude Code con failover automático a otros modelos si Anthropic cae o se alcanza el límite de uso.

Edgee

¿Qué es Edgee Fallback Models?

Edgee Fallback Models es una capa de enrutamiento para sesiones de Claude Code que mantiene las solicitudes en marcha cuando el modelo principal falla, alcanza una cuota o deja de estar disponible. Se sitúa entre Claude Code y los proveedores de modelos, de modo que una solicitud puede reintentarse con un modelo de fallback configurado sin cambiar el flujo de trabajo ni el código del desarrollador.

El producto está diseñado para usuarios que dependen de Claude Code para trabajo continuo y quieren failover automático a otros modelos como modelos alojados por Edgee, proveedores BYOK o endpoints de IA alojados en la nube. También admite redirigir solicitudes a un modelo específico para estandarización o control de costes.

Características clave

  • Fallback automático ante respuestas 429 y 5xx: si el modelo principal tiene limitación por tasa o devuelve errores, Edgee reintenta la misma solicitud a través del siguiente modelo de la cadena configurada.
  • Detección de límites de tasa y cuota: Edgee puede cambiar de modelo cuando se alcanza un tope semanal del plan u otro umbral de uso, reduciendo interrupciones durante sesiones largas de programación.
  • Cadenas de modelos ordenadas por prioridad: los usuarios configuran una secuencia preferida de modelos en el panel, y Edgee enruta las solicitudes según ese orden.
  • Compatibilidad con varias herramientas cliente: la página indica que funciona con Claude Code, Codex y OpenCode, lo que hace que el enfoque de enrutamiento sea utilizable en más de un cliente de programación.
  • Modelos de fallback alojados por Edgee: el servicio incluye seis modelos alojados listos para usar sin claves API separadas, incluidas opciones de Gemma, GLM, Qwen, Kimi y MiniMax.
  • Opciones Bring Your Own Key y Bring Your Own Cloud: los usuarios pueden enrutar el tráfico de fallback a proveedores como OpenAI, Anthropic, Mistral, DeepSeek, xAI, AWS Bedrock, Google Vertex AI y Azure OpenAI usando sus propias credenciales.
  • Configuración basada en panel: el flujo de trabajo se configura en el panel y la CLI de Edgee, sin necesidad de configurar un proxy ni cambiar código.
  • Redirección transparente: las solicitudes continúan por la ruta de fallback con el mismo contexto de sesión, por lo que el desarrollador no necesita reiniciar manualmente el flujo de trabajo.

Cómo usar Edgee Fallback Models

Empieza instalando la CLI de Edgee y conectando Claude Code a través de Edgee en lugar de enviar solicitudes directamente a Anthropic. Luego configura en el panel una cadena de fallback ordenada por prioridad, seleccionando modelos alojados, proveedores BYOK o endpoints en la nube según sea necesario. Después de eso, Edgee supervisa las solicitudes y las redirige automáticamente cuando el modelo principal falla o alcanza un límite.

Casos de uso

  • Gestionar una caída de un proveedor durante trabajo activo de programación: si Claude Opus u otro modelo principal deja de estar disponible, Edgee puede mover la solicitud al siguiente modelo para que la sesión continúe.
  • Recuperarse de límites del plan o de uso: cuando se alcanza un límite semanal, los equipos pueden seguir usando Claude Code sin esperar a que se reinicie la ventana.
  • Estandarizar la selección de modelos en un equipo: un grupo puede enrutar solicitudes a un único modelo de fallback aprobado en lugar de dejar que cada cliente elija de forma independiente.
  • Usar las propias cuentas en la nube de una organización: los equipos que quieren que el tráfico de fallback permanezca dentro de su entorno de AWS, Google Cloud o Azure pueden configurar Bedrock, Vertex AI o Azure OpenAI.
  • Añadir un plan B para cambios de política o facturación: las organizaciones que dependen de Claude Code pueden prepararse para cambios de cuota o facturación configurando modelos alternativos con antelación.

Preguntas frecuentes

¿Edgee requiere cambios en los prompts de Claude Code o en el código fuente? No. La página indica que la configuración usa la CLI y el panel de Edgee, sin cambios de código.

¿Con qué productos funciona? La página menciona explícitamente Claude Code, Codex y OpenCode.

¿Puedo usar mis propios proveedores de modelos en lugar de los modelos alojados por Edgee? Sí. La página indica que puedes aportar tu propia clave o enrutar a través de tus propias cuentas en la nube, incluyendo AWS Bedrock, Google Vertex AI y Azure OpenAI.

¿Qué pasa cuando falla el modelo principal? Edgee detecta errores como respuestas 429 y 5xx, o un umbral de cuota, y enruta la misma solicitud al siguiente modelo disponible en tu cadena de fallback.

¿El enrutamiento de fallback está incluido en todos los planes? No. La página dice que el fallback automático y la redirección forman parte del plan Team.

Alternativas

  • Cambio manual de modelos en Claude Code u otro cliente: esto mantiene el flujo de trabajo simple, pero requiere que una persona detecte los fallos y cambie de modelo manualmente.
  • Uso directo de un único proveedor de IA: esto evita una capa de enrutamiento extra, pero deja el flujo de trabajo dependiente del tiempo de actividad y las políticas de cuota de un solo proveedor.
  • Infraestructura personalizada de proxy o gateway: los equipos pueden construir su propia lógica de enrutamiento, pero eso normalmente implica mantener ellos mismos la infraestructura, las comprobaciones de estado y las reglas de failover específicas de cada proveedor.
  • Endpoints de IA nativos de la nube sin una capa unificada de fallback: AWS Bedrock, Google Vertex AI o Azure OpenAI pueden alojar modelos, pero aquí no se presentan como un sistema completo de failover para Claude Code por sí solos.
Edgee | UStack