UStackUStack
Edgee icon

Edgee

Edgee Fallback Models instrada le sessioni Claude Code con failover automatico a modelli alternativi quando Anthropic non è disponibile o si raggiunge il limite di utilizzo.

Edgee

Cos’è Edgee Fallback Models?

Edgee Fallback Models è un layer di routing per le sessioni Claude Code che mantiene le richieste in movimento quando il modello principale fallisce, raggiunge una quota o diventa non disponibile. Si colloca tra Claude Code e i provider di modelli, così una richiesta può essere ritentata su un modello di fallback configurato senza modificare il flusso di lavoro o il codice dello sviluppatore.

Il prodotto è pensato per chi si affida a Claude Code per lavoro continuativo e vuole un failover automatico verso altri modelli, come modelli ospitati da Edgee, provider BYOK o endpoint AI ospitati nel cloud. Supporta anche il reindirizzamento delle richieste a un modello specifico per standardizzazione o controllo dei costi.

Funzionalità principali

  • Fallback automatico su risposte 429 e 5xx: se il modello principale è soggetto a rate limit o va in errore, Edgee ritenta la stessa richiesta tramite il modello successivo nella catena configurata.
  • Rilevamento di rate limit e quote: Edgee può cambiare modello quando viene raggiunto un tetto del piano settimanale o un altro limite di utilizzo, riducendo le interruzioni durante lunghe sessioni di coding.
  • Catene di modelli in ordine di priorità: gli utenti configurano nel dashboard una sequenza preferita di modelli, e Edgee instrada le richieste secondo quell’ordine.
  • Supporto per più strumenti client: la pagina indica che funziona con Claude Code, Codex e OpenCode, rendendo l’approccio di routing utilizzabile con più di un client di coding.
  • Modelli di fallback ospitati da Edgee: il servizio include sei modelli ospitati pronti all’uso senza chiavi API separate, incluse opzioni Gemma, GLM, Qwen, Kimi e MiniMax.
  • Opzioni Bring Your Own Key e Bring Your Own Cloud: gli utenti possono instradare il traffico di fallback verso provider come OpenAI, Anthropic, Mistral, DeepSeek, xAI, AWS Bedrock, Google Vertex AI e Azure OpenAI usando le proprie credenziali.
  • Configurazione basata su dashboard: il flusso di lavoro si configura nel dashboard e nella CLI di Edgee, senza proxy né modifiche al codice.
  • Reindirizzamento trasparente: le richieste proseguono nel percorso di fallback con lo stesso contesto di sessione, così lo sviluppatore non deve riavviare manualmente il flusso di lavoro.

Come usare Edgee Fallback Models

Inizia installando la CLI di Edgee e collegando Claude Code tramite Edgee invece di inviare le richieste direttamente ad Anthropic. Poi configura nel dashboard una catena di fallback in ordine di priorità, selezionando modelli ospitati, provider BYOK o endpoint cloud secondo necessità. Dopodiché, Edgee monitora le richieste e le reindirizza automaticamente quando il modello principale fallisce o raggiunge un limite.

Casi d’uso

  • Gestire un disservizio del provider durante un’attività di coding attiva: se Claude Opus o un altro modello principale diventa non disponibile, Edgee può spostare la richiesta sul modello successivo così la sessione continua.
  • Recuperare da limiti di piano o di utilizzo: quando viene raggiunto un limite settimanale, i team possono continuare a usare Claude Code senza attendere la finestra di reset.
  • Standardizzare la selezione del modello in un team: un gruppo può instradare le richieste verso un unico modello di fallback approvato invece di lasciare che ogni client scelga in modo indipendente.
  • Usare gli account cloud dell’organizzazione: i team che vogliono che il traffico di fallback resti nel proprio ambiente AWS, Google Cloud o Azure possono configurare Bedrock, Vertex AI o Azure OpenAI.
  • Aggiungere un piano B per cambi di policy o di billing: le organizzazioni che dipendono da Claude Code possono prepararsi a cambiamenti di quote o di fatturazione impostando in anticipo modelli alternativi.

FAQ

Edgee richiede modifiche ai prompt di Claude Code o al codice sorgente?
No. La pagina indica che la configurazione usa la CLI e il dashboard di Edgee, senza modifiche al codice.

Con quali prodotti funziona?
La pagina menziona esplicitamente Claude Code, Codex e OpenCode.

Posso usare i miei provider di modelli invece dei modelli ospitati da Edgee?
Sì. La pagina dice che puoi portare la tua chiave o instradare tramite i tuoi account cloud, inclusi AWS Bedrock, Google Vertex AI e Azure OpenAI.

Cosa succede quando il modello principale fallisce?
Edgee rileva errori come risposte 429 e 5xx, oppure una soglia di quota, e instrada la stessa richiesta al modello disponibile successivo nella catena di fallback.

Il routing di fallback è incluso in tutti i piani?
No. La pagina dice che il fallback automatico e il reindirizzamento fanno parte del piano Team.

Alternative

  • Cambio manuale del modello in Claude Code o in un altro client: mantiene il flusso di lavoro semplice, ma richiede che una persona noti i guasti e cambi modello manualmente.
  • Uso diretto di un singolo provider AI: evita un ulteriore livello di routing, ma lascia il flusso di lavoro dipendente dall’uptime e dalle politiche di quota di un solo vendor.
  • Infrastruttura proxy o gateway personalizzata: i team possono creare la propria logica di routing, ma di solito significa dover gestire autonomamente infrastruttura, health check e regole di failover specifiche del provider.
  • Endpoint AI cloud-native senza un livello di fallback unificato: AWS Bedrock, Google Vertex AI o Azure OpenAI possono ospitare modelli, ma qui non sono presentati come un sistema completo di failover per Claude Code.
Edgee | UStack