Edgee
Edgee Fallback Models hält Claude Code-Sessions am Laufen, indem es bei Ausfällen oder Limits automatisch auf andere Modelle umschaltet – ohne Codeänderung.
Was ist Edgee Fallback Models?
Edgee Fallback Models ist eine Routing-Schicht für Claude Code-Sessions, die Anfragen am Laufen hält, wenn das Primärmodell ausfällt, ein Kontingent erreicht oder nicht verfügbar ist. Sie sitzt zwischen Claude Code und den Modellanbietern, sodass eine Anfrage gegen ein konfiguriertes Fallback-Modell erneut versucht werden kann, ohne den Workflow oder Code des Entwicklers zu ändern.
Das Produkt ist für Nutzer gedacht, die für laufende Arbeit auf Claude Code angewiesen sind und automatisches Failover zu anderen Modellen wie Edgee-gehosteten Modellen, BYOK-Anbietern oder cloudgehosteten KI-Endpunkten möchten. Es unterstützt außerdem das Umleiten von Anfragen auf ein bestimmtes Modell zur Standardisierung oder Kostenkontrolle.
Hauptfunktionen
- Automatisches Fallback bei 429- und 5xx-Antworten: Wenn das Primärmodell durch Rate Limits begrenzt ist oder Fehler zurückgibt, versucht Edgee dieselbe Anfrage über das nächste Modell in der konfigurierten Kette erneut.
- Erkennung von Rate Limits und Kontingenten: Edgee kann Modelle umschalten, wenn ein wöchentliches Planlimit oder ein anderer Nutzungsgrenzwert erreicht ist, und so Unterbrechungen bei langen Coding-Sessions reduzieren.
- Modellketten nach Priorität: Nutzer konfigurieren im Dashboard eine bevorzugte Reihenfolge von Modellen, und Edgee routet Anfragen entsprechend.
- Unterstützung mehrerer Client-Tools: Auf der Seite wird erwähnt, dass es mit Claude Code, Codex und OpenCode funktioniert, wodurch der Routing-Ansatz für mehr als einen Coding-Client nutzbar ist.
- Edgee-gehostete Fallback-Modelle: Der Dienst enthält sechs gehostete Modelle, die ohne separate API-Keys sofort nutzbar sind, darunter Gemma-, GLM-, Qwen-, Kimi- und MiniMax-Optionen.
- Bring Your Own Key- und Bring Your Own Cloud-Optionen: Nutzer können Fallback-Traffic an Anbieter wie OpenAI, Anthropic, Mistral, DeepSeek, xAI, AWS Bedrock, Google Vertex AI und Azure OpenAI mit eigenen Anmeldedaten weiterleiten.
- Einrichtung über das Dashboard: Der Workflow wird im Edgee-Dashboard und per CLI konfiguriert, ohne Proxy-Setup oder Codeänderungen.
- Transparente Umleitung: Anfragen laufen mit demselben Session-Kontext über den Fallback-Pfad weiter, sodass der Entwickler den Workflow nicht manuell neu starten muss.
So verwenden Sie Edgee Fallback Models
Beginnen Sie mit der Installation der Edgee CLI und verbinden Sie Claude Code über Edgee, statt Anfragen direkt an Anthropic zu senden. Konfigurieren Sie dann im Dashboard eine Fallback-Kette nach Priorität und wählen Sie je nach Bedarf gehostete Modelle, BYOK-Anbieter oder Cloud-Endpunkte aus. Danach überwacht Edgee die Anfragen und leitet sie automatisch um, wenn das Primärmodell ausfällt oder ein Limit erreicht.
Anwendungsfälle
- Ein Provider-Ausfall während aktiver Entwicklungsarbeit: Wenn Claude Opus oder ein anderes Primärmodell nicht verfügbar wird, kann Edgee die Anfrage auf das nächste Modell verschieben, damit die Session weiterläuft.
- Wiederaufnahme nach Plan- oder Nutzungslimits: Wenn ein wöchentliches Limit erreicht ist, können Teams Claude Code weiter nutzen, ohne auf das Reset-Fenster zu warten.
- Standardisierung der Modellauswahl im Team: Eine Gruppe kann Anfragen auf ein einziges freigegebenes Fallback-Modell routen, statt jeden Client unabhängig wählen zu lassen.
- Nutzung der eigenen Cloud-Konten eines Unternehmens: Teams, die möchten, dass Fallback-Traffic in ihrer AWS-, Google-Cloud- oder Azure-Umgebung bleibt, können Bedrock, Vertex AI oder Azure OpenAI konfigurieren.
- Ein Plan B für Richtlinien- oder Abrechnungsänderungen: Organisationen, die auf Claude Code angewiesen sind, können sich auf Kontingent- oder Abrechnungsänderungen vorbereiten, indem sie im Voraus alternative Modelle einrichten.
FAQ
Benötigt Edgee Änderungen an Claude-Code-Prompts oder am Quellcode?
Nein. Auf der Seite wird angegeben, dass die Einrichtung über die Edgee CLI und das Dashboard erfolgt, ohne dass Codeänderungen erforderlich sind.
Mit welchen Produkten funktioniert es?
Auf der Seite werden ausdrücklich Claude Code, Codex und OpenCode genannt.
Kann ich meine eigenen Modellanbieter statt der Edgee-gehosteten Modelle verwenden?
Ja. Auf der Seite steht, dass Sie Ihren eigenen Key mitbringen oder über Ihre eigenen Cloud-Konten routen können, einschließlich AWS Bedrock, Google Vertex AI und Azure OpenAI.
Was passiert, wenn das Primärmodell ausfällt?
Edgee erkennt Fehler wie 429- und 5xx-Antworten oder einen Kontingentgrenzwert und leitet dieselbe Anfrage an das nächste verfügbare Modell in Ihrer Fallback-Kette weiter.
Ist Fallback-Routing in jedem Tarif enthalten?
Nein. Auf der Seite steht, dass automatisches Fallback und Umleitung Teil des Team-Tarifs sind.
Alternativen
- Manuelles Wechseln des Modells in Claude Code oder einem anderen Client: Das hält den Workflow einfach, erfordert aber, dass jemand Ausfälle bemerkt und die Modelle von Hand wechselt.
- Direkte Nutzung eines einzelnen KI-Anbieters: Das vermeidet eine zusätzliche Routing-Schicht, macht den Workflow aber von der Verfügbarkeit und den Kontingentregeln eines einzelnen Anbieters abhängig.
- Eigene Proxy- oder Gateway-Infrastruktur: Teams können ihre eigene Routing-Logik bauen, müssen dann aber meist Infrastruktur, Health Checks und anbieterspezifische Failover-Regeln selbst betreiben.
- Cloud-native KI-Endpunkte ohne einheitliche Fallback-Schicht: AWS Bedrock, Google Vertex AI oder Azure OpenAI können Modelle hosten, werden hier aber nicht als vollständiges Claude Code-Failover-System für sich allein dargestellt.
Alternativen
AakarDev AI
AakarDev AI ist eine leistungsstarke Plattform, die die Entwicklung von KI-Anwendungen mit nahtloser Integration von Vektordatenbanken vereinfacht und eine schnelle Bereitstellung und Skalierbarkeit ermöglicht.
Devin
Devin ist ein AI-Coding-Agent für Softwareteams: unterstützt Parallelisierung von Migrations- und Refactoring-Subtasks, während Engineers steuern und Änderungen freigeben.
imgcook
imgcook ist ein intelligentes Tool, das Design-Mockups mit einem Klick in hochwertigen, produktionsbereiten Code umwandelt.
Ably Chat
Ably Chat ist eine Chat-API und SDKs für maßgeschneiderte Realtime-Chat-Apps: Reactions, Presence sowie Nachrichten editieren/löschen.
BookAI.chat
BookAI ermöglicht es Ihnen, mit Ihren Büchern zu chatten, indem Sie einfach den Titel und den Autor angeben.
DeepMotion
DeepMotion ist eine AI-Motion-Capture- und Body-Tracking-Plattform für 3D-Animationen aus Video (und Text) im Browser – per Animate 3D API integrierbar.