UStackUStack
Edgee icon

Edgee

Edgee Fallback Models — слой маршрутизации для Claude Code, который автоматически переключает на другие модели при сбое Anthropic или лимите использования без смены кода.

Edgee

Что такое Edgee Fallback Models?

Edgee Fallback Models — это слой маршрутизации для сессий Claude Code, который продолжает обработку запросов, когда основной модельный сервис дает сбой, достигает квоты или становится недоступен. Он находится между Claude Code и провайдерами моделей, поэтому запрос можно повторить через настроенную резервную модель без изменения рабочего процесса разработчика или кода.

Продукт предназначен для пользователей, которые используют Claude Code для постоянной работы и хотят автоматическое переключение на другие модели, такие как модели, размещенные в Edgee, провайдеры BYOK или облачные AI-эндпойнты. Он также поддерживает перенаправление запросов на конкретную модель для стандартизации или контроля затрат.

Основные возможности

  • Автоматический fallback при ответах 429 и 5xx: если основная модель ограничена по скорости или возвращает ошибку, Edgee повторяет тот же запрос через следующую модель в настроенной цепочке.
  • Определение rate-limit и квоты: Edgee может переключать модели, когда достигается недельный лимит тарифа или другой порог использования, уменьшая прерывания во время долгих сессий кодинга.
  • Цепочки моделей с приоритетным порядком: пользователи настраивают предпочтительную последовательность моделей в панели управления, а Edgee направляет запросы в соответствии с этим порядком.
  • Поддержка нескольких клиентских инструментов: на странице указано, что сервис работает с Claude Code, Codex и OpenCode, что делает подход к маршрутизации применимым более чем к одному coding-клиенту.
  • Резервные модели, размещенные в Edgee: сервис включает шесть готовых к использованию hosted-моделей без отдельных API-ключей, включая варианты Gemma, GLM, Qwen, Kimi и MiniMax.
  • Опции Bring Your Own Key и Bring Your Own Cloud: пользователи могут направлять резервный трафик к таким провайдерам, как OpenAI, Anthropic, Mistral, DeepSeek, xAI, AWS Bedrock, Google Vertex AI и Azure OpenAI, используя свои учетные данные.
  • Настройка через панель управления: рабочий процесс настраивается в панели Edgee и через CLI, без прокси и изменений кода.
  • Прозрачное перенаправление: запросы продолжают идти по пути fallback с тем же контекстом сессии, поэтому разработчику не нужно вручную перезапускать рабочий процесс.

Как использовать Edgee Fallback Models

Сначала установите Edgee CLI и подключите Claude Code через Edgee вместо прямой отправки запросов в Anthropic. Затем настройте в панели управления цепочку fallback с приоритетным порядком, выбрав hosted-модели, провайдеров BYOK или облачные эндпойнты по необходимости. После этого Edgee отслеживает запросы и автоматически перенаправляет их, когда основная модель дает сбой или достигает лимита.

Сценарии использования

  • Обработка сбоя провайдера во время активной работы над кодом: если Claude Opus или другая основная модель становится недоступной, Edgee может перевести запрос на следующую модель, чтобы сессия продолжалась.
  • Восстановление после лимитов тарифа или использования: когда достигается недельный лимит, команды могут продолжать использовать Claude Code, не дожидаясь окна сброса.
  • Стандартизация выбора модели внутри команды: группа может направлять запросы к одной одобренной резервной модели вместо того, чтобы каждый клиент выбирал ее самостоятельно.
  • Использование облачных аккаунтов организации: команды, которые хотят, чтобы резервный трафик оставался в их среде AWS, Google Cloud или Azure, могут настроить Bedrock, Vertex AI или Azure OpenAI.
  • Добавление плана B на случай изменений в политике или биллинге: организации, которые зависят от Claude Code, могут заранее подготовиться к изменениям квот или биллинга, настроив альтернативные модели.

FAQ

Нужно ли вносить изменения в промпты или исходный код Claude Code?
Нет. На странице указано, что настройка выполняется через Edgee CLI и панель управления, без изменений кода.

С какими продуктами это работает?
На странице прямо упомянуты Claude Code, Codex и OpenCode.

Могу ли я использовать своих провайдеров моделей вместо моделей Edgee-hosted?
Да. На странице сказано, что можно использовать собственный ключ или направлять трафик через свои облачные аккаунты, включая AWS Bedrock, Google Vertex AI и Azure OpenAI.

Что происходит, когда основная модель дает сбой?
Edgee обнаруживает ошибки, такие как ответы 429 и 5xx, или достижение порога квоты и направляет тот же запрос к следующей доступной модели в вашей цепочке fallback.

Включена ли маршрутизация fallback в каждый тариф?
Нет. На странице сказано, что автоматический fallback и перенаправление входят в Team plan.

Альтернативы

  • Ручное переключение моделей в Claude Code или другом клиенте: это сохраняет простой рабочий процесс, но требует, чтобы человек заметил сбой и сменил модель вручную.
  • Прямое использование одного AI-провайдера: это позволяет избежать дополнительного слоя маршрутизации, но делает рабочий процесс зависимым от доступности и квот одного вендора.
  • Собственная proxy- или gateway-инфраструктура: команды могут построить свою логику маршрутизации, но обычно это означает, что им самим нужно поддерживать инфраструктуру, health checks и правила failover для конкретных провайдеров.
  • Облачные AI-endpoint’ы без единого fallback-слоя: AWS Bedrock, Google Vertex AI или Azure OpenAI могут размещать модели, но здесь они не представлены как полноценная система failover для Claude Code сами по себе.
Edgee | UStack