UStackUStack
Edgee icon

Edgee

Edgee Fallback Models는 Anthropic 장애나 사용 한도 도달 시 다른 모델로 자동 전환해 Claude Code 세션을 유지하는 라우팅 레이어입니다. 코드 변경 없이 연속 작업을 돕습니다.

Edgee

Edgee Fallback Models란?

Edgee Fallback Models는 Claude Code 세션용 라우팅 레이어로, 기본 모델이 실패하거나 할당량에 도달하거나 사용할 수 없게 되면 요청이 계속 진행되도록 합니다. Claude Code와 모델 제공자 사이에 위치해 있어, 개발자의 워크플로우나 코드를 바꾸지 않고도 구성된 대체 모델로 요청을 재시도할 수 있습니다.

이 제품은 지속적인 작업에 Claude Code를 사용하는 사용자와 Edgee 호스팅 모델, BYOK 제공자, 클라우드 호스팅 AI 엔드포인트 같은 다른 모델로의 자동 장애 조치를 원하는 팀을 위해 설계되었습니다. 또한 표준화나 비용 관리를 위해 요청을 특정 모델로 재라우팅하는 것도 지원합니다.

주요 기능

  • 429 및 5xx 응답 시 자동 대체: 기본 모델이 속도 제한에 걸리거나 오류가 발생하면 Edgee가 구성된 체인의 다음 모델을 통해 같은 요청을 재시도합니다.
  • 속도 제한 및 할당량 감지: Edgee는 주간 플랜 한도나 기타 사용 임계값에 도달하면 모델을 전환해 긴 코딩 세션 중 중단을 줄여줍니다.
  • 우선순위 기반 모델 체인: 사용자는 대시보드에서 선호 순서대로 모델을 구성하고, Edgee는 그 순서에 따라 요청을 라우팅합니다.
  • 여러 클라이언트 도구 지원: 이 페이지는 Claude Code, Codex, OpenCode와의 호환을 언급하며, 하나 이상의 코딩 클라이언트에서 이 라우팅 방식을 사용할 수 있게 합니다.
  • Edgee 호스팅 대체 모델: 이 서비스에는 별도 API 키 없이 바로 사용할 수 있는 6개의 호스팅 모델이 포함되며, Gemma, GLM, Qwen, Kimi, MiniMax 옵션이 있습니다.
  • Bring Your Own Key 및 Bring Your Own Cloud 옵션: 사용자는 자체 자격 증명으로 OpenAI, Anthropic, Mistral, DeepSeek, xAI, AWS Bedrock, Google Vertex AI, Azure OpenAI 같은 제공자로 대체 트래픽을 라우팅할 수 있습니다.
  • 대시보드 기반 설정: 워크플로우는 Edgee 대시보드와 CLI에서 구성되며, 프록시 설정이나 코드 변경이 필요 없습니다.
  • 투명한 재라우팅: 요청은 동일한 세션 컨텍스트를 유지한 채 대체 경로로 계속 진행되므로, 개발자가 수동으로 워크플로우를 재시작할 필요가 없습니다.

Edgee Fallback Models 사용 방법

먼저 Edgee CLI를 설치하고 Claude Code가 Anthropic에 직접 요청을 보내는 대신 Edgee를 통해 연결되도록 합니다. 그런 다음 대시보드에서 우선순위 기반 대체 체인을 구성하고, 필요에 따라 호스팅 모델, BYOK 제공자 또는 클라우드 엔드포인트를 선택합니다. 이후 Edgee가 요청을 모니터링하다가 기본 모델이 실패하거나 제한에 도달하면 자동으로 재라우팅합니다.

사용 사례

  • 활발한 코딩 작업 중 제공자 장애 대응: Claude Opus 또는 다른 기본 모델을 사용할 수 없게 되면 Edgee가 요청을 다음 모델로 이동시켜 세션이 계속 진행되게 합니다.
  • 플랜 또는 사용 한도 복구: 주간 한도에 도달해도 팀은 재설정 창을 기다리지 않고 Claude Code를 계속 사용할 수 있습니다.
  • 팀 전체의 모델 선택 표준화: 한 그룹은 각 클라이언트가 개별적으로 선택하도록 두는 대신, 승인된 단일 대체 모델로 요청을 라우팅할 수 있습니다.
  • 조직의 자체 클라우드 계정 사용: 대체 트래픽을 AWS, Google Cloud, Azure 환경 안에 유지하고 싶은 팀은 Bedrock, Vertex AI, Azure OpenAI를 구성할 수 있습니다.
  • 정책 또는 청구 변경에 대비한 Plan B 추가: Claude Code에 의존하는 조직은 미리 대체 모델을 설정해 할당량이나 청구 변경에 대비할 수 있습니다.

FAQ

Edgee를 사용하려면 Claude Code 프롬프트나 소스 코드를 변경해야 하나요? 아니요. 이 페이지에 따르면 설정은 Edgee CLI와 대시보드를 사용하며, 코드 변경은 필요하지 않습니다.

어떤 제품과 연동되나요? 이 페이지는 Claude Code, Codex, OpenCode를 명시적으로 언급합니다.

Edgee 호스팅 모델 대신 자체 모델 제공자를 사용할 수 있나요? 네. 페이지에 따르면 자체 키를 사용하거나 AWS Bedrock, Google Vertex AI, Azure OpenAI를 포함한 자체 클라우드 계정을 통해 라우팅할 수 있습니다.

기본 모델이 실패하면 어떻게 되나요? Edgee는 429 및 5xx 응답 같은 오류나 할당량 임계값을 감지하고, 동일한 요청을 대체 체인의 다음 사용 가능한 모델로 라우팅합니다.

모든 플랜에 대체 라우팅이 포함되나요? 아니요. 페이지에 따르면 자동 대체 및 재라우팅은 Team 플랜에 포함됩니다.

대안

  • Claude Code 또는 다른 클라이언트에서 수동으로 모델 전환: 워크플로는 단순하지만, 장애를 사람이 직접 알아차리고 모델을 수동으로 바꿔야 합니다.
  • 단일 AI 제공업체 직접 사용: 추가 라우팅 레이어는 없지만, 워크플로가 한 벤더의 가동 시간과 할당량 정책에 의존하게 됩니다.
  • 자체 프록시 또는 게이트웨이 인프라: 팀이 직접 라우팅 로직을 구축할 수 있지만, 보통 인프라, 상태 확인, 제공업체별 장애 조치 규칙을 직접 유지해야 합니다.
  • 통합된 fallback 레이어가 없는 클라우드 네이티브 AI 엔드포인트: AWS Bedrock, Google Vertex AI, Azure OpenAI에서 모델을 호스팅할 수 있지만, 이들만으로는 완전한 Claude Code 장애 조치 시스템으로 보기는 어렵습니다.