FreeLLMAPI icon

FreeLLMAPI

FreeLLMAPI é um proxy compatível com OpenAI que distribui pedidos pelos planos gratuitos de vários provedores LLM num único endpoint /v1, com failover automático e dashboard.

FreeLLMAPI

Visão geral

FreeLLMAPI é um proxy compatível com OpenAI para rotear solicitações pelos planos gratuitos de vários provedores LLM atrás de um único endpoint /v1. O projeto se posiciona como uma forma de combinar planos gratuitos individuais em uma superfície de inferência compartilhada para experimentação pessoal.

Ele oferece suporte a uma longa lista de integrações de provedores, além de qualquer endpoint personalizado compatível com OpenAI, como llama.cpp, LM Studio, vLLM ou uma instância local do Ollama. O proxy lida com roteamento de modelos, failover automático, armazenamento criptografado de chaves upstream e um dashboard para gerenciar chaves e revisar o uso.

Recursos

Agrupa vários provedores gratuitos

Agrega os planos gratuitos de provedores como Google, Groq, Cerebras, NVIDIA, Mistral, OpenRouter, GitHub Models, Cohere, Cloudflare, HuggingFace, Z.ai, Ollama, Kilo, Pollinations, LLM7, OVH AI Endpoints e OpenCode Zen em uma única superfície compatível com OpenAI.

Roteamento automático e failover

Usa um roteador que escolhe um modelo para cada solicitação, faz fallback para o próximo provedor quando um fica limitado por taxa, retorna 429/5xx ou expira, e mantém curtos períodos de espera para chaves com falha.

Acompanhamento de uso por chave

Rastreia RPM, RPD, TPM e TPD por provedor, modelo e chave, e mantém sessões persistentes no mesmo modelo por cerca de 30 minutos durante conversas com várias interações.

Chaves criptografadas e acesso unificado ao app

Armazena chaves de API dos provedores criptografadas com AES-256-GCM no SQLite, enquanto os clientes se autenticam no proxy com um único token bearer unificado.

Superfície de API compatível com OpenAI

Expõe /v1/chat/completions, /v1/models, /v1/responses, /v1/embeddings, streaming, não streaming e chamada de ferramentas no estilo da OpenAI para clientes compatíveis.

Dashboard e análises integrados

Inclui um dashboard administrativo em React + Vite para gerenciar chaves, ordenar cadeias de fallback, visualizar análises e executar prompts em um playground.

Casos de uso

  • Use um único endpoint de API para apps LLM

    Aponte um SDK da OpenAI, LangChain, LlamaIndex, Continue ou cliente semelhante para o proxy e mantenha o mesmo código da aplicação enquanto troca o caminho upstream para /v1.

  • Distribua solicitações entre planos gratuitos

    Adicione chaves de provedores para vários serviços de plano gratuito e deixe o roteador escolher um modelo disponível, fazendo failover automaticamente quando um provedor for limitado ou indisponível.

  • Auto-hospede uma stack de proxy pessoal

    Execute a configuração com Docker Compose localmente ou em um servidor pequeno para manter a API, o dashboard e os dados do SQLite em um único ambiente auto-hospedado.

  • Gerencie chaves e monitore o uso

    Use o dashboard administrativo para reordenar cadeias de fallback, inspecionar latência e uso de tokens e testar prompts antes de conectar um cliente ao proxy.

  • Redirecione para endpoints locais ou remotos personalizados

    Conecte um backend personalizado compatível com OpenAI, como LM Studio, llama.cpp, vLLM ou Ollama local, por meio do mesmo roteador unificado.

Pros and Cons

Pros

  • Combina muitos provedores gratuitos atrás de um único endpoint compatível com OpenAI.
  • Oferece fallback automático quando um provedor fica limitado por taxa, apresenta erro ou expira.
  • Armazena chaves upstream criptografadas em repouso com AES-256-GCM.
  • Funciona com um amplo conjunto de clientes e SDKs compatíveis com OpenAI alterando a URL base.
  • Inclui um dashboard auto-hospedado para gerenciamento de chaves e análises.

Cons

  • Ele é explicitamente voltado para experimentação pessoal e uma configuração de usuário único, não para cobrança de equipe com múltiplos locatários.
  • Várias áreas da API da OpenAI não estão implementadas, incluindo geração de imagens, áudio, completions legados, moderação e completions com n > 1.

FAQ

Quais clientes podem usar o FreeLLMAPI?

FreeLLMAPI foi projetado para funcionar com clientes compatíveis com OpenAI. O README diz que você pode apontar qualquer SDK da OpenAI ou cliente compatível, como LangChain, LlamaIndex, Continue ou Hermes, para o proxy alterando a URL base.

Como o FreeLLMAPI é normalmente implantado?

O guia do Docker diz que o Docker Compose é a forma recomendada de executá-lo para uso pessoal. Ele serve a API e o dashboard em um único processo na porta 3001, com o SQLite persistido em um volume nomeado.

Quais endpoints e fluxos no estilo da OpenAI são suportados?

O README diz que o proxy implementa /v1/chat/completions, /v1/models, /v1/responses, /v1/embeddings, respostas com e sem streaming e chamada de ferramentas no estilo da OpenAI. Ele não implementa geração de imagens, áudio, completions legados, moderação, múltiplas completions por solicitação ou cobrança por usuário.

Equipes podem usá-lo com autenticação multi-tenant?

O projeto foi construído em torno de uma configuração de usuário único. O README diz explicitamente que cobrança por usuário e autenticação multi-tenant ainda não são suportadas.

Quick Facts

Categoria
Ferramenta para desenvolvedores
Uso principal
Proxy de LLM compatível com OpenAI
Implantação
Docker Compose ou auto-hospedagem com Node 20+
Modelo de autenticação
Token bearer unificado para apps; login admin com e-mail/senha
Domínio de origem
github.com
Preço
Projeto de código aberto; a página de preços do GitHub foi analisada para contexto de hospedagem, mas o produto em si não apresenta um plano pago
FreeLLMAPI - AI Tool, Features, Use Cases & Alternatives | UStack