FreeLLMAPI é um proxy compatível com OpenAI para rotear solicitações pelos planos gratuitos de vários provedores LLM atrás de um único endpoint /v1. O projeto se posiciona como uma forma de combinar planos gratuitos individuais em uma superfície de inferência compartilhada para experimentação pessoal.
Ele oferece suporte a uma longa lista de integrações de provedores, além de qualquer endpoint personalizado compatível com OpenAI, como llama.cpp, LM Studio, vLLM ou uma instância local do Ollama. O proxy lida com roteamento de modelos, failover automático, armazenamento criptografado de chaves upstream e um dashboard para gerenciar chaves e revisar o uso.