複数の無料プロバイダーをまとめて利用
Google、Groq、Cerebras、NVIDIA、Mistral、OpenRouter、GitHub Models、Cohere、Cloudflare、HuggingFace、Z.ai、Ollama、Kilo、Pollinations、LLM7、OVH AI Endpoints、OpenCode Zen などの無料枠を、1 つの OpenAI 互換サーフェスの背後で集約します。
FreeLLMAPI は、複数の LLM プロバイダーの無料枠を 1 つの /v1 エンドポイントに集約する OpenAI 互換プロキシです。個人利用の実験向けに、自動フェイルオーバー、暗号化キー保管、管理ダッシュボードを備えています。
FreeLLMAPI は、単一の /v1 エンドポイントの背後で複数の LLM プロバイダーの無料枠にまたがってリクエストをルーティングする OpenAI 互換プロキシです。このプロジェクトは、個々の無料プランを 1 つの共有推論面にまとめ、個人利用の実験に使うことを想定しています。
Google、Groq、Cerebras、NVIDIA、Mistral、OpenRouter、GitHub Models、Cohere、Cloudflare、HuggingFace、Z.ai、Ollama、Kilo、Pollinations、LLM7、OVH AI Endpoints、OpenCode Zen などの多数のプロバイダー連携に加え、llama.cpp、LM Studio、vLLM、ローカルの Ollama インスタンスのような任意の OpenAI 互換エンドポイントにも対応します。プロキシはモデルルーティング、自動フェイルオーバー、上流キーの暗号化保存、キー管理と使用状況確認のためのダッシュボードを処理します。
Google、Groq、Cerebras、NVIDIA、Mistral、OpenRouter、GitHub Models、Cohere、Cloudflare、HuggingFace、Z.ai、Ollama、Kilo、Pollinations、LLM7、OVH AI Endpoints、OpenCode Zen などの無料枠を、1 つの OpenAI 互換サーフェスの背後で集約します。
各リクエストに対してモデルを選ぶルーターを使用し、あるプロバイダーがレート制限に達したり、429/5xx を返したり、タイムアウトした場合は次のプロバイダーにフォールバックし、失敗したキーには短いクールダウンを適用します。
プロバイダー、モデル、キーごとに RPM、RPD、TPM、TPD を追跡し、マルチターン会話中は約 30 分間、同じモデルにスティッキーセッションを維持します。
プロバイダーの API キーを SQLite 内で AES-256-GCM により暗号化して保存し、クライアントは単一の統一された bearer token でプロキシに認証します。
/v1/chat/completions、/v1/models、/v1/responses、/v1/embeddings、ストリーミング、非ストリーミング、OpenAI 形式のツール呼び出しを互換クライアント向けに公開します。
キー管理、フォールバックチェーンの並び替え、分析の閲覧、プレイグラウンドでのプロンプト実行ができる React + Vite の管理ダッシュボードを含みます。
OpenAI SDK、LangChain、LlamaIndex、Continue などのクライアントの接続先をこのプロキシにし、上流のパスを /v1 に切り替えながら同じアプリケーションコードを維持します。
複数の無料枠サービスのプロバイダーキーを追加し、ルーターに利用可能なモデルを選ばせて、あるプロバイダーが制限されたり利用不可になったりしたときは自動でフェイルオーバーします。
Docker Compose のセットアップをローカルまたは小規模サーバーで実行し、API、ダッシュボード、SQLite データを 1 つのセルフホスト環境にまとめます。
管理ダッシュボードを使ってフォールバックチェーンを並べ替え、レイテンシとトークン使用量を確認し、クライアントをプロキシに接続する前にプロンプトをテストします。
LM Studio、llama.cpp、vLLM、ローカル Ollama などの OpenAI 互換バックエンドを、同じ統一ルーター経由で接続します。
FreeLLMAPI は OpenAI 互換クライアント向けに設計されています。README では、ベース URL を変更することで、OpenAI SDK や LangChain、LlamaIndex、Continue、Hermes などの互換クライアントをこのプロキシに向けられると説明しています。
Docker ガイドによると、個人利用では Docker Compose で実行する方法が推奨されています。API とダッシュボードは 1 つのプロセスでポート 3001 から提供され、SQLite は名前付きボリュームに永続化されます。
README では、このプロキシが /v1/chat/completions、/v1/models、/v1/responses、/v1/embeddings、ストリーミングおよび非ストリーミング応答、そして OpenAI 形式のツール呼び出しを実装していると説明しています。画像生成、音声、旧形式の completions、moderation、1 リクエストあたり複数 completions、またはユーザーごとの課金は実装されていません。
このプロジェクトは単一ユーザー構成を前提にしています。README では、ユーザーごとの課金やマルチテナント認証はまだサポートされていないと明記されています。
AakarDev AI helps teams manage AI provider access, project-level setups, logs, and analytics from one dashboard. It supports BYOK workflows and lists providers including OpenAI, Google Gemini, Anthropic, Groq, Mistral AI, and Perplexity AI.
BookAIは、書名と著者を提供するだけで、AIを使って本とチャットできるサービスです。
Skills Janitor is a GitHub-hosted set of slash commands for auditing, tracking, and managing Claude Code and OpenAI Codex skills. It helps users find duplicates, broken links, and unused skills, then clean them up with self-contained commands.
FeelFish is a PC client for AI-assisted novel writing, designed to help fiction writers plan characters and settings, draft and revise long-form content, and manage story context. It includes a free tier and paid plans, with support for multiple large-model providers.
Benchspan is an AI agent security platform that discovers agents, blocks prompt injection and data exfiltration in real time, and supports pre-launch red teaming. It is aimed at teams running agents in production and includes Python and TypeScript SDKs.
ChatBA is a generative AI product for creating slide decks from prompts. The public site emphasizes instant presentation generation and includes help content for templates, sharing, and data sources.