Claude Mythos 5 ist das Modell von Anthropic für Cybersecurity- und Biologie-Forschung, nur für geprüfte Partner mit hohen Sicherheitsanforderungen verfügbar.
NVIDIA Nemotron 3 Ultra ist ein offenes 550B-Parameter-Mixture-of-Experts-Modell für lang laufende Agenten-Workflows mit Reasoning, Kontextspeicher und Tool-Nutzung.
Gemma 4 12B ist ein multimodales KI-Modell von Google DeepMind für lokale Inferenz auf Laptops mit Vision, Audio und Text in einer Architektur.
EchoFlow ist eine Android-Chat-App für OpenRouter mit eigenem API-Key, Modellwechsel und lokal gespeicherten Chats für privaten Offline-Zugriff.
Tokenwise ist eine LLM-Observability- und Kostenoptimierungsplattform, die jede API-Anfrage überwacht, Verschwendung erkennt und Optimierungen wie Modellwechsel, Caching und Prompt-Kürzungen empfiehlt.
MiniCPM5-1B ist ein Open-Source-Sprachmodell mit 1 Milliarde Parametern für lokale Assistenten, Coding Agents, Tool-Use und Reasoning. Mit Langkontext und mehreren Formaten.
Command A+ ist Cohere’s Open-Source-Enterprise-Sprachmodell für komplexes Reasoning, multimodale und mehrsprachige Agenten-Workflows sowie Tool-Use. Für private Bereitstellung.
MashuPack ist ein browserbasiertes Tool, um Teile eines lokalen Code-Repository auszuwählen und als saubere Textdatei für ChatGPT, Claude und ähnliche KI-Chats zu exportieren.
Krater ist ein KI-Workspace mit Zugriff auf ChatGPT, Claude, Gemini und 350+ KI-Modelle im Abo – für Text, Bilder, Video, Audio, Musik und Code ohne API-Keys.
Harbor: CLI und Companion-App für lokale LLM-Stacks mit Modellen, Chat-Oberflächen und Diensten. Für KI-Workflows, Websuche, Sprache, Bilder und Coding.
Perceptron Mk1 ist ein geschlossenes multimodales Modell für Videoverständnis, Bildanalyse und verkörpertes Reasoning für Robotik und physische Workflows.
MiniMax M3 ist ein Open-Weight-KI-Modell für Coding und agentische Workflows mit nativem multimodalem Verständnis und 1M-Token-Kontextfenster.
Edgee Fallback Models hält Claude Code-Sessions am Laufen, indem es bei Ausfällen oder Limits automatisch auf andere Modelle umschaltet – ohne Codeänderung.
SemanticGuard ist ein AI-Gateway mit selbstvalidierendem Cache für LLM-APIs von OpenAI, Anthropic und Google. Für Entwickler zur Messung von Einsparungen und nahtlosem Request-Flow.
Gello ist eine Android-App, die ein Hugging-Face-Sprachmodell lokal ausführt und als Discord-Bot bereitstellt. Für den dauerhaften Einsatz im Channel auf dem Handy.
TrackNotch ist eine native macOS-App für die Echtzeit-Überwachung von LLM-Nutzung in Notch oder Menüleiste – mit lokal gespeicherten Daten für Claude, OpenAI, Cursor und Codex.
Token Monitor — AI Context Tracker für Chrome zeigt in Echtzeit Kontextfortschritt und Quotenmonitoring für Claude.ai: Truncation-Warnungen & Token-Kosten pro Turn.
PromptQuorum sendet einen Prompt an 25+ KI-Modelle gleichzeitig, bewertet Konsens und Halluzinationsrisiko und hilft, konsistentere Antworten zu vergleichen.
Franz ist eine funktionale, prototyporientierte Programmiersprache mit knapper Syntax und Unterstützung für native Kompilierung via LLVM IR.
Gemini 3.1 Flash-Lite ist ein Gemini-3-KI-Modell für ultra-niedrige Latenz, hohe Volumen und kosteneffiziente Produktion auf der Gemini Enterprise Agent Platform.