Agentset
Agentset ist eine Open-Source-Plattform zum Aufbau produktionsreifer KI-Chat- und Suchanwendungen, mit zuverlässigem RAG, Multimodal-Unterstützung und einem entwicklerfreundlichen SDK.
Was ist Agentset?
Was ist Agentset?
Agentset ist eine Open-Source-Infrastrukturplattform für Entwickler, die produktionsreife Retrieval-Augmented-Generation(RAG)-Anwendungen bauen. Sie ermöglicht KI-Chat- und Sucherlebnisse, die auf deinen eigenen Dokumenten und Daten basierende, zuverlässige und zitierte Antworten liefern – ohne dass du von Grund auf eine komplexe RAG-Pipeline entwerfen, feinabstimmen und betreiben musst.
Die meisten RAG-Demos wirken in kontrollierten Umgebungen beeindruckend, brechen jedoch zusammen, sobald sie mit echten Nutzern, großen Dokumentmengen und unstrukturierten, multimodalen Daten konfrontiert werden. Agentset wurde speziell für diese realen Produktionsbedingungen entwickelt. Es kombiniert robuste Ingestion, hybride Suche, agentisches Reasoning und automatische Zitierungen in einem einzigen System, das sofort einsatzbereit ist, sodass Teams präzise KI-Suche und Q&A-Funktionen in Minuten statt in Monaten in ihre Produkte integrieren können.
Zentrale Funktionen
-
Produktionsreifes RAG out of the box
Agentset stellt einen vollständigen RAG-Stack bereit—Ingestion, Indexierung, Retrieval, Reasoning und Antwortgenerierung—der für Produktions-Workloads ausgelegt ist. Die Plattform ist auf Zuverlässigkeit und Konsistenz optimiert, selbst wenn Datenvolumen, Nutzung und Komplexität wachsen. -
Genaue Antworten mit Benchmark-Leistung
Die Plattform ist darauf ausgelegt, schon vor jeglicher Feintuning-Anpassung hochpräzise Antworten auf deinen eigenen Daten zu liefern. Agentset orientiert sich an branchenführenden Benchmarks wie MultiHopQA und FinanceBench und eignet sich daher besonders gut für komplexe, mehrstufige und domänenspezifische Fragestellungen. -
Multimodale Unterstützung (Text, Bilder, Tabellen, Graphen und mehr)
Agentset unterstützt nativ Bilder, Tabellen und Graphen neben klassischem Text. So kannst du Fragen über das gesamte Spektrum deiner Wissensbasis hinweg beantworten—PDFs, Präsentationen, Tabellenkalkulationen, bildlastige Dokumente und strukturierte Artefakte—anstatt auf reinen Text beschränkt zu sein. -
Automatische Zitierungen für vertrauenswürdige Antworten
Jede von Agentset generierte Antwort enthält Quellenangaben zu den zugrunde liegenden Dokumenten. Nutzer können genau sehen, welche Dokumente und Passagen verwendet wurden – das erhöht Vertrauen, Debuggability und Compliance, insbesondere in sensiblen Bereichen wie Gesundheitswesen und Finanzbranche. -
Metadaten-Filter und fein granulierte Retrieval-Kontrolle
Agentset unterstützt Metadaten-basiertes Filtern, sodass du Antworten auf die richtige Teilmenge von Dokumenten einschränken kannst (z. B. nach Kunde, Projekt, Region, Datum, Berechtigungsstufe usw.). Das ist essenziell für Multi-Tenant-Produkte und Szenarien mit rollenbasierter Zugriffskontrolle (RBAC). -
Hybride Suche mit Reranking
Die Retrieval-Schicht kombiniert Vektorsuche mit traditionellen Keyword- und Metadaten-Ansätzen und nutzt zusätzlich Reranking, um die Präzision zu maximieren. Dadurch verbessern sich Recall und Relevanz, während Halluzinationen und verpasste Treffer reduziert werden. -
Integriertes agentisches Reasoning
Agentset bringt agentische Reasoning-Fähigkeiten direkt in den Stack und ermöglicht mehrschrittige Analysen, Synthese über mehrere Dokumente sowie komplexe Q&A, ohne dass du eigene Orchestrierungslogik implementieren musst. -
Umfangreiche Unterstützung von Dateitypen
Mit Unterstützung für über 22 Dateiformate kann Agentset Dokumente in Formaten wie
.PDF, .DOCX, .PPT, .PPTX, .XLSX, .ODT, .TXT, .MD, .CSV, .TSV, .HTML, .XML, .EML, .MSG, .JPEG, .PNG, .BMP, .HEIC u. v. m. ingestieren. Diese breite Unterstützung erleichtert es, bestehende Wissens-Repositories in einen einzigen, durchsuchbaren und KI-fähigen Index zu überführen. -
Developer-first SDKs (JavaScript & Python)
Agentset bietet SDKs für JavaScript und Python, mit denen sich Daten ingestieren, Namespaces konfigurieren und Anfragen an deine KI-Agents einfach umsetzen lassen. Ein typischer Workflow besteht aus wenigen Codezeilen, um einen Namespace anzulegen, Dokumente (per Datei oder URL) hochzuladen und sofort mit der Beantwortung von Fragen zu beginnen. -
Modellagnostisch und infrastrukturflexibel
Du bist nicht an ein einzelnes Modell oder einen Anbieter gebunden. Mit Agentset kannst du frei wählen:- Vektordatenbank (z. B. Pinecone, Qdrant)
- Embedding-Modell
- LLM (z. B. OpenAI, Anthropic Claude, Google AI, xAI Grok, Mistral, Qwen, DeepSeek u. a.) Diese Flexibilität ermöglicht es dir, Kosten, Latenz, Datenresidenz und Compliance optimal auszubalancieren.
-
MCP-Server-Integration
Über den Model Context Protocol (MCP) Server kann Agentset deine Wissensbasis in externe Anwendungen bringen, die MCP unterstützen. So können KI-Agents in anderen Umgebungen deine Dokumente sicher und effizient abfragen. -
Integration mit AI SDK
Agentset integriert sich in das AI-SDK-Ökosystem und macht es einfach, RAG-gestützte Chat- und Such-Widgets in deine eigenen Anwendungen, Dashboards oder kundenseitigen Produkte einzubetten. -
Externe Preview-Links & Chat-Oberfläche
Sammle schnell Feedback von Stakeholdern und Nutzern mit anpassbaren Chat-Oberflächen und Preview-Links. So kannst du Prompts, Retrieval-Konfigurationen und Antwortformatierung schnell iterieren, bevor du vollständig live gehst. -
Bewährt bei realen Teams
Agentset wird von Teams in hochkritischen Domänen wie Gesundheitswesen, öffentlichem Sektor und Fintech eingesetzt. Erfahrungsberichte heben gesteigerte Zuverlässigkeit, Unterstützung für komplexe Bildsuche und die Fähigkeit hervor, Legacy-Suchlösungen (wie Algolia) mit besseren Ergebnissen in weniger als einer Stunde Arbeit zu ersetzen.
Wie verwendet man Agentset?
Die Nutzung von Agentset folgt in der Regel einem klaren Entwickler-Workflow – von der Einrichtung bis zum Produktivbetrieb:
-
Projekt einrichten und API-Schlüssel erhalten
- Registriere dich bei Agentset und generiere einen API-Schlüssel.
- Installiere das SDK in deiner Anwendung:
- JavaScript/TypeScript:
npm install agentset - Python: installiere das entsprechende Python-Paket (z. B. via
pip).
- JavaScript/TypeScript:
-
Einen Namespace für deine Daten erstellen
Namespaces trennen Dokumentensammlungen, Mandanten oder Umgebungen (z. B.production,stagingoder pro Kunde) logisch voneinander.import { Agentset } from "agentset"; const agentset = new Agentset({ apiKey: "agentset_xxx" }); const namespace = agentset.namespace("ns_1234"); -
Dokumente ingestieren
Lade Dateien direkt oder per URL hoch – optional mit Metadaten für späteres Filtern.const ingestJob = await namespace.ingestion.create({ payload: { type: "FILE", fileUrl: "https://example.com/document.pdf", fileName: "my-document.pdf" }, config: { metadata: { foo: "bar" } } });- Verwende unterstützte Formate wie PDFs, Office-Dokumente, E-Mails, Bilder, Markdown und mehr.
- Füge Metadaten hinzu (z. B. Kunden-ID, Abteilung, Zugriffsebene, Tags), um das Retrieval später zu steuern.
-
Retrieval und Modelle konfigurieren (optional)
- Wähle deine bevorzugte Vektordatenbank, dein Embedding-Modell und dein LLM.
- Aktiviere bei Bedarf hybride Suche und Reranking.
- Definiere Filter, um Tenant-Isolation und Zugriffskontrolle sicherzustellen.
-
Chat oder Suche in deine App einbetten
- Verwende das AI SDK, um Chat- oder Suchendpoints zu erstellen, die Agentset aufrufen.
- Baue UI-Komponenten (Chat-Widgets, Suchleisten, Seitenleisten), die Agentset abfragen und Antworten mit Zitaten darstellen.
- Nutze optional die MCP-Server-Integration, um deine Wissensbasis externen KI-Tools zugänglich zu machen.
-
Testen, vorab ansehen und iterieren
- Teile Preview-Links mit Stakeholdern, um die Antwortqualität zu validieren.
- Evaluiere die Performance auf deinen eigenen Testsets, insbesondere bei Multi-Hop- und domänenspezifischen Fragen.
- Passe Retrieval-Parameter, Filter und Prompts basierend auf Feedback an.
-
Im Produktivbetrieb überwachen und skalieren
- Wenn die Nutzung wächst, justiere Infrastrukturentscheidungen (Datenbanken, Modelle), um Kosten- und Latenzanforderungen zu erfüllen.
- Ingestiere kontinuierlich neue Dokumente, um deine Wissensbasis aktuell zu halten.
- Nutze Metadaten und Namespaces, um Multi-Tenant- oder Multi-Produkt-Deployments zu managen.
Anwendungsfälle
1. In-Product-KI-Suche und Chat für SaaS-Plattformen
SaaS-Produkte mit umfangreichen Help-Centern, technischer Dokumentation und kundenspezifischen Konfigurationen können Agentset-basierte Suche einbetten, um präzise, kontextbezogene Antworten zu liefern. Anstelle statischer FAQ-Seiten und anfälliger Keyword-Suche können Nutzer Fragen in natürlicher Sprache stellen und zitierte, vertrauenswürdige Antworten aus Release Notes, Konfigurationshandbüchern und Support-Tickets erhalten.
2. Wissensassistenten im Gesundheits- und Medizinbereich
Im medizinischen Umfeld sind Zuverlässigkeit und Nachvollziehbarkeit entscheidend. Agentset kann interne Tools unterstützen, mit denen Kliniker, Forschende oder Operations-Teams Leitlinien, Fachartikel und interne Protokolle abfragen. Automatische Zitierungen und quellengestützte Antworten reduzieren das Risiko von Halluzinationen und helfen Teams zu prüfen, ob Antworten evidenzbasiert sind – bei gleichzeitig effizienten Workflows.
3. Informationsportale für öffentlichen Sektor und Kommunen
Organisationen, die mit Kommunen oder Behörden arbeiten, verwalten oft Hunderte oder Tausende Seiten mit Verordnungen, Richtlinien und öffentlichen Dokumenten, von denen viele Bilder, Diagramme und Tabellen enthalten. Die multimodalen Fähigkeiten von Agentset unterstützen komplexe Bild- und Dokumentensuche und ermöglichen Mitarbeitenden oder Bürgern, schnell präzise Informationen in langen, heterogenen Dokumenten zu finden.
4. Tools für Finanzresearch, Compliance und Analyse
Finanzteams müssen komplexe, mehrstufige Fragen beantworten, die sich über Pflichtveröffentlichungen, interne Berichte und Marktdaten erstrecken. Die Fokussierung von Agentset auf Benchmark-Leistung bei Aufgaben wie FinanceBench macht es ideal für Research-Assistenten, Compliance-Prüftools und Analystenwerkzeuge, die präzise Antworten auf dichte, technische Dokumente verlangen.
5. Enterprise-Wissensbasen und interne Copilots
Große Unternehmen mit fragmentiertem Wissen (Wikis, PDFs, E-Mail-Archive, Intranets, Fileshares) können Agentset nutzen, um eine einheitliche Suche über Abteilungsgrenzen hinweg aufzubauen. Hybride Suche, Metadatenfilter und modellagnostische Infrastruktur geben IT-Teams Kontrolle darüber, wo Daten liegen, welche Modelle eingesetzt werden und wie Zugriffe geregelt sind, während Mitarbeitende einen einzigen, leistungsstarken KI-Assistenten für internes Wissen erhalten.
FAQ
Was ist Agentset?
Agentset ist eine Open-Source-Plattform und Infrastrukturschicht zum Aufbau produktionsreifer RAG-Anwendungen. Sie stellt Funktionen für Ingestion, Indexierung, Retrieval, Reasoning und Antwortgenerierung bereit, sodass Entwickler präzise KI-Chat- und Suchfunktionen in ihre Produkte integrieren können, ohne die gesamte RAG-Pipeline intern aufbauen zu müssen.
Für wen ist Agentset gedacht?
Agentset richtet sich an Entwickler und Produktteams, die zuverlässige KI-Funktionen—wie Chatbots, interne Copilots oder erweiterte Suche—auf ihren eigenen Daten ausliefern wollen. Die Plattform ist geeignet für Startups, mittelständische Unternehmen und Großunternehmen, die produktionsreife Performance, Multi-Tenant-Support und Flexibilität bei Modell- und Infrastrukturwahl benötigen.
Können Großunternehmen Agentset einsetzen?
Ja. Agentset ist darauf ausgelegt, reale, großskalige Dokumentensätze, komplexe Datentypen und hohe Nutzungslasten zu bewältigen. Die Unterstützung von Metadatenfiltern, Namespaces und modellagnostischer Infrastruktur macht die Plattform zu einer starken Option für Enterprise-Umgebungen, die strikte Datentrennung, Compliance und Integration in bestehende Stacks erfordern.
Ist Agentset ein Framework wie LangChain oder LlamaIndex?
Agentset ist nicht nur ein Orchestrierungs-Framework auf Client-Seite. Während Frameworks wie LangChain oder LlamaIndex helfen, RAG-Workflows im Code zusammenzustellen, bietet Agentset ein gemanagtes, produktionsreifes Backend für Ingestion, Retrieval und Reasoning. Du kannst Agentset bei Bedarf mit diesen Frameworks kombinieren, aber das Ziel von Agentset ist es, den Bedarf zu reduzieren, eigene Retrieval-Infrastruktur aufzubauen und zu betreiben.
Funktioniert Agentset mit meinem bestehenden Stack und meiner Infrastruktur?
Ja. Agentset ist modellagnostisch und unterstützt verbreitete Vektordatenbanken, LLM-Anbieter und Embeddings. Du kannst Komponenten wie Pinecone oder Qdrant für die Vektorspeicherung wählen und Modelle von Anbietern wie OpenAI, Anthropic, Google AI, xAI Grok, Mistral, Qwen, DeepSeek und anderen nutzen. Die Integration über JavaScript-, TypeScript- und Python-SDKs, MCP-Server und AI SDK macht es einfach, Agentset in bestehende Services und Frontends einzubetten.
Warum sollte ich Agentset nutzen, statt ein eigenes RAG-System zu bauen?
Der Aufbau eines robusten RAG-Systems von Grund auf erfordert die Gestaltung von Ingestion-Pipelines, das Handling vieler Dateitypen, das Tuning des Retrievals, die Implementierung hybrider Suche und von Reranking, das Management von Zitierungen und die Wartung der Infrastruktur bei sich ändernden Anforderungen. Das kann Monate an Entwicklungszeit sowie laufende Wartung bedeuten. Agentset stellt diese Fähigkeiten out of the box bereit, sodass sich dein Team auf Produktfunktionen und Nutzererlebnis konzentrieren kann, anstatt auf Low-Level-Retrieval-Infrastruktur.
Wie geht Agentset mit realen Dokumenten um?
Agentset ist für unstrukturierte Daten aus der realen Welt optimiert. Es unterstützt mehr als 22 Dateiformate—including PDFs, Office-Dokumente, E-Mails, Bilder und HTML—und übernimmt das Parsen, Chunking und Indexieren, das für effektives Retrieval erforderlich ist. Multimodal-Unterstützung stellt sicher, dass Bilder, Graphen und Tabellen bei Suche und Q&A nicht ignoriert, sondern angemessen berücksichtigt werden.
Was passiert, wenn sich die Anforderungen im Laufe der Zeit ändern?
Wenn sich dein Produkt weiterentwickelt, kannst du auswählen, welche Vektordatenbanken, Modelle und Retrieval-Strategien du nutzt, ohne alles von Grund auf neu designen zu müssen. Die modellagnostische Architektur von Agentset und das umfangreiche Metadaten-Filtern erleichtern die Anpassung an neue Compliance-Anforderungen, Regionen, Datentypen oder Performance-Constraints – bei gleichbleibend konsistenter Developer-Erfahrung.
Alternatives
AakarDev AI
AakarDev AI ist eine leistungsstarke Plattform, die die Entwicklung von KI-Anwendungen mit nahtloser Integration von Vektordatenbanken vereinfacht und eine schnelle Bereitstellung und Skalierbarkeit ermöglicht.
Devin
Devin ist ein KI-Coding-Agent und Software-Ingenieur, der Entwicklern hilft, bessere Software schneller zu erstellen.
PingPulse
PingPulse bietet KI-Agenten-Observability, damit Sie Agentenübergaben verfolgen, Probleme wie Hänger und Schleifen erkennen und Benachrichtigungen bei Fehlverhalten mit minimaler Codeintegration erhalten können.
SkillKit
SkillKit bietet einen universellen Satz von Fähigkeiten, mit denen Entwickler Code-Anweisungen einmal schreiben und diese über 32 verschiedene KI-Codierungsagenten bereitstellen können, was Konsistenz und breite Kompatibilität gewährleistet.
CodeSandbox
CodeSandbox ist eine Cloud-Entwicklungsplattform, die Entwicklern ermöglicht, Projekte jeder Größe von jedem Gerät aus in Rekordzeit zu codieren, zusammenzuarbeiten und zu versenden.
Dify
Entfesseln Sie agentische Workflows mit Dify. Entwickeln, implementieren und verwalten Sie autonome Agenten, RAG-Pipelines und mehr für Teams jeder Größe mühelos.