UStackUStack
Agentset favicon

Agentset

Agentset은 프로덕션 수준의 AI 채팅 및 검색 애플리케이션을 구축하기 위한 오픈 소스 플랫폼으로, 신뢰할 수 있는 RAG, 멀티모달 지원, 그리고 개발자 친화적인 SDK를 제공합니다.

Agentset

Agentset란 무엇인가요?

Agentset란 무엇인가요?

Agentset은 프로덕션 수준의 Retrieval-Augmented Generation(RAG) 애플리케이션을 구축하는 개발자를 위한 오픈 소스 인프라 플랫폼입니다. 복잡한 RAG 파이프라인을 처음부터 설계·튜닝·운영하지 않아도, 여러분의 문서와 데이터를 기반으로 신뢰할 수 있고 출처가 명시된 답변을 제공하는 AI 채팅 및 검색 경험을 구현할 수 있습니다.

대부분의 RAG 데모는 통제된 환경에서는 인상적이지만, 실제 사용자, 방대한 문서량, 복잡하고 멀티모달인 데이터 환경에서는 쉽게 무너집니다. Agentset은 바로 이러한 실제 프로덕션 환경을 위해 설계되었습니다. 강력한 수집(ingestion), 하이브리드 검색, 에이전트 기반 추론, 자동 인용 기능을 하나의 시스템으로 통합해 별도 설정 없이 바로 사용할 수 있으며, 팀이 몇 달이 아니라 몇 분 만에 정확한 AI 검색 및 Q&A 기능을 제품에 내장할 수 있도록 돕습니다.

주요 기능

  • 프로덕션급 RAG, 기본 제공
    Agentset은 인제션, 인덱싱, 검색, 추론, 답변 생성까지 아우르는 엔드 투 엔드 RAG 스택을 제공하며, 프로덕션 워크로드에 맞게 설계되었습니다. 데이터 볼륨, 사용량, 복잡도가 증가하더라도 높은 안정성과 일관성을 유지하도록 최적화되어 있습니다.

  • 벤치마크 수준의 정확한 답변
    이 플랫폼은 별도의 커스텀 튜닝 없이도 여러분의 자체 데이터에서 높은 정확도의 응답을 제공하도록 최적화되어 있습니다. Agentset은 MultiHopQAFinanceBench와 같은 업계 최고 수준의 벤치마크를 목표로 하며, 복잡한 다단계 질의나 도메인 특화 질문에 적합합니다.

  • 멀티모달 지원(텍스트, 이미지, 표, 그래프 등)
    Agentset은 전통적인 텍스트뿐 아니라 이미지, 표, 그래프를 네이티브하게 지원합니다. 이를 통해 PDF, 프레젠테이션, 스프레드시트, 이미지가 많은 문서, 구조화된 산출물 등 지식 베이스 전반에 걸친 질문에 답할 수 있으며, 일반 텍스트에만 제한되지 않습니다.

  • 신뢰할 수 있는 답변을 위한 자동 인용
    Agentset이 생성하는 모든 답변에는 근거가 된 소스에 대한 인용이 포함됩니다. 사용자는 어떤 문서의 어떤 구절이 사용되었는지 직접 확인할 수 있어, 신뢰성과 디버깅 가능성, 의료·금융 등 민감한 영역에서의 규제 준수 수준이 높아집니다.

  • 메타데이터 필터와 세밀한 검색 제어
    Agentset은 메타데이터 기반 필터링을 지원하여 고객, 프로젝트, 지역, 날짜, 권한 수준 등으로 문서 하위 집합을 제한해 답변을 생성할 수 있습니다. 이는 멀티 테넌트 제품이나 역할 기반 접근 제어(RBAC) 시나리오에서 필수적입니다.

  • 리랭킹을 포함한 하이브리드 검색
    검색 계층은 벡터 검색과 전통적인 키워드·메타데이터 기반 접근을 결합하고, 리랭킹을 통해 정밀도를 극대화합니다. 이를 통해 재현율과 관련성을 동시에 향상시키며, 환각(hallucination)과 누락된 결과를 줄입니다.

  • 내장된 에이전트 기반 추론
    Agentset은 스택 내부에 에이전트 기반 추론 기능을 탑재해, 별도의 오케스트레이션 로직을 구축하지 않고도 다단계 분석, 다문서 종합, 복잡한 Q&A를 수행할 수 있게 해줍니다.

  • 광범위한 파일 형식 지원
    22개 이상 파일 포맷을 지원하는 Agentset은 다음과 같은 형식의 문서를 수집할 수 있습니다:
    .PDF, .DOCX, .PPT, .PPTX, .XLSX, .ODT, .TXT, .MD, .CSV, .TSV, .HTML, .XML, .EML, .MSG, .JPEG, .PNG, .BMP, .HEIC 등. 폭넓은 포맷 지원을 통해 기존 지식 저장소를 하나의 검색 가능하고 AI 활용이 가능한 인덱스로 통합하기가 수월해집니다.

  • 개발자 우선 SDK(JavaScript & Python)
    Agentset은 JavaScript와 Python SDK를 제공하여 데이터 인제션, 네임스페이스 설정, AI 에이전트 쿼리를 간단하게 처리할 수 있게 합니다. 일반적인 워크플로우는 몇 줄의 코드로 네임스페이스를 생성하고, 문서를(파일 또는 URL로) 업로드한 뒤, 바로 질문에 답변하기 시작하는 식입니다.

  • 모델 불가지론 및 유연한 인프라 선택
    특정 모델이나 벤더에 종속되지 않습니다. Agentset에서는 다음과 같은 요소를 자유롭게 선택할 수 있습니다.

    • 벡터 데이터베이스(예: Pinecone, Qdrant)
    • 임베딩 모델
    • LLM(예: OpenAI, Anthropic Claude, Google AI, xAI Grok, Mistral, Qwen, DeepSeek 등) 이 유연성을 통해 비용, 지연 시간, 데이터 레지던시, 규제 준수 요구사항에 맞게 최적화할 수 있습니다.
  • MCP 서버 통합
    Model Context Protocol(MCP) 서버를 통해, MCP를 지원하는 외부 애플리케이션에 여러분의 지식 베이스를 연결할 수 있습니다. 이를 통해 다른 환경의 AI 에이전트가 여러분의 문서를 안전하고 효율적으로 조회할 수 있습니다.

  • AI SDK 통합
    Agentset은 AI SDK 생태계와 통합되어 있어, RAG 기반 채팅 및 검색 위젯을 자체 애플리케이션, 대시보드, 고객용 제품에 쉽게 임베드할 수 있습니다.

  • 외부 미리보기 링크 & 채팅 인터페이스
    커스터마이즈 가능한 채팅 인터페이스와 미리보기 링크를 통해 이해관계자 및 사용자로부터 빠르게 피드백을 수집할 수 있습니다. 이를 통해 본격 론칭 전에 프롬프트, 검색 구성, 답변 포맷을 빠르게 반복·개선할 수 있습니다.

  • 실제 팀들이 신뢰하는 솔루션
    Agentset은 의료, 공공 부문, 핀테크 등 고위험 도메인의 팀에서 사용되고 있습니다. 고객 후기는 향상된 안정성, 복잡한 이미지 검색 지원, Algolia 같은 기존 검색 솔루션을 1시간 이내 작업으로 대체하면서도 더 나은 결과를 얻은 사례 등을 보여줍니다.

Agentset 사용 방법

Agentset 사용은 설정부터 프로덕션 배포까지 전형적인 개발자 워크플로우를 따릅니다.

  1. 프로젝트 설정 및 API 키 발급

    • Agentset에 가입하고 API 키를 생성합니다.
    • 애플리케이션에 SDK를 설치합니다.
      • JavaScript/TypeScript: npm install agentset
      • Python: pip 등을 사용해 해당 Python 패키지를 설치합니다.
  2. 데이터용 네임스페이스 생성
    네임스페이스는 문서, 테넌트, 환경(production, staging, 고객별 등)을 논리적으로 분리하는 단위입니다.

    import { Agentset } from "agentset";
    
    const agentset = new Agentset({ apiKey: "agentset_xxx" });
    const namespace = agentset.namespace("ns_1234");
    
  3. 문서 인제션(수집)
    선택적 메타데이터와 함께 파일 또는 URL로 문서를 업로드합니다.

    const ingestJob = await namespace.ingestion.create({
      payload: {
        type: "FILE",
        fileUrl: "https://example.com/document.pdf",
        fileName: "my-document.pdf"
      },
      config: {
        metadata: { foo: "bar" }
      }
    });
    
    • PDF, Office 문서, 이메일, 이미지, 마크다운 등 지원되는 포맷을 사용합니다.
    • 이후 검색 제어를 위해 고객 ID, 부서, 접근 레벨, 태그 등 메타데이터를 함께 첨부합니다.
  4. 검색 및 모델 구성(선택 사항)

    • 선호하는 벡터 데이터베이스, 임베딩 모델, LLM을 선택합니다.
    • 필요에 따라 하이브리드 검색 및 리랭킹을 활성화합니다.
    • 테넌트 격리와 접근 제어를 위한 필터를 정의합니다.
  5. 앱에 채팅 또는 검색 기능 임베드

    • AI SDK를 사용해 Agentset을 호출하는 채팅 또는 검색 엔드포인트를 만듭니다.
    • Agentset에 쿼리하고 인용과 함께 답변을 렌더링하는 UI 컴포넌트(채팅 위젯, 검색 바, 사이드 패널 등)를 구현합니다.
    • 필요하다면 MCP 서버 통합을 통해 지식 베이스를 외부 AI 도구에 노출합니다.
  6. 테스트, 미리보기, 반복 개선

    • 미리보기 링크를 이해관계자와 공유해 답변 품질을 검증합니다.
    • 특히 멀티홉 및 도메인 특화 질문을 중심으로 자체 테스트 셋에서 성능을 평가합니다.
    • 피드백을 바탕으로 검색 파라미터, 필터, 프롬프트를 조정합니다.
  7. 프로덕션 환경에서 모니터링 및 확장

    • 사용량이 증가함에 따라 비용과 지연 시간 요구사항에 맞게 데이터베이스와 모델 등 인프라 구성을 조정합니다.
    • 새로운 문서를 지속적으로 인제션해 지식 베이스를 최신 상태로 유지합니다.
    • 메타데이터와 네임스페이스를 활용해 멀티 테넌트 또는 멀티 제품 배포를 관리합니다.

활용 사례

1. SaaS 플랫폼 내 제품 검색 및 AI 채팅

대규모 도움말 센터, 기술 문서, 고객별 설정 정보를 가진 SaaS 제품은 Agentset 기반 검색을 임베드해 정확하고 문맥에 맞는 답변을 제공할 수 있습니다. 정적인 FAQ 페이지나 취약한 키워드 검색 대신, 사용자는 자연어로 질문하고 릴리즈 노트, 설정 가이드, 지원 티켓 등에서 인용된 신뢰할 수 있는 답변을 받을 수 있습니다.

2. 헬스케어 및 의료 지식 어시스턴트

의료 분야에서는 신뢰성과 근거 추적 가능성이 매우 중요합니다. Agentset은 임상의, 연구자, 의료 운영팀이 가이드라인, 연구 논문, 내부 프로토콜을 조회하는 내부 도구를 지원할 수 있습니다. 자동 인용과 근거 기반 답변을 통해 환각 위험을 줄이고, 답변이 실제 근거에 기반함을 검증하면서도 효율적인 워크플로우를 유지할 수 있습니다.

3. 공공 부문 및 지자체 정보 포털

지자체나 정부와 협업하는 조직은 수백~수천 페이지에 달하는 규정, 정책, 공공 문서를 관리하는 경우가 많으며, 그 안에는 이미지, 차트, 표가 다수 포함됩니다. Agentset의 멀티모달 기능은 복잡한 이미지·문서 검색을 지원해, 직원이나 시민이 긴 이질적 문서들 사이에서 필요한 정보를 빠르고 정확하게 찾을 수 있게 합니다.

4. 금융 리서치, 컴플라이언스, 분석 도구

금융 팀은 공시, 내부 보고서, 시장 데이터에 걸친 복잡한 멀티홉 질문에 답해야 합니다. Agentset은 FinanceBench와 같은 과제에서 벤치마크 수준 성능을 목표로 하므로, 촘촘하고 기술적인 문서에 대한 정밀한 답변이 필요한 리서치 어시스턴트, 규제 준수 점검 도구, 애널리스트용 툴에 적합합니다.

5. 엔터프라이즈 지식 베이스 및 내부 코파일럿

위키, PDF, 이메일 아카이브, 인트라넷, 파일 공유 등 분산된 지식을 가진 대기업은 Agentset을 통해 부서 간 통합 검색을 구현할 수 있습니다. 하이브리드 검색, 메타데이터 필터링, 모델 불가지론 인프라 지원을 통해 IT 팀은 데이터가 어디에 위치하는지, 어떤 모델을 사용하는지, 접근을 어떻게 관리할지 통제할 수 있으며, 직원들은 내부 지식을 위한 강력한 단일 AI 어시스턴트를 활용할 수 있습니다.

FAQ

Agentset이란 무엇인가요?

Agentset은 프로덕션 수준의 RAG 애플리케이션을 구축하기 위한 오픈 소스 플랫폼이자 인프라 계층입니다. 인제션, 인덱싱, 검색, 추론, 답변 생성 기능을 제공해, 개발자가 전체 RAG 파이프라인을 직접 구축하지 않고도 정확한 AI 채팅과 검색 기능을 제품에 내장할 수 있게 합니다.

Agentset은 누구를 위한 제품인가요?

Agentset은 자체 데이터 위에 신뢰할 수 있는 AI 기능(챗봇, 내부 코파일럿, 고급 검색 등)을 구축하고자 하는 개발자와 프로덕트 팀을 위해 설계되었습니다. 프로덕션급 성능, 멀티 테넌트 지원, 모델 및 인프라 선택의 유연성이 필요한 스타트업, 중견 기업, 대기업 모두에 적합합니다.

대기업에서도 Agentset을 사용할 수 있나요?

네. Agentset은 실제 환경의 대규모 문서 세트, 복잡한 데이터 타입, 높은 사용량을 처리할 수 있도록 설계되었습니다. 메타데이터 필터, 네임스페이스, 모델 불가지론 인프라 지원을 통해 엄격한 데이터 분리, 규제 준수, 기존 스택과의 통합이 필요한 엔터프라이즈 환경에서도 잘 맞습니다.

Agentset은 LangChain이나 LlamaIndex 같은 프레임워크인가요?

Agentset은 단순한 클라이언트 사이드 오케스트레이션 프레임워크가 아닙니다. LangChain이나 LlamaIndex가 코드 상에서 RAG 워크플로우를 조합하는 데 도움을 주는 반면, Agentset은 인제션, 검색, 추론을 위한 매니지드 프로덕션 백엔드를 제공합니다. 원한다면 이들 프레임워크와 Agentset을 함께 사용할 수 있지만, Agentset의 목표는 별도의 검색 인프라를 구축·운영해야 하는 부담을 줄이는 것입니다.

Agentset은 기존 스택 및 인프라와 함께 사용할 수 있나요?

네. Agentset은 모델 불가지론을 지향하며, 인기 있는 벡터 데이터베이스, LLM 제공자, 임베딩을 지원합니다. Pinecone이나 Qdrant 같은 컴포넌트를 벡터 스토리지로, OpenAI, Anthropic, Google AI, xAI Grok, Mistral, Qwen, DeepSeek 등 다양한 제공자의 모델을 선택할 수 있습니다. JavaScript, TypeScript, Python SDK, MCP 서버, AI SDK를 통한 통합으로, 기존 서비스와 프론트엔드에 Agentset을 손쉽게 임베드할 수 있습니다.

직접 RAG 시스템을 구축하는 대신 왜 Agentset을 사용해야 하나요?

견고한 RAG 시스템을 처음부터 구축하려면 인제션 파이프라인 설계, 다양한 파일 형식 처리, 검색 튜닝, 하이브리드 검색·리랭킹 구현, 인용 관리, 요구사항 변화에 따른 인프라 유지보수 등 많은 작업이 필요합니다. 이는 수개월의 엔지니어링 리소스와 지속적인 운영 비용을 수반할 수 있습니다. Agentset은 이러한 기능을 기본으로 제공해, 팀이 저수준 검색 인프라가 아닌 제품 기능과 사용자 경험에 집중할 수 있도록 합니다.

Agentset은 실제 문서를 어떻게 처리하나요?

Agentset은 복잡하고 정제되지 않은(real-world) 데이터를 처리하는 데 최적화되어 있습니다. PDF, Office 문서, 이메일, 이미지, HTML 등 22개 이상의 파일 포맷을 지원하며, 효과적인 검색을 위해 필요한 파싱, 청크 분할, 인덱싱을 수행합니다. 멀티모달 지원 덕분에, 이미지·그래프·표도 검색 및 Q&A 과정에서 무시되지 않고 적절히 활용됩니다.

요구사항이 시간이 지나며 변하면 어떻게 되나요?

제품이 발전함에 따라, 전체 구조를 다시 설계하지 않고도 사용하는 벡터 데이터베이스, 모델, 검색 전략을 조정할 수 있습니다. Agentset의 모델 불가지론 아키텍처와 풍부한 메타데이터 필터링 기능은 새로운 규제 요건, 지역, 데이터 타입, 성능 제약에 맞춰 쉽게 적응할 수 있도록 하면서, 일관된 개발자 인터페이스를 유지하도록 돕습니다.

Agentset | UStack