UStackUStack
LlamaIndex icon

LlamaIndex

LlamaIndex로 에이전틱 OCR과 스키마 기반 추출, 이벤트 기반 워크플로를 활용해 PDF·스프레드시트·이미지 등 비정형 문서 처리 에이전트를 구축하세요.

LlamaIndex

LlamaIndex란?

LlamaIndex는 AI 기반 문서 처리 에이전트를 구축하기 위한 개발자 중심 플랫폼입니다. 에이전틱 OCR과 문서 자동화를 워크플로 엔진과 결합해 PDF, 스프레드시트, 이미지 등의 문서를 파싱하고 구조화된 정보를 추출하며, 에이전트와 검색을 포함한 다단계 프로세스를 조율할 수 있습니다.

LlamaIndex의 핵심 목적은 팀이 비정형 문서 입력을 신뢰할 수 있는 프로덕션 지향 문서 워크플로로 전환하도록 돕는 것입니다. 파싱, 스키마 기반 추출, 검색(RAG)을 위한 인덱싱, 이벤트 기반 조율을 위한 모듈러 컴포넌트를 사용합니다.

주요 기능

  • LlamaParse 에이전틱 OCR 및 파싱: 내장 이미지, 복잡한 레이아웃, 다중 페이지 테이블, 손글씨 노트 등을 포함한 90+ 비정형 파일 유형을 파싱하며, 레이아웃 인식 문서 이해를 지원합니다.
  • 인용 및 신뢰도 포함 스키마 기반 추출: 정의된 스키마에 따라 비정형 콘텐츠를 구조화된 출력으로 변환하는 추출 에이전트를 사용하며, 페이지 인용과 신뢰도 점수를 제공해 검증을 지원합니다.
  • 검색 최적화 인덱싱: RAG 검색 호출 시 정밀도와 관련성을 제공하도록 설계된 엔터프라이즈급 청킹 및 임베딩 파이프라인을 제공합니다.
  • 이벤트 기반, 비동기 우선 워크플로 엔진: 단계 체이닝, 루프, 병렬 분기를 지원하며, 에이전트와 문서 파이프라인의 다단계 AI 프로세스를 조율합니다.
  • 워크플로의 상태 유지 실행/일시정지/재개: 워크플로를 상태 유지 방식으로 제어하고 재개할 수 있는 이벤트 기반 실행을 지원합니다.
  • 개발자 중심 에이전트 프레임워크 (LlamaIndex): 에이전트, RAG, 커스텀 워크플로, 통합을 위한 Python 및 TypeScript SDK를 제공하며, 메모리와 인간 개입 리뷰 등의 빌딩 블록을 포함합니다.

LlamaIndex 사용 방법

  1. LlamaParse로 시작해 소스 문서(PDF나 이미지 등)를 파싱하고 다운스트림 처리에 적합한 구조화된 표현을 얻습니다.
  2. 추출할 필드에 대한 스키마를 정의한 후 스키마 기반 추출을 실행해 인용과 신뢰도 점수가 포함된 구조화된 출력을 생성합니다.
  3. LlamaIndex의 청킹 및 임베딩 파이프라인을 사용해 검색을 위한 인덱싱을 수행하여 문서에 대한 RAG 스타일 쿼리를 지원합니다.
  4. 워크플로로 전체 흐름 조율: 파싱, 추출, 인덱싱, 에이전트 단계를 연결해 비동기 우선 이벤트 기반 워크플로를 생성하고 실행/재개할 수 있습니다.

사용 사례

  • 자동 송장 또는 문서 검토 파이프라인: 문서를 파싱하고 정의된 필드를 스키마로 추출한 후, 비즈니스 로직(예: 검증, 라우팅, 후속 조치)에 맞는 다운스트림 단계를 조립합니다.
  • 금융 연구 및 실사 지원: 복잡한 비정형 자료를 구조화된 인사이트로 변환하고, 인덱싱된 콘텐츠에 대한 검색을 통해 에이전트 주도 분석 워크플로를 활성화합니다.
  • 인수심사, 감사, 클레임 운영: 손글씨 노트나 구조화된 테이블 등의 비정형 소스에서 관련 정보를 추출해 행정 및 검토 워크플로를 지원합니다.
  • 기술 문서로부터 제조 추출: 복잡한 레이아웃과 테이블이 포함된 사양서, 매뉴얼, 검사 보고서에서 인사이트를 추출해 더 빠른 정보 검색을 지원합니다.
  • 고객 지원 지식 및 에이전트 지원: 인덱싱된 문서 콘텐츠와 검색을 사용해 내부 지식베이스 쿼리를 구동하고, 추출된 인용 답변으로 에이전트를 지원합니다.

FAQ

LlamaIndex가 처리할 수 있는 문서는 무엇인가요?

LlamaParse는 PDF 및 기타 비정형 소스를 포함한 90+ 비정형 파일 유형의 파싱을 지원하며, 내장 이미지, 복잡한 레이아웃, 다중 페이지 테이블, 손글씨 노트 처리를 포함합니다.

LlamaIndex는 구조화된 출력을 어떻게 생성하나요?

스키마 기반 LLM 활용 추출 에이전트를 사용해 비정형 콘텐츠를 구조화된 인사이트로 변환합니다. 플랫폼은 페이지 인용과 신뢰도 점수도 지원합니다.

문서 에이전트를 구축하려면 Workflows가 필수인가요?

LlamaIndex는 개발자 중심 에이전트 프레임워크(LlamaIndex)와 별도의 워크플로 엔진(Workflows)을 제공합니다. 플랫폼은 엔드투엔드 접근으로 위치づけ되지만, 구축하는 워크플로에 따라 특정 조합이 달라집니다.

Workflows는 무엇에 사용되나요?

Workflows는 파싱, 추출, 에이전트 단계를 체인으로 연결하는 다단계 AI 프로세스를 오케스트레이션하는 데 사용되며, 이벤트 기반·비동기 우선 모델로 상태를 유지하며 시작·일시정지·재개할 수 있습니다.

LlamaIndex가 RAG를 지원하나요?

네. 플랫폼은 RAG 스타일 검색 호출을 위한 인덱싱 및 검색 파이프라인(청킹 및 임베딩)을 포함하며, LlamaIndex 프레임워크는 에이전트와 RAG에 최적화되어 있습니다.

대안

  • 범용 문서 OCR + 맞춤 파이프라인: OCR 엔진으로 텍스트 추출 후 추출·인덱싱·오케스트레이션 로직을 직접 구축하세요. 유연성을 제공하지만 레이아웃 인식 파싱과 다단계 워크플로 처리를 위해 더 많은 엔지니어링이 필요합니다.
  • 문서 파싱 모듈이 없는 RAG 프레임워크: 에이전트/RAG 프레임워크를 선택하고 외부 문서 파싱/OCR 서비스를 연결하세요. OCR 레이아웃 처리와 문서별 추출 책임이 핵심 프레임워크 외부 구성 요소로 이동합니다.
  • LLM 앱용 워크플로 오케스트레이션 플랫폼: 워크플로/오케스트레이션 도구로 맞춤 문서 처리 파이프라인을 구축하고 별도 파싱·인덱싱 구성 요소를 통합하세요. 기존 오케스트레이션 스택을 표준화한 팀에 적합하지만 엔드투엔드 문서 자동화를 위해 더 많은 통합 작업이 필요할 수 있습니다.
LlamaIndex | UStack