LangChain

LangChain이란?

LangChain은 개발자들이 AI 에이전트를 구축·평가·배포하는 데 사용하는 엔지니어링 플랫폼이자 오픈소스 프레임워크입니다. 핵심 목적은 팀이 전체 개발 수명 주기에서 에이전트 동작을 더 신뢰할 수 있게 만드는 것입니다.

이 플랫폼에는 LangSmith가 포함되어 있으며, “에이전트 엔지니어링 플랫폼”으로 설명되며 관측(추적), 평가(프로덕션 추적을 테스트 케이스로 변환하고 점수화), 배포(인간-루프 워크플로와 지속 실행을 지원하는 확장 가능한 런타임에서 에이전트 실행)를 지원합니다.

에이전트 실행을 위한 구조화된 추적: 각 에이전트 실행을 단계 타임라인으로 분해하여 무슨 일이 일어났는지, 순서와 이유를 확인할 수 있습니다. 긴 컨텍스트, 분기 로직, 다중 도구를 사용하는 복잡한 흐름 디버깅에 유용합니다.
프레임워크 호환 관측: “인기 있는 에이전트 프레임워크에 대한 네이티브 추적”을 지원하며 Python, TypeScript, Go, Java용 SDK를 통해 OpenTelemetry와 통합됩니다.
추적 간 분석: 여러 추적에서 패턴을 발견하는 분석과 AI 기반 인사이트를 제공하여 팀이 반복되는 문제나 동작을 파악할 수 있게 합니다.
실제 사용 기반 평가: 프로덕션 추적을 캡처하여 테스트 케이스로 변환하고 인간 검토와 자동 평가를 조합해 에이전트를 점수화합니다.
프로덕션 에이전트 배포 런타임: 메모리, 대화 스레드, 지속 체크포인팅을 갖춘 에이전트 서버를 포함하며, 장기 실행 에이전트와 인간 및 다른 에이전트와의 비동기 협업을 위해 설계되었습니다.
반복 및 엔터프라이즈 워크플로용 Fleet: 질문을 반복 에이전트로 변환하여 일상 도구에서 작동하게 하며, 페이지에 설명된 대로 엔터프라이즈 보안 및 관리 지원을 내장합니다.

LangChain 프레임워크로 구축 시작: 페이지에 언급된 오픈소스 프레임워크(예: deepagents, langgraph, deepagents/전용 섹션 표시)를 선택하고 선호하는 모델 제공자와 시작하세요.
LangSmith 추적으로 에이전트 실행 측정: LangSmith 추적을 사용해 에이전트 실행의 구조화된 타임라인(단계, 순서, 결정 이유 포함)을 캡처하세요.
프로덕션 추적으로 평가: 프로덕션 추적을 테스트 케이스로 변환하고 인간 검토 및 자동 평가로 에이전트 결과를 점수화하세요.
LangSmith 배포 기능으로 에이전트 배포: 지속 메모리, 대화 스레드, 확장 실행을 위해 에이전트 서버에서 실행하세요. 조직 전체 워크플로의 경우 LangSmith Fleet으로 반복 에이전트를 생성하세요.

복잡한 에이전트 동작 디버깅: 긴 컨텍스트, 분기 로직, 다중 도구를 사용하는 에이전트의 다단계 실행을 추적하여 실패나 예상치 못한 결정 지점을 찾아내세요.
실제 사용 데이터로 반복 개선: 프로덕션 추적을 캡처하여 테스트 케이스를 만들고 평가 주기를 실행해 에이전트 성능을 지속적으로 보정·개선하세요.
인간-루프 운영: 에이전트 서버가 지속 체크포인팅과 대화 스레드를 처리하는 다중 턴 상호작용에서 인간이 검토하거나 참여할 수 있게 지원하세요.
팀 간 에이전트 워크플로 확장: Fleet을 사용해 일상 언어로 설명된 루틴 작업(예: 연구, 후속 조치, 상태 확인)을 반복 에이전트로 변환하여 일상 도구에서 작동시키세요.
조직 전체 관측 통합: 네이티브 추적과 OpenTelemetry SDK 지원(Python/TypeScript/Go/Java)을 사용해 에이전트 텔레메트리를 기존 관측 설정과 맞추세요.

LangChain은 에이전트 구축만을 위한 도구인가요? 아니요. 이 페이지는 LangChain을 신뢰할 수 있는 AI 에이전트 구축·평가·배포를 지원하는 것으로 위치짓고 있으며, LangSmith가 관측·평가·배포를 담당합니다.
LangChain 생태계에서 LangSmith는 무엇인가요? LangSmith는 추적(관측)·평가 워크플로·배포 기능을 제공하는 에이전트 엔지니어링 플랫폼으로 설명됩니다.
LangSmith는 기존 텔레메트리 도구와 통합을 지원하나요? 네. 이 페이지는 LangSmith가 Python, TypeScript, Go, Java용 OpenTelemetry SDK를 제공하며 인기 에이전트 프레임워크에 대한 네이티브 추적도 지원한다고 명시합니다.
평가는 어떻게 작동하나요? 이 페이지는 LangSmith가 프로덕션 추적을 캡처해 테스트 케이스로 변환하고, 인간 리뷰와 자동 평가를 혼합해 에이전트를 점수화한다고 설명합니다.
장기 실행 워크플로용 에이전트 배포는 어떻게 하나요? 이 페이지는 메모리·대화 스레드·내구성 체크포인팅을 갖춘 에이전트 서버를 사용하며, 장기 실행과 비동기 협업을 목적으로 한다고 언급합니다.

OpenTelemetry 기반 에이전트 관측 전용: 추적/텔레메트리가 주된 필요이고 전체 평가·배포 워크플로가 아니라면, 에이전트 프레임워크용 OpenTelemetry 계측에 집중할 수 있습니다. 이는 LangSmith의 평가 및 에이전트 런타임 구성 요소를 포함하지 않을 수 있습니다.
범용 LLM 평가 프레임워크: 이미 추적이 있고 평가 파이프라인(예: 테스트 케이스 생성 및 점수화)만 필요하다면 평가 중심 접근이 적합할 수 있지만, 엔드투엔드 관측 및 배포 서버 기능을 제공하지 않을 수 있습니다.
내장 메모리와 워크플로를 가진 에이전트 오케스트레이션 플랫폼: 프로덕션 오케스트레이션(스레드·메모리·내구성 실행)이 주된 필요라면 에이전트 오케스트레이션 솔루션을 찾을 수 있습니다. 이러한 대안은 LangSmith의 추적-테스트 평가 루프보다 배포/런타임에 더 초점을 맞출 수 있습니다.
오픈소스 프레임워크를 사용한 커스텀 에이전트 스택: 오픈소스 에이전트 프레임워크를 직접 사용해 관측 및 평가 도구를 추가할 수 있습니다. 이는 추적과 평가 워크플로 통합 부담을 엔지니어링 팀으로 옮기는 경우가 일반적입니다.