UStackUStack
LangChain icon

LangChain

LangChain提供工程工具与开源框架,帮助开发者构建、评估并部署可靠AI智能体;配套LangSmith实现可观测性与评测部署。

LangChain

什么是 LangChain?

LangChain 是一个工程平台和开源框架,开发者用它来构建、评估和部署 AI 智能体。其核心目的是帮助团队在整个开发生命周期中使智能体行为更可靠。

该平台包含 LangSmith,被描述为“智能体工程平台”,支持可观测性(追踪)、评估(将生产追踪转为测试用例并评分)以及部署(使用可扩展运行时运行智能体,支持人工介入工作流和持久执行)。

主要特性

  • 智能体运行的结构化追踪:将每次智能体执行分解为步骤时间线,让你看到发生了什么、顺序如何以及原因——适用于调试具有长上下文、分支逻辑和多种工具的复杂流程。
  • 框架兼容的可观测性:支持“热门智能体框架的原生追踪”,并通过 Python、TypeScript、Go 和 Java 的 SDK 与 OpenTelemetry 集成。
  • 跨追踪的分析:提供分析和 AI 驱动洞察,揭示多个追踪中的模式,帮助团队发现反复出现的问题或行为。
  • 基于真实用例的评估:捕获生产追踪,将其转为测试用例,并结合人工审查和自动化评估对智能体评分。
  • 生产智能体的部署运行时:包含具有内存、对话线程和持久检查点的智能体服务器,专为长运行智能体以及与人类和其他智能体的异步协作设计。
  • Fleet 用于重复和企业工作流:让团队将问题或任务转为跨日常工具运行的重复智能体,内置企业安全和管理支持(如页面所述)。

如何使用 LangChain

  1. 使用 LangChain 框架开始构建:选择页面引用的开源框架(例如 deepagents、langgraph、deepagents/专用部分所示),并从你偏好的模型提供商开始。
  2. 使用 LangSmith 追踪记录智能体运行:利用 LangSmith 的追踪捕获智能体执行的结构化时间线,包括步骤、顺序和决策原因。
  3. 使用生产追踪进行评估:将生产追踪转为测试用例,并通过人工审查和自动化评估对智能体结果评分。
  4. 使用 LangSmith 部署功能部署智能体:在智能体服务器上运行智能体,实现持久内存、对话线程和可扩展执行。对于组织级工作流,使用 LangSmith Fleet 创建重复智能体。

使用场景

  • 调试复杂智能体行为:追踪多步智能体执行,精确定位在使用长上下文、分支逻辑和多种工具时的失败或意外决策位置。
  • 基于真实使用数据的迭代改进:捕获生产追踪,从中创建测试用例,并运行评估循环以校准和提升智能体性能。
  • 人工介入操作:支持多轮交互,让人类审查或参与智能体任务,由智能体服务器处理持久检查点和对话线程。
  • 跨团队扩展智能体工作流:使用 Fleet 将常规任务(例如研究、跟进、状态检查)以自然语言描述转为跨日常工具运行的重复智能体。
  • 组织级可观测性集成:使用原生追踪和 OpenTelemetry SDK 支持(Python/TypeScript/Go/Java),将智能体遥测与现有可观测性系统对齐。

常见问题

  • LangChain 只用于构建智能体吗?

    不是。本页面将 LangChain 定位为支持构建、评估并部署可靠 AI 智能体,LangSmith 则覆盖可观测性、评测与部署。

  • LangSmith 在 LangChain 生态中是什么?

    LangSmith 被描述为智能体工程平台,提供追踪(可观测性)、评测工作流以及部署功能。

  • LangSmith 支持与现有遥测工具集成吗?

    是的。本页面指出,LangSmith 提供 OpenTelemetry SDKs 支持 Python、TypeScript、Go 和 Java,并为流行智能体框架提供原生追踪。

  • 评测是如何工作的?

    本页面指出,LangSmith 捕获生产追踪,将其转为测试用例,并使用人工审核与自动化评测相结合的方式为智能体打分。

  • 长运行工作流的智能体如何部署?

    本页面提到,部署使用配备内存、对话线程和持久检查点的智能体服务器,适用于长时间运行与异步协作。

替代方案

  • 仅基于 OpenTelemetry 的智能体可观测性:如果主要需求是追踪/遥测而非完整的评测与部署工作流,可专注于智能体框架的 OpenTelemetry 插桩。这与 LangSmith 的评测和智能体运行时组件不同,可能不包含这些。

  • 通用 LLM 评测框架:对于已有追踪、仅需评测管道(例如测试用例生成与打分)的团队,专注评测的方法可能合适,但可能无法提供端到端可观测性与部署服务器功能。

  • 内置内存与工作流的智能体编排平台:如果主要需求是生产编排(线程、内存与持久执行),可寻找智能体编排解决方案;这些替代方案可能更注重部署/运行时,而非 LangSmith 的追踪到测试评测循环。

  • 使用开源框架的自定义智能体堆栈:可直接基于开源智能体框架构建,并添加自有的可观测性与评测工具。这通常将追踪与评测工作流的集成负担转移到工程团队。

LangChain | UStack