LangChain：我们如何利用深度代理让文档自我测试

LangChain构建了一个使用深度代理（Deep Agents）的文档自动化测试系统，防止文档中出现过时的代码示例。该系统使用多种技能（skills）将内联代码片段迁移到独立测试文件，通过GitHub Actions运行它们，并重新生成经过验证的片段，确保文档始终反映API的实际状态。

每个开发者都熟悉这种挫败感：从官方文档复制代码示例，运行它——然而它不起作用。API已经更改，参数被重命名，但文档没有更新。LangChain决定使用自己的AI代理来解决这个问题。

文档自我测试系统是如何工作的？

LangChain使用深度代理——具有多种专业技能（skills）的AI代理，这些技能组织在.deepagents/skills/目录中。系统自动遍历文档，识别所有内联代码片段，并将其迁移到独立测试文件中。

每个提取的片段都成为可执行测试，在每次提交时通过GitHub Actions运行。如果测试失败——因为API已更改——系统会自动重新生成反映API当前状态的经过验证的代码片段，并更新文档。

“文档即代码加测试”的方法并不新鲜，但使用AI代理自动化整个周期是全新的。传统上，文档测试需要为每个示例手动编写测试——这项工作很少得到维护，因为它对产品功能没有直接影响。

LangChain的方法以与生产代码相同的严格性对待文档：每个示例都必须通过测试，每个测试都自动运行，每次失败都自动修复。对于开发周期快速的项目——API每周都在变化——这就是能用的文档和令人沮丧的文档之间的区别。

该系统作为参考实现提供，其他开源项目可以根据自身需求进行调整。

常见问题

LangChain如何测试其文档？

使用深度代理——具有多种技能的AI代理——自动从文档中提取代码示例，将其转换为可执行测试，运行它们并重新生成经过验证的片段。

为什么文档自动化测试很重要？

因为文档中过时的代码示例会导致用户沮丧、增加支持工单和对库失去信任，尤其是当API像LangChain那样频繁变更时。