一、这本书真正讲的是什么
一句话:它把「会聊天的模型」升级成「能规划、能调用工具、能记忆、能协作、能被监控的系统」所需的工程设计模式,整理成一套词汇表。
它不是
不是「万能 Agent 秘籍」,不是某个框架的教程,也不是简单的提示词合集。照抄模式不会自动得到可靠系统。
它更像
Agent 时代的架构模式手册:像软件工程里的 MVC、CQRS、Saga 一样,用固定名称描述常见系统结构。
适合谁读
做 AI 应用、企业工作流、RAG、代码 Agent、多智能体协作、工具调用平台、LLMOps 的工程师和产品架构师。
项目本身的定位
仓库说明写得很直接:这是《Agentic Design Patterns》的中文翻译项目,覆盖 21 个核心模式和多个附录,提供在线阅读、PDF/EPUB 资源。README 同时标注「已完成翻译:32/32」「待审核:32/32」「已审核完成:0/32」。所以阅读时应把它视为一个正在持续优化的中文学习版本,关键概念很完整,但个别术语和句式仍需要对照原文或工程实践校准。
21 个模式可以压缩成 6 个问题
- 怎么拆任务?提示链、路由、并行化、反思。
- 怎么让模型行动?工具使用、MCP、A2A、CLI/GUI/真实环境交互。
- 怎么让 Agent 有目标?规划、目标监控、优先级、探索发现。
- 怎么让它记住和查到东西?记忆管理、RAG、GraphRAG、Agentic RAG。
- 怎么让多个 Agent 一起工作?专家分工、顺序交接、并行处理、辩论、层级协调。
- 怎么让系统可控?异常恢复、人机协同、安全护栏、评估与监控。
二、总体模式地图:Agent 从「回答」走向「执行」
如果把 Agent 看成一个生产系统,而不是一次模型调用,它至少有四条主链路:任务编排、外部行动、状态知识、安全评估。任何严肃 Agent 产品,最后都会长成这四条链路的组合。
| 模式族 | 解决的问题 | 典型触发条件 | 最大风险 |
|---|---|---|---|
| 提示链 / 路由 / 并行化 | 把任务切成模型更能稳定处理的小块 | 输入复杂、流程可拆、输出需要中间结构 | 链路越长,错误传播越隐蔽 |
| 反思 / 评审 | 让模型检查自己的答案或让另一个模型检查 | 需要高质量输出、代码审查、报告生成 | 自我评审可能形成一致性幻觉 |
| 工具使用 / MCP | 突破模型训练数据边界,接入实时数据和真实动作 | 需要查库、算数、发邮件、改代码、调用 SaaS | 越权调用、参数污染、工具结果被误读 |
| 规划 / 目标监控 | 把高层目标变成可执行步骤,并在受阻时重规划 | 路径未知、任务跨度长、需要动态探索 | 计划看起来合理但执行验证不足 |
| 记忆 / RAG | 让系统拥有长期上下文和外部知识 | 私有知识库、用户画像、跨会话任务 | 检索片段错误、过期、冲突或缺少来源 |
| 护栏 / HITL / 监控 | 控制风险、追踪质量、把人放在关键决策点 | 生产环境、敏感数据、金钱/法律/账号操作 | 护栏过弱会失控,过强会让系统不可用 |
三、编排类模式:先把任务拆到模型能稳定完成
很多 Agent 失败不是因为模型太弱,而是把一个需要十步推理、三次查询、两次校验的任务塞进了一次 prompt。编排类模式的核心是:不要迷信一次回答,把复杂性显式拆开。
Prompt Chaining:把长任务变成流水线
提示链把复杂任务拆成多个顺序步骤:第 1 步抽取事实,第 2 步结构化,第 3 步推理,第 4 步生成输出,第 5 步检查格式。每一步都只做一个相对清楚的子任务,输出再喂给下一步。
适合 信息抽取、复杂问答、内容生成、代码修复、多模态分析。
关键 中间结果最好用 JSON/XML/表格等结构化格式,减少下游误解。
Routing:先判断任务类型,再选处理器
路由模式像客服分诊:账单问题走财务 Agent,代码问题走代码 Agent,法律问题走安全受限流程。它把「一个万能模型处理所有输入」改成「先分类,再交给专门链路」。
适合 多意图入口、企业助手、工单系统。
风险 路由错了,后续链路再强也会跑偏。
Parallelization:能并行就别串行等
并行化把独立子任务同时交给多个模型或工具,例如对同一份材料分别做事实核查、摘要、反方观点、代码扫描。最后由聚合器合并。
适合 研究报告、候选方案比较、批量抽取。
代价 Token 成本和协调成本会上升。
Reflection:让输出接受第二次审视
反思不是让模型「想一想」这么简单,而是把生成器和评论器分开:一个产生结果,另一个按标准检查事实、格式、遗漏、风险,再决定是否修订。
适合 高质量写作、代码生成、复杂推理。
注意 同一模型自评不等于真实评测,关键场景还要外部测试或人审。
四、行动类模式:工具调用是 Agent 的手和脚
工具使用章节的核心观点很朴素:LLM 本身只会生成文本,真实世界的行动必须通过函数、API、数据库、脚本、浏览器、机器人或 SaaS 来完成。Agent 的「智能」很大一部分来自它知道何时该调用什么工具,并能读懂工具返回。
工具调用的标准闭环
- 定义工具:名称、描述、参数 schema、权限、返回格式。
- 模型决策:模型根据任务判断是否需要工具,以及传什么参数。
- 结构化调用:输出函数调用 JSON,而不是自然语言「我去查一下」。
- 运行时执行:Agent 框架或工具层实际调用 API、CLI、数据库、浏览器。
- 结果回填:工具结果回到上下文,模型基于结果继续推理或生成最终答复。
| 工具类型 | 典型例子 | 价值 | 需要加的控制 |
|---|---|---|---|
| 查询工具 | 搜索、数据库、知识库、天气、库存 | 补充实时或私有事实 | 来源记录、过期检测、结果可信度 |
| 计算工具 | Python、SQL、财务计算器、代码执行 | 把数值任务交给确定性程序 | 沙盒、资源限额、输出校验 |
| 动作工具 | 发邮件、下单、创建日程、提交 PR | 把建议变成真实动作 | 权限分级、人类确认、审计日志 |
| 界面工具 | Playwright、Selenium、GUI 操作 | 在没有 API 的网站上完成任务 | 账号风控、截图审计、敏感页面保护 |
| 协议工具 | MCP、A2A、CLI、SDK | 让工具生态可发现、可组合 | 工具注册、版本管理、最小权限 |
MCP 与 A2A 的意义
从模式角度看,MCP 解决的是「Agent 如何标准化接入外部工具和上下文」,A2A 解决的是「Agent 之间如何沟通、委托和协作」。前者像 USB-C,后者像组织内的工作协议。它们共同指向一个趋势:未来 AI 应用不会是单个聊天框,而是一个由模型、工具、数据源、执行器、评估器组成的网络。
五、记忆与知识:没有状态,就没有真正的 Agent
单次对话里,模型只有上下文窗口;长期任务里,Agent 需要显式的状态系统。书中把短期记忆、长期记忆、RAG、学习适应放在一起看,是非常正确的工程视角。
短期记忆
主要是当前上下文窗口、当前 session、临时 scratchpad。它适合保存正在进行的推理链、最近几轮对话、尚未完成的中间结果。
问题:窗口贵、会满、会被无关信息污染,不能承担长期事实存储。
长期记忆
通常放在数据库、向量库、图数据库、文件系统或业务系统里。它保存用户偏好、历史任务、项目知识、企业文档、工具执行记录。
问题:写入什么、何时检索、如何遗忘、如何修正错误记忆,都是产品级难题。
RAG 的本质:让模型先看资料,再回答
RAG 不是简单「向量库 + LLM」。它是一条数据管线:文档切块、向量化、索引、检索、重排、上下文组装、引用追踪、生成和评估。书中提到的嵌入、语义相似、chunking、向量数据库、BM25/混合搜索、HNSW,本质上都在服务一个目标:把最相关、最可信、最适合回答的材料放进模型上下文。
GraphRAG 什么时候值得上
GraphRAG 的价值在于关系:人、组织、概念、事件、项目之间有明确连接时,它能比单纯向量相似更好地回答「谁影响了谁」「A 与 B 的共同路径是什么」「这件事的因果链是什么」。但它的代价也明显:实体抽取、消歧、图谱更新、查询规划都更复杂。我的建议是:知识关系天然重要的领域再上 GraphRAG,例如法律、投研、医药、企业知识图谱、复杂工程系统。
六、多智能体:不是越多越强,而是分工更清楚
多智能体协作章节强调的是专业化:一个 Agent 负责规划,一个负责检索,一个负责写作,一个负责审查,一个负责执行工具。这样系统可扩展、可替换、可并行,也更接近人类团队。但多智能体也会带来协调成本、信息丢失、责任边界模糊。
| 协作形态 | 怎么工作 | 适合场景 | 工程提醒 |
|---|---|---|---|
| 顺序交接 | A 做完交给 B,B 再交给 C | 线性工作流、报告生成、审批链 | 交接对象必须结构化,否则上下文损耗大 |
| 并行处理 | 多个 Agent 同时处理不同子任务 | 调研、多方案评估、批量分析 | 最后需要强聚合器解决冲突 |
| 辩论 / 共识 | 多个 Agent 提出观点并互相质疑 | 复杂决策、风险分析、策略制定 | 别把“说得像”当成“证据充分” |
| 层级管理 | Manager Agent 分配任务,Worker Agent 执行 | 长周期项目、多工具任务 | Manager 需要追踪状态和验收标准 |
| 评论者 / 审稿人 | 生成者产出,评论者挑错 | 代码、文档、合规、安全 | 评论者标准要外显,不能只写“检查一下” |
七、安全、异常、人审、监控:生产 Agent 的底座
书中安全防护和评估监控两章,是从 Demo 走向生产的分水岭。能生成答案只是开始;能被限制、被追踪、被回放、被修复,才是系统。
护栏不是“让 Agent 变笨”,而是让能力可控
安全模式包括输入校验、输出过滤、提示约束、工具权限、外部审核 API、人类干预。对企业来说,最重要的是把风险动作分级:只读查询可以自动执行,写入草稿需要记录,发邮件/转账/删库/公开发布必须人审。
异常处理与恢复
Agent 会遇到网页变动、API 限流、工具失败、检索为空、上下文冲突、计划不可执行。异常恢复模式要求系统不要直接崩掉,而是能重试、降级、换工具、请求澄清、回滚动作或把任务交给人。
评估与监控
评估监控章节的重点是持续测量:准确率、延迟、成本、Token 使用、异常率、工具失败率、漂移、合规风险、RAG 的忠实度和相关性。传统 exact match 对自然语言输出很弱,生产中需要语义相似、LLM-as-judge、人工抽检、回归集和线上指标结合。
| 指标 | 为什么重要 | 建议记录 |
|---|---|---|
| 任务成功率 | 衡量 Agent 是否真的完成目标 | 输入、计划、工具轨迹、最终状态 |
| 事实忠实度 | 防止 RAG 答案脱离来源 | 引用片段、回答句子、证据对应关系 |
| 工具错误率 | 定位 API、权限、参数或环境问题 | 工具名、参数摘要、错误码、重试次数 |
| 人工介入率 | 判断自动化边界是否合理 | 触发原因、审批结果、后续修订 |
| 单位成本 | Agent 系统很容易因链路过长而成本失控 | 模型、Token、工具费用、运行时长 |
八、怎么把这本书用于真实项目
最实用的读法不是按章节背概念,而是按项目成熟度逐步引入模式。下面这条路线适合大多数团队。
四类项目的模式组合
| 项目类型 | 优先模式 | 不要一开始就做 |
|---|---|---|
| 企业知识库问答 | RAG、路由、引用、评估监控、反馈学习 | 复杂多智能体辩论;先把检索质量做好 |
| 研究报告 Agent | 规划、工具使用、并行检索、反思、来源核查 | 让模型无来源生成长报告 |
| 代码 Agent | 工具使用、CLI、测试执行、反思、异常恢复、人审 | 无沙盒地自动改生产代码 |
| 企业流程自动化 | 路由、工具权限、HITL、审计、异常恢复、监控 | 一上来全自动处理高风险动作 |
我会给团队的落地建议
- 先画轨迹,再谈智能:每次模型调用、工具调用、检索结果、人工审批都要能回放。
- 把中间产物结构化:链路里的 JSON/schema 比自然语言交接更可靠。
- 按风险分权限:读、写草稿、外部发送、资金/删除/账号操作必须分级。
- 不要迷信长上下文:长上下文解决不了知识更新、引用、冲突消解和成本问题。
- 评估集要随业务成长:每次线上失败都应该沉淀成回归样例。
九、章节导览:从目录看知识结构
README 中列出的核心章节基本覆盖了 Agent 系统的主干。按学习顺序,我建议这样读:
- 提示链:理解拆任务
- 路由:理解任务分诊
- 并行化:理解吞吐与多视角
- 反思:理解自检与复审
- 工具使用:理解行动能力
- 规划:理解目标到步骤
- 多智能体协作:理解角色分工
- 记忆管理:理解状态
- 学习与适应:理解反馈闭环
- MCP:理解工具协议化
- 目标设定与监控:理解任务控制
- 异常处理与恢复:理解失败路径
- 人机协同:理解人审边界
- 知识检索 RAG:理解外部知识
- A2A:理解 Agent 间通信
- 资源感知优化:理解成本与延迟
- 推理技术:理解模型思考方式
- 安全防护模式:理解约束
- 评估与监控:理解生产质量
- 优先级排序:理解有限资源分配
- 探索与发现:理解开放环境任务
附录则把视野扩展到高级提示、GUI 到真实世界交互、Agent 框架、AgentSpace、CLI Agent、推理引擎内部机制和 Coding Agent。对工程师来说,附录 E 和 G 很值得单独读:它们接近未来 Agent Runtime 的真实形态,即模型通过 CLI、文件系统、浏览器、测试工具和代码仓库完成工作。
十、阅读时要带着的三个保留意见
1. 模式不是框架
模式告诉你什么时候该拆链、调工具、加记忆、做人审,但不会替你解决权限、数据质量、延迟和成本。
2. 翻译仍需校对
项目 README 明确显示待审核,遇到关键术语最好对照英文原文或相关框架文档。
3. Demo 与生产差距巨大
Agent Demo 可以靠 prompt 跑通,生产系统必须靠日志、评估、权限、回滚、监控和人审。
资料来源与阅读范围
本文基于公开仓库和在线材料整理,主要做结构化解读与工程化重组,没有大段复刻原文。
- GitHub 仓库:xindoo/agentic-design-patterns
- 在线阅读站点:adp.xindoo.xyz
- README 原始文件
- 章节目录
- 重点阅读章节:Prompt Chaining、Tool Use、Planning、Multi-Agent Collaboration、Memory Management、Knowledge Retrieval (RAG)、Guardrails/Safety Patterns、Evaluation and Monitoring。