规划(Planning)| Agentic Design Patterns | 智能体设计模式

内容纲要

一、核心定义

规划(Planning):智能体将复杂的高层目标拆解为多个可执行的具体步骤,并按逻辑顺序执行这些步骤以实现目标的能力。规划使智能体从被动响应转变为主动战略执行者。

可视化示意图

Google Deep Research 规划

图 1:Google 深入研究智能体使用 Google 搜索引擎作为工具,生成详细的执行计划

Deep Research 执行

图 2:深入研究计划执行示例

规划设计模式

图 4:规划设计模式

关键机制

1. 理解初始状态 → 明确当前情况和约束
2. 定义目标状态 → 明确要达成的结果
3. 制定计划 → 拆解为多个步骤
4. 执行步骤 → 按顺序完成各个子任务
5. 动态调整 → 遇到障碍时重新规划

规划 vs 简单执行

  • 简单执行:你告诉智能体「做什么」和「怎么做」
  • 规划:你只告诉「做什么」,智能体自己决定「怎么做」

二、为什么需要规划?

无规划的问题 规划模式的优势
无法处理多步骤复杂任务 拆解为可管理的小步骤
遇到障碍就失败 动态调整,找替代方案
只能被动响应 主动制定策略
难以管理依赖关系 按逻辑顺序处理依赖

核心思想:先思考再行动,把「做什么」转化为「怎么做」。

关键权衡:灵活性 vs 可预测性

  • 当解决方法已知且可重复 → 用固定流程更好
  • 当需要探索「如何做」→ 用规划模式

三、典型应用场景

1. 流程自动化

目标: 新员工入职
计划: 创建账户 → 分配培训 → 协调各部门 → 发放设备 → 完成入职

价值:自动化复杂业务流程。

2. 研究报告生成

目标: 撰写竞品分析报告
计划: 信息收集 → 数据归纳 → 结构化内容 → 迭代打磨 → 最终报告

价值:系统化信息整合。

3. 机器人导航

目标: 从 A 点到 B 点
计划: 路径规划 → 避障 → 优化时间/能耗 → 到达目标

价值:状态空间遍历优化。

4. 客户支持

目标: 解决客户问题
计划: 诊断 → 查找解决方案 → 实施 → 验证 → 必要时升级

价值:多步骤问题解决。

5. 深度研究(核心案例)

目标: 研究复杂主题
计划: 拆解子问题 → 搜索来源 → 评估相关性 → 发现知识盲点 → 后续搜索 → 整合报告

典型系统:Google DeepResearch, OpenAI Deep Research, Perplexity Deep Research。
价值:自动化原本需要数小时的人工研究。


四、深度研究系统对比

系统 核心能力 特色功能 适用场景
Google DeepResearch 迭代搜索+整合 异步长时运行,可审阅计划 大规模网络研究
OpenAI Deep Research API 编程接口控制 透明中间步骤,MCP扩展 企业集成,私有数据
Perplexity Deep Research 实时交互式研究 快速响应,对话式 快速查询和验证

Google DeepResearch 特点

工作流程

  1. 拆解用户提示为研究计划
  2. 用户审阅并修改计划
  3. 迭代搜索与分析循环
  4. 动态调整查询,发现知识盲点
  5. 整合为结构化多页报告
  6. 包含引用、图表、音频概述

关键优势

  • 处理数百个来源
  • 异步执行,抗单点故障
  • 整合私有文档
  • 完整引用来源,透明可验证

OpenAI Deep Research API 特点

核心价值

response = client.responses.create(
    model="o3-deep-research-2025-06-26",
    input=[system_message, user_query],
    tools=[{"type": "web_search_preview"}]
)

独特功能

  • 暴露所有中间步骤(推理、搜索、代码)
  • 支持 MCP 连接私有知识库
  • 内联引用与元数据
  • 编程控制整个流程

五、设计原则

何时使用规划?

黄金法则:当任务复杂到无法由单一动作完成,且「如何做」需要探索时。

适用信号

  1. 任务需要多个相互依赖的步骤
  2. 需要协调多个工具或系统
  3. 可能遇到障碍需要调整策略
  4. 最终结果需要综合多个中间成果

不适用场景

  • 解决方法已知且可重复
  • 追求确定性和可预测性
  • 简单的单步骤任务

实现要点

  1. 清晰的目标定义:明确初始状态和目标状态
  2. 步骤拆解能力:LLM 擅长生成合理的计划
  3. 动态调整机制:能根据执行结果修改计划
  4. 依赖关系管理:按逻辑顺序执行

六、主流框架对比

框架 规划实现方式 特色 适用场景
CrewAI Agent 生成计划并执行 高层抽象,简单易用 快速原型,内容生成
LangGraph 显式定义规划节点 图结构,可视化 复杂多步骤工作流
Google ADK 结合工具的多步骤执行 与 Google 生态集成 企业级应用

代码示例位置

  • CrewAI 实现:<code>codes/Chapter-06-Planning-CrewAI-Example.py</code>
  • OpenAI API:<code>codes/Chapter-06-Planning-Deep-Research-API-Example.py</code>

七、关键概念速查

概念 定义
规划 (Planning) 将目标拆解为步骤序列的能力
初始状态 (Initial State) 任务开始时的情况
目标状态 (Goal State) 要达成的结果
动态调整 (Adaptation) 根据新信息修改计划
深度研究 (Deep Research) 自动化复杂研究任务的系统
迭代规划 (Iterative Planning) 边执行边调整的规划方式
MCP (Model Context Protocol) 连接私有数据源的协议(第10章)

八、常见问题

Q1:规划会增加多少延迟?
会增加。需要先生成计划,再执行。但对复杂任务而言,有计划的执行通常比盲目尝试更高效。

Q2:如何确保计划质量?

1) 清晰的目标描述;2) 让用户审阅计划再执行(如 Google DeepResearch);3) 执行中验证每步结果。

Q3:计划失败怎么办?
设计重新规划机制。当某步失败时,智能体应能识别问题并生成替代计划。

Q4:规划适合实时场景吗?
不太适合。规划需要时间,更适合异步或批处理场景。实时场景用预定义流程更好。

Q5:如何避免过度规划?
设置最大步骤数限制,或在提示词中要求"简洁高效的计划"。

Q6:深度研究系统选哪个?

  • Google DeepResearch: 大规模网络研究,用户友好
  • OpenAI API: 需要编程控制,企业集成
  • Perplexity: 快速交互式查询

九、参考资源

官方文档

代码示例

  • CrewAI 实现:<code>codes/Chapter-06-Planning-CrewAI-Example.py</code>
  • OpenAI API:<code>codes/Chapter-06-Planning-Deep-Research-API-Example.py</code>

扩展阅读

  • 原文章节:<code>12-Chapter-06-Planning.md</code>

滚动至顶部