一、核心定义
规划(Planning):智能体将复杂的高层目标拆解为多个可执行的具体步骤,并按逻辑顺序执行这些步骤以实现目标的能力。规划使智能体从被动响应转变为主动战略执行者。
可视化示意图:

图 1:Google 深入研究智能体使用 Google 搜索引擎作为工具,生成详细的执行计划

图 2:深入研究计划执行示例
图 4:规划设计模式
关键机制:
1. 理解初始状态 → 明确当前情况和约束
2. 定义目标状态 → 明确要达成的结果
3. 制定计划 → 拆解为多个步骤
4. 执行步骤 → 按顺序完成各个子任务
5. 动态调整 → 遇到障碍时重新规划
规划 vs 简单执行:
- 简单执行:你告诉智能体「做什么」和「怎么做」
- 规划:你只告诉「做什么」,智能体自己决定「怎么做」
二、为什么需要规划?
| 无规划的问题 | 规划模式的优势 |
|---|---|
| 无法处理多步骤复杂任务 | 拆解为可管理的小步骤 |
| 遇到障碍就失败 | 动态调整,找替代方案 |
| 只能被动响应 | 主动制定策略 |
| 难以管理依赖关系 | 按逻辑顺序处理依赖 |
核心思想:先思考再行动,把「做什么」转化为「怎么做」。
关键权衡:灵活性 vs 可预测性
- 当解决方法已知且可重复 → 用固定流程更好
- 当需要探索「如何做」→ 用规划模式
三、典型应用场景
1. 流程自动化
目标: 新员工入职
计划: 创建账户 → 分配培训 → 协调各部门 → 发放设备 → 完成入职
价值:自动化复杂业务流程。
2. 研究报告生成
目标: 撰写竞品分析报告
计划: 信息收集 → 数据归纳 → 结构化内容 → 迭代打磨 → 最终报告
价值:系统化信息整合。
3. 机器人导航
目标: 从 A 点到 B 点
计划: 路径规划 → 避障 → 优化时间/能耗 → 到达目标
价值:状态空间遍历优化。
4. 客户支持
目标: 解决客户问题
计划: 诊断 → 查找解决方案 → 实施 → 验证 → 必要时升级
价值:多步骤问题解决。
5. 深度研究(核心案例)
目标: 研究复杂主题
计划: 拆解子问题 → 搜索来源 → 评估相关性 → 发现知识盲点 → 后续搜索 → 整合报告
典型系统:Google DeepResearch, OpenAI Deep Research, Perplexity Deep Research。
价值:自动化原本需要数小时的人工研究。
四、深度研究系统对比
| 系统 | 核心能力 | 特色功能 | 适用场景 |
|---|---|---|---|
| Google DeepResearch | 迭代搜索+整合 | 异步长时运行,可审阅计划 | 大规模网络研究 |
| OpenAI Deep Research API | 编程接口控制 | 透明中间步骤,MCP扩展 | 企业集成,私有数据 |
| Perplexity Deep Research | 实时交互式研究 | 快速响应,对话式 | 快速查询和验证 |
Google DeepResearch 特点
工作流程:
- 拆解用户提示为研究计划
- 用户审阅并修改计划
- 迭代搜索与分析循环
- 动态调整查询,发现知识盲点
- 整合为结构化多页报告
- 包含引用、图表、音频概述
关键优势:
- 处理数百个来源
- 异步执行,抗单点故障
- 整合私有文档
- 完整引用来源,透明可验证
OpenAI Deep Research API 特点
核心价值:
response = client.responses.create(
model="o3-deep-research-2025-06-26",
input=[system_message, user_query],
tools=[{"type": "web_search_preview"}]
)
独特功能:
- 暴露所有中间步骤(推理、搜索、代码)
- 支持 MCP 连接私有知识库
- 内联引用与元数据
- 编程控制整个流程
五、设计原则
何时使用规划?
黄金法则:当任务复杂到无法由单一动作完成,且「如何做」需要探索时。
适用信号:
- 任务需要多个相互依赖的步骤
- 需要协调多个工具或系统
- 可能遇到障碍需要调整策略
- 最终结果需要综合多个中间成果
不适用场景:
- 解决方法已知且可重复
- 追求确定性和可预测性
- 简单的单步骤任务
实现要点
- 清晰的目标定义:明确初始状态和目标状态
- 步骤拆解能力:LLM 擅长生成合理的计划
- 动态调整机制:能根据执行结果修改计划
- 依赖关系管理:按逻辑顺序执行
六、主流框架对比
| 框架 | 规划实现方式 | 特色 | 适用场景 |
|---|---|---|---|
| CrewAI | Agent 生成计划并执行 | 高层抽象,简单易用 | 快速原型,内容生成 |
| LangGraph | 显式定义规划节点 | 图结构,可视化 | 复杂多步骤工作流 |
| Google ADK | 结合工具的多步骤执行 | 与 Google 生态集成 | 企业级应用 |
代码示例位置:
- CrewAI 实现:<code>codes/Chapter-06-Planning-CrewAI-Example.py</code>
- OpenAI API:<code>codes/Chapter-06-Planning-Deep-Research-API-Example.py</code>
七、关键概念速查
| 概念 | 定义 |
|---|---|
| 规划 (Planning) | 将目标拆解为步骤序列的能力 |
| 初始状态 (Initial State) | 任务开始时的情况 |
| 目标状态 (Goal State) | 要达成的结果 |
| 动态调整 (Adaptation) | 根据新信息修改计划 |
| 深度研究 (Deep Research) | 自动化复杂研究任务的系统 |
| 迭代规划 (Iterative Planning) | 边执行边调整的规划方式 |
| MCP (Model Context Protocol) | 连接私有数据源的协议(第10章) |
八、常见问题
Q1:规划会增加多少延迟?
会增加。需要先生成计划,再执行。但对复杂任务而言,有计划的执行通常比盲目尝试更高效。
Q2:如何确保计划质量?
1) 清晰的目标描述;2) 让用户审阅计划再执行(如 Google DeepResearch);3) 执行中验证每步结果。
Q3:计划失败怎么办?
设计重新规划机制。当某步失败时,智能体应能识别问题并生成替代计划。
Q4:规划适合实时场景吗?
不太适合。规划需要时间,更适合异步或批处理场景。实时场景用预定义流程更好。
Q5:如何避免过度规划?
设置最大步骤数限制,或在提示词中要求"简洁高效的计划"。
Q6:深度研究系统选哪个?
- Google DeepResearch: 大规模网络研究,用户友好
- OpenAI API: 需要编程控制,企业集成
- Perplexity: 快速交互式查询
九、参考资源
官方文档
代码示例
- CrewAI 实现:<code>codes/Chapter-06-Planning-CrewAI-Example.py</code>
- OpenAI API:<code>codes/Chapter-06-Planning-Deep-Research-API-Example.py</code>
扩展阅读
- 原文章节:<code>12-Chapter-06-Planning.md</code>