Agent三大经典范式学习

当前大模型智能体(LLM-based Agents)设计中最为核心的三种认知范式。 ReAct (Reasoning + Acting) Plan-and-Solve (P&S) Self-Reflection (Reflexion) 1. ReAct (Reasoning + Acting) 核心概念 ReAct 由 Google 和普林斯顿大学提出。其核心思想是让大模型交替进行推理(Thought)**和**行动(Action)。 Thought: 帮助模型明确当前目标、分析环境、追踪状态。 Action: 允许模型通过工具(如搜索引擎、计算器)与外部环境交互。 Observation: 观察行动的结果并将其反馈给模型。 流程细节 接收任务: 输入用户指令。 推理循环: 模型生成 Thought:分析当前进度,决定下一步做什么。 模型生成 Action:指定调用的工具和参数。 环境执行 Action 并返回 Observation。 将 Thought, Action, Observation 全部加入上下文,循环直到任务完成。 输出: 最终生成 Final Answer。 伪代码实现 (Python) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 import logging from typing import List, Dict, Any # Configure logging logging....

February 27, 2026 · 758 words · Kurong