AI | KurongBlog

当前大模型智能体（LLM-based Agents）设计中最为核心的三种认知范式。 ReAct (Reasoning + Acting) Plan-and-Solve (P&S) Self-Reflection (Reflexion) 1. ReAct (Reasoning + Acting) 核心概念 ReAct 由 Google 和普林斯顿大学提出。其核心思想是让大模型交替进行推理（Thought）**和**行动（Action）。 Thought: 帮助模型明确当前目标、分析环境、追踪状态。 Action: 允许模型通过工具（如搜索引擎、计算器）与外部环境交互。 Observation: 观察行动的结果并将其反馈给模型。流程细节接收任务: 输入用户指令。推理循环: 模型生成 Thought：分析当前进度，决定下一步做什么。模型生成 Action：指定调用的工具和参数。环境执行 Action 并返回 Observation。将 Thought, Action, Observation 全部加入上下文，循环直到任务完成。输出: 最终生成 Final Answer。伪代码实现 (Python) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 import logging from typing import List, Dict, Any # Configure logging logging....