Agent的ReAct框架原理

Paper	https://arxiv.org/pdf/2210.03629.pdf
Code	https://github.com/ysymyth/ReAct https://react-lm.github.io/

注解

CoT & ToT

CoT = Chain of Thought 思维链、推理链 
指让大模型逐步展示中间推理过程，通过“分步骤思考”来提高复杂推理任务的正确率。
特点：单链。线性推理、依赖“逐步思考”

ToT = Tree of Thoughts 思维树（树状思维）
它是对 CoT 的扩展，把推理过程从单一链路升级为树状结构探索，可以同时评估多个思路分支，选择最优路径，适合更复杂、可回溯的推理任务。
特点：树状。多分支探索、评估多种可能路径，适合复杂规划

正文

一、答题思路

1765167327158

核心要点拆解：

ReAct框架的定义与核心机制
◦ 分层解析ReAct的“思考-行动-观察”循环逻辑
◦ 对比传统Agent框架（如CoT、ToT）的差异性
真实项目案例选取
◦ 选取文档中第6章《Agent3:推理与行动的协同——通过LangChain中的ReAct框架实现自动定价》的鲜
花定价Agent
◦ 场景贴合电商业务需求，痛点具有典型性
结构化答题框架设计

1765167641545

结合案例

1765167707855

案例背景：生鲜电商动态定价场景

项目名称：花语秘境鲜花智能定价系统
技术选型：LangChain + ReAct框架 + 天气API + 库存管理系统业务目标：实现鲜花价格的动态调整，平衡供需关系，最大化利润

场景痛点分析

数据实时性挑战
◦ 天气突变（如暴雨、高温）直接影响花卉损耗率
◦ 供应链延迟导致库存数据更新滞后
定价策略复杂性
◦ 需综合考虑成本价、市场均价、竞品价格、节日效应等20+维度
◦ 传统规则引擎无法应对动态组合条件
多工具协同需求

◦ 需调用天气API、库存数据库、竞品爬虫等异构数据源
◦ 工具执行结果需交叉验证（如验证库存数据与供应商预报一致性）

三、参考回答

1765167985949

ReAct框架在鲜花定价Agent中的实现

问题分解（Reasoning Phase）

1   # LangChain中定义的ReAct提示模板
2   prompt = """
3   你现在需要为花语秘境的鲜花定价。已知当前时间为{current_time}，天气情况为{weather}，库存剩余{inventory}。
4   1. 分析当前市场供需关系
5   2. 检查天气是否会影响鲜花损耗
6   3. 对比竞品价格
7   4. 计算成本价与目标利润率
8   5. 综合所有因素生成定价建议
9   """

2.工具选择与执行

1   # 工具调用链定义
2   tools = [
3       Tool(
4           name="WeatherAPI",
5           func=get_weather_data,
6           description="获取实时天气数据"
7       ),
8       Tool(
9           name="InventorySystem",
10          func=query_inventory,
11          description="查询鲜花库存状态"
12      ),
13      Tool(
14          name="CompetitorScraper",
15          func=scrape_competitor_prices,
16          description="爬取竞品平台价格"
17      )
18  ]
19
20  # ReAct Agent执行流程
21  agent = create_react_agent(llm, tools, prompt)
22  response = agent.invoke({"current_time": "2025-07-11 14:00", "weather": "晴", "inventory": .....})

ps:
描述函数功能：
为了向模型描述外部函数库，需要向tools字段传入可以调用的函数列表，参数如下：
参数名称	  类型	是否必填		参数说明
type		String		是		设置为function类型
function	Object		是		
name		String		是		函数名称
description	String		是		用于描述函数功能，模型会根据这段描述决定函数调用方式
parameters	Object		是		parameter字段需要传入一个json schema对象，以准确的定义函数所接受的参数，若调用函数时不需要参数参数，省略该参数即可。
required				否		指定哪些属性在数据中必须被包含

最重要的就是name、description、parameters

观察与反思（Observation Phase）

1   # 观察工具执行结果
2   observations = {
3       "weather": {"temperature": 35, "humidity": 40},
4       "inventory": {"rose": 200, "tulip": 300},
5       "competitor_prices": {"rose": 58, "tulip": 35}
6   }
7
8   # 基于观察结果生成最终定价
9   final_price = agent.reflect(observations)

技术实现关键点

动态工具选择机制
◦ 通过LangChain的 Toolbox 实现工具权重动态调整
◦ 示例：高温天气下提高WeatherAPI调用优先级
多轮推理优化

1
2
3

1   # 观察到库存低于阈值时触发补货流程
2   if observations["inventory"]["rose"] < 100:
3       agent.invoke({"action": "initiate_replenishment"})

抗幻觉机制设计
◦ 引入历史数据验证（如对比去年同期同期价格波动）
◦ 设定价格上下限阈值（如玫瑰单价不低于成本价的150%）

四、总结收尾

1765171088137

ReAct框架的核心价值

复杂任务拆解能力：将动态定价这一复杂问题分解为可执行的原子操作
实时环境交互：通过工具调用实现与外部系统的动态数据交换
自我修正机制：通过观察结果反馈优化后续推理链条

项目实施效果

• 定价响应时间从人工的30分钟缩短至8秒
• 节假日利润率提升23%，库存周转率提高40%
• 实现全自动化定价，人力成本降低75%

技术演进方向

多模态ReAct：整合图像识别（如鲜花新鲜度检测）
联邦学习：在不共享数据前提下实现跨平台定价策略协同
因果推理增强：引入DoWhy框架进行价格变动归因分析

通过本案例可以看出，ReAct框架为Agent提供了结构化的复杂问题解决范式，是通往通用人工智能的重要技术路径。开发者需重点掌握Prompt工程、工具生态构建和系统调试三大核心能力。