Mystpet's Blog

生成式对话模型(LLM)与智能体(AI Agent) 两者根本分歧在系统边界与执行能力，普通对话模型是一个“开环”的信息生成系统，而 AI Agent 是一个具备“感知-决策-执行”能力的“闭环”自动化系统。

大模型

基于自然语言处理和预训练参数，接收用户的Prompt，进行逻辑推理和语义预测，最终输出纯文本或静态多媒体内容。

局限：

要完成复杂的自主任务，一个完整的 AI Agent 通常由四个核心部分组成：

大脑： 通常是由强大的大语言模型充当。它负责理解你的意图、进行逻辑推理、常识判断和下达指令。
记忆：
- 短期记忆： 记住你们当下正在进行的对话上下文。
- 长期记忆： 记住你的历史习惯和个人偏好，随着时间推移，它会越来越懂你。
规划与反思： 当你给出一个宏大的目标（比如“帮我写一份竞品分析报告”），它能自主将任务拆解：第一步上网搜集数据 $\rightarrow$ 第二步清洗数据 $\rightarrow$ 第三步生成图表 $\rightarrow$ 第四步排版成文。如果在执行中遇到了网页打不开报错，它还能自我反思，换一个思路重新执行。
工具箱： 这是它能真正干活的关键。它可以联网搜索、执行 Python 代码、读写本地文件、调用各种软件的 API，甚至操控物理世界的物联网设备或机械臂。