主题
02-01 · 什么是 Agent
我们公司的所有产品形态,最终都要落到 "Agent" 这个执行单元上。这一节我们解决两件事:把 Agent 这个词讲清楚,以及 指给你一条系统学习路径(Hello-Agents)。
一、最朴素的定义
Agent ≈ 一个能"感知-思考-行动-反思"循环跑下去的 LLM 程序。
它和"普通 LLM 调用"的区别:
| 维度 | 普通 LLM 调用 | Agent |
|---|---|---|
| 单次/多步 | 单次输入输出 | 多步循环 |
| 工具使用 | 不用工具 | 能主动调用工具 |
| 状态 | 无状态 | 有短期/长期记忆 |
| 自主性 | 被动响应 | 主动规划、主动重试 |
| 失败处理 | 报错就完 | 自己反思、换方法 |
最经典的循环:
┌─────────────┐
│ 感知 Sense │ ← 读环境、读用户输入
└──────┬──────┘
↓
┌─────────────┐
│ 思考 Think │ ← 大模型推理:要做什么、用什么工具
└──────┬──────┘
↓
┌─────────────┐
│ 行动 Act │ ← 调工具、改文件、发 HTTP 请求
└──────┬──────┘
↓
┌─────────────┐
│ 反思 Reflect│ ← 看结果是否符合预期,决定下一步
└──────┬──────┘
↓
(回到感知)二、当下 Agent 的两大流派(重要)
| 流派 | 代表产品 | 本质 |
|---|---|---|
| 软件工程类 Agent | Dify、Coze、n8n | 流程图驱动,LLM 只是流程里的某个节点。可视化、好上手、上限低。 |
| AI 原生 Agent(Hello-Agents 流派) | Claude Code、Cursor Agent、AutoGen | LLM 是大脑,自主决策每一步。代码驱动、上限高、调试更难。 |
公司立场:我们以 AI 原生 Agent 为主。理由:
- 企业内部的"流程"我们已经用 n8n / Dify 跑了多年,但天花板很快到。
- 真正的杠杆来自"让 AI 自己想怎么干"。
- 这也是为什么我们要求每位未来股东都深入学 Hello-Agents,而不是只学 Dify。
三、必修课:Hello-Agents
3.1 课程地址
- 官网:https://hello-agents.datawhale.cc/
- GitHub:https://github.com/datawhalechina/hello-agents
- 作者:Datawhale 开源社区
3.2 它讲什么
| 模块 | 核心内容 |
|---|---|
| 第一篇 · 心法 | 从 LLM → Agent 的演进、范式分类 |
| 第二篇 · 经典范式 | ReAct、Plan-and-Execute、Reflexion、Tree-of-Thought |
| 第三篇 · 框架与协议 | LangGraph、AutoGen、CrewAI、MCP、A2A |
| 第四篇 · 实战 | 多 Agent 协作、企业 Agent、自我进化 Agent |
3.3 我们的学法(公司方法论)
不要从头读到尾。 这本书的设计是教科书式的,全读会消耗你 2 周。我们的实操路径:
- 先读"心法"前 3 章(30 分钟):理解什么是 Agent、什么是 Tool Use、什么是 Memory。
- 跳到 ReAct 章节(30 分钟):这是现代 Agent 的基石范式,必读。
- 跑通第四篇里的一个实战(2 小时):选一个最贴近你方向的,跟着代码 step by step。
- 回头按需查 LangGraph / AutoGen / CrewAI 章节:等你真要选框架时再读。
心法是不会过时的,框架是会过时的。先吃心法,框架按需查阅。
四、读完 Hello-Agents 你必须能回答的 5 个问题
请在你的 Obsidian 笔记里,亲手写答案(不是复制粘贴):
- ReAct 范式里的 Reasoning 和 Action 是怎么交替的?
- 一个 Agent 的"记忆"包含哪几层?短期、长期、外部,分别怎么实现?
- 给你一个"客服自动回复"需求,你会用 Workflow 流派还是 AI 原生流派?为什么?
- 多 Agent 协作时,用 Manager-Worker 还是 Peer-to-Peer?什么场景用哪个?
- Agent 调用工具失败时,可以有几种重试 / 反思策略?
五、公司常用 Agent 设计模式
我们日常项目里最常用的模式:
5.1 Single-Agent + Skills(最简单,80% 场景适用)
用户 → Agent(带一组 Skills)→ 结果5.2 Manager-Worker 多 Agent(中等复杂度)
用户 → Manager Agent
├→ Researcher Agent
├→ Coder Agent
└→ Reviewer Agent
↓
汇总结果5.3 Pipeline 多 Agent(无人监管流水线)
信号源 → Stage1 Agent → Stage2 Agent → ... → 交付
↓ ↓
失败重试 失败重试第三种是我们的终极形态。详见 06-Agent产品体系/01-无人监管流水体系.md。
六、参考资料
- 📚 Hello-Agents 在线版
- 📚 Hello-Agents GitHub
- 📚 ReAct 论文(Yao et al., 2022)
- 📚 Anthropic - Building effective agents