什么是 Agent?
如果说 ChatGPT 是"听话的员工",Agent 就是"能自己规划任务的员工"。区别:
- ChatGPT:你问一次,它答一次
- Agent:你给一个目标,它自己拆任务、调工具、跑循环,直到完成
Agent 的 4 个关键能力
- 规划(Planning):把大目标拆成小任务
- 工具(Tools):调用搜索、代码执行、浏览器、数据库
- 记忆(Memory):记住上下文和历史
- 反思(Reflection):检查结果,不行就重来
3 种主流模式
模式 1:ReAct (Reason + Act)
最经典的模式:思考 → 行动 → 观察 → 继续思考。
Thought: 用户想查天气,我需要调用天气 API
Action: get_weather(city="北京")
Observation: 北京今天 25°C 晴
Thought: 我已经拿到答案,可以回复
模式 2:Plan-and-Execute
先完整规划整个任务链,再依次执行。适合复杂多步任务。
模式 3:Multi-Agent
多个 Agent 分工协作,比如:
- Researcher:负责搜索资料
- Writer:负责写作
- Reviewer:负责审核
- Manager:负责调度
实战框架推荐
| 框架 | 适合 | 特点 |
|---|---|---|
| LangChain | Python 开发者 | 生态全,学习曲线陡 |
| LangGraph | 复杂多 Agent | 状态机驱动,可控性强 |
| AutoGen | 微软出品 | Multi-agent 对话 |
| CrewAI | 简单上手 | 类人协作模式 |
| Dify | 无代码 | 拖拽搭建 |
真实案例:一个简单的研究员 Agent
目标:给我 AI 医疗领域 2025 年的 5 家值得关注的创业公司
Agent 执行:
1. 搜索"AI healthcare startup 2025"
2. 从返回结果里筛选估值 > 1 亿的
3. 对每家公司再单独搜深度报道
4. 总结:公司名 / 产品 / 融资 / 创始人 / 亮点
5. 输出 Markdown 表格
注意事项
- 成本:Agent 会跑循环,一次任务可能消耗 10-100 次 API 调用
- 失控:给足够的终止条件(最大步数、超时、人工确认)
- 不可靠:生产环境必须加人工审核关键动作