第零章 · AI Agent 技术全景图谱

目标：建立 AI Agent 全景视角，理解其演进、分支、架构、选型。 覆盖范围：80%+ 关键技术 | 更新时间：2026-05-12

0.1 AI Agent 技术演进时间线

2016       2020               2022                    2023                    2024                    2025-2026
  |          |                  |                       |                       |                       |
对话系统    任务型 Agent    ChatGPT 催化           Agent 框架爆发期         多Agent/MCP 时代      AI Agent 元年
（ELIZA）   简单规则引擎    大模型能力觉醒          LangChain/CrewAI        端到端 Agent           Agent 自主进化
           ↕              ↕                        ↕                       ↕                       ↕
Rasa/Dialogflow → Watson → GPT-3.5 触发 → 200+ 框架 → OpenAI Agents SDK → LLM-as-Agent
              搜索增强  → ChatGPT plugin       AutoGPT/BabyAGI       MCP 协议标准化       模型即 Agent
                           LangChain v0.1       CrewAI/Multi-Agent     GPT-4o Function Call   自进化 Agent

各阶段详解

| 阶段 | 时间 | 核心特征 | 代表技术/项目 | |------|------|----------|--|----| | 对话系统期 | 2016-2019 | 规则驱动 + 有限状态机 | Rasa, Dialogflow, Watson | | 搜索增强期 | 2020-2021 | RAG 雏形 + 检索增强 | RetrievalQA, LangChain v0.1 | | Agent 萌芽期 | 2022-2023 | ChatGPT + GPT-4 触发 | GPT-3.5 触发, ChatGPT Plugins | | 框架爆发期 | 2023-2024 | LangChain/CrewAI/AutoGPT | 200+ 框架, AutoGPT, BabyAGI | | 多Agent协作 | 2024-2025 | MCP 协议, 多代理编排 | MCP, OpenAI Agents SDK, CrewAI | | 自主 Agent | 2025+ | LLM-as-Agent, 端到端 | GPT-4o FC, Claude Opus, 自进化 |

0.2 AI Agent 技术分支知识图谱

0.3 技术选型指南

按场景选择

| 场景 | 推荐方案 | 备选 | 理由 | |------|------|------|--|-| | 快速原型 | OpenAI Agents SDK | LangChain | 最小代码, 官方支持 | | 复杂工作流 | LangGraph | CrewAI | 有向图编排, 状态管理 | | 多Agent协作 | CrewAI / AutoGen | MetaGPT | 角色分工, 团队协作 | | 企业级生产 | 自研 + MCP | DSPy | 可控性强, 安全对齐 | | 检索增强 | LlamaIndex | LangChain | 检索优先架构 | | Agent 编排 | OpenAI Agents SDK | LangGraph | Agent 编排标准化 |

按 LLM 模型选择

模型	Agent 优势	推荐场景
GPT-4o	Function Calling 最成熟	通用Agent, 多模态
Claude Opus	超长上下文, 推理强	复杂推理, 长文档处理
Claude Sonnet	成本效益比好	生产环境主力
Gemini 2.0	多模态原生	图文混合任务
DeepSeek/R1	开源, 推理能力	自部署, 成本敏感

0.4 核心术语表

术语	英文	定义
Agent	Agent	能感知环境、自主决策并执行行动的 AI 系统
Function Calling	函数调用	LLM 返回结构化参数以调用外部函数
ReAct	ReAct	Reasoning + Acting 交替推理与执行模式
Tool Use	工具使用	Agent 通过 API/代码/脚本执行任务
Memory	记忆	Agent 的状态管理（短期/长期/工作记忆）
Planning	规划	将复杂任务拆解为可执行步骤
Multi-Agent	多智能体	多个 Agent 协作完成任务
MCP	Model Context Protocol	Anthropic 提出的 Agent 与工具连接协议
Reflection	反思	Agent 对自己的输出进行自我评估和改进
Agent-as-a-Service	Agent 即服务	Agent 以 API 形式提供服务
HITL	Human-in-the-Loop	人在回路：人工干预 Agent 决策
AGI	Artificial General Intelligence	通用人工智能

0.5 行业生态

主流厂商/组织

组织	定位	代表产品
OpenAI	Agent SDK + GPT	Agents SDK, GPT-4o
Anthropic	MCP + Claude	MCP 协议, Claude
LangChain	Agent 框架	LangChain, LangGraph
LlamaIndex	检索优先	LlamaIndex
Google	Agent 生态	Gemini + Vertex AI
Meta	开源	Llama + Pydantic AI
Microsoft	企业Agent	AutoGen, Copilot Studio
Databricks	Agent 数据	Agent Builder

社区资源

0.6 四大核心设计模式

2025-2026 年生产级 Agent 系统的四大核心技术：

模式	核心能力	关键技术
反思 (Reflection)	自我评估 + 迭代改进	Reflexion, Self-RAG, 自我批评
工具 (Tool Use)	感知 + 执行外部动作	Function Calling, MCP, API 集成
规划 (Planning)	任务拆解 + 动态调整	ReAct, ToT, Agent-X 按需规划
多代理 (Multi-Agent)	角色分工 + 协同决策	Swarm, CrewAI, AutoGen, MCP

📅 最后更新：2026-05-12

05_折叠屏

第零章 · AI Agent 技术全景图谱 ​

0.1 AI Agent 技术演进时间线 ​

各阶段详解 ​

0.2 AI Agent 技术分支知识图谱 ​

0.3 技术选型指南 ​

按场景选择 ​

按 LLM 模型选择 ​

0.4 核心术语表 ​

0.5 行业生态 ​

主流厂商/组织 ​

社区资源 ​

0.6 四大核心设计模式 ​