Skip to content

第零章 · AI Agent 技术全景图谱

目标:建立 AI Agent 全景视角,理解其演进、分支、架构、选型。 覆盖范围:80%+ 关键技术 | 更新时间:2026-05-12


0.1 AI Agent 技术演进时间线

2016       2020               2022                    2023                    2024                    2025-2026
  |          |                  |                       |                       |                       |
对话系统    任务型 Agent    ChatGPT 催化           Agent 框架爆发期         多Agent/MCP 时代      AI Agent 元年
(ELIZA)   简单规则引擎    大模型能力觉醒          LangChain/CrewAI        端到端 Agent           Agent 自主进化
           ↕              ↕                        ↕                       ↕                       ↕
Rasa/Dialogflow → Watson → GPT-3.5 触发 → 200+ 框架 → OpenAI Agents SDK → LLM-as-Agent
              搜索增强  → ChatGPT plugin       AutoGPT/BabyAGI       MCP 协议标准化       模型即 Agent
                           LangChain v0.1       CrewAI/Multi-Agent     GPT-4o Function Call   自进化 Agent

各阶段详解

| 阶段 | 时间 | 核心特征 | 代表技术/项目 | |------|------|----------|--|----| | 对话系统期 | 2016-2019 | 规则驱动 + 有限状态机 | Rasa, Dialogflow, Watson | | 搜索增强期 | 2020-2021 | RAG 雏形 + 检索增强 | RetrievalQA, LangChain v0.1 | | Agent 萌芽期 | 2022-2023 | ChatGPT + GPT-4 触发 | GPT-3.5 触发, ChatGPT Plugins | | 框架爆发期 | 2023-2024 | LangChain/CrewAI/AutoGPT | 200+ 框架, AutoGPT, BabyAGI | | 多Agent协作 | 2024-2025 | MCP 协议, 多代理编排 | MCP, OpenAI Agents SDK, CrewAI | | 自主 Agent | 2025+ | LLM-as-Agent, 端到端 | GPT-4o FC, Claude Opus, 自进化 |


0.2 AI Agent 技术分支知识图谱


0.3 技术选型指南

按场景选择

| 场景 | 推荐方案 | 备选 | 理由 | |------|------|------|--|-| | 快速原型 | OpenAI Agents SDK | LangChain | 最小代码, 官方支持 | | 复杂工作流 | LangGraph | CrewAI | 有向图编排, 状态管理 | | 多Agent协作 | CrewAI / AutoGen | MetaGPT | 角色分工, 团队协作 | | 企业级生产 | 自研 + MCP | DSPy | 可控性强, 安全对齐 | | 检索增强 | LlamaIndex | LangChain | 检索优先架构 | | Agent 编排 | OpenAI Agents SDK | LangGraph | Agent 编排标准化 |

按 LLM 模型选择

模型Agent 优势推荐场景
GPT-4oFunction Calling 最成熟通用Agent, 多模态
Claude Opus超长上下文, 推理强复杂推理, 长文档处理
Claude Sonnet成本效益比好生产环境主力
Gemini 2.0多模态原生图文混合任务
DeepSeek/R1开源, 推理能力自部署, 成本敏感

0.4 核心术语表

术语英文定义
AgentAgent能感知环境、自主决策并执行行动的 AI 系统
Function Calling函数调用LLM 返回结构化参数以调用外部函数
ReActReActReasoning + Acting 交替推理与执行模式
Tool Use工具使用Agent 通过 API/代码/脚本执行任务
Memory记忆Agent 的状态管理(短期/长期/工作记忆)
Planning规划将复杂任务拆解为可执行步骤
Multi-Agent多智能体多个 Agent 协作完成任务
MCPModel Context ProtocolAnthropic 提出的 Agent 与工具连接协议
Reflection反思Agent 对自己的输出进行自我评估和改进
Agent-as-a-ServiceAgent 即服务Agent 以 API 形式提供服务
HITLHuman-in-the-Loop人在回路:人工干预 Agent 决策
AGIArtificial General Intelligence通用人工智能

0.5 行业生态

主流厂商/组织

组织定位代表产品
OpenAIAgent SDK + GPTAgents SDK, GPT-4o
AnthropicMCP + ClaudeMCP 协议, Claude
LangChainAgent 框架LangChain, LangGraph
LlamaIndex检索优先LlamaIndex
GoogleAgent 生态Gemini + Vertex AI
Meta开源Llama + Pydantic AI
Microsoft企业AgentAutoGen, Copilot Studio
DatabricksAgent 数据Agent Builder

社区资源


0.6 四大核心设计模式

2025-2026 年生产级 Agent 系统的四大核心技术:

模式核心能力关键技术
反思 (Reflection)自我评估 + 迭代改进Reflexion, Self-RAG, 自我批评
工具 (Tool Use)感知 + 执行外部动作Function Calling, MCP, API 集成
规划 (Planning)任务拆解 + 动态调整ReAct, ToT, Agent-X 按需规划
多代理 (Multi-Agent)角色分工 + 协同决策Swarm, CrewAI, AutoGen, MCP

📅 最后更新:2026-05-12