Appearance
核心技术选型指南
在知识图谱中的位置:模块一 · 01_基础概念 · 第 5 节 难度:⭐⭐ | 前置知识:Agent 基础概念
1. 概述
AI Agent 生态碎片化严重,选型是首要挑战。本章从 LLM 模型、Agent 框架、工具链三个维度给出选型建议。
2. LLM 模型选型
2.1 核心 LLM 对比
| 模型 | 上下文 | Function Calling | 推理 | 成本 | 适合场景 |
|---|---|---|---|---|---|
| GPT-4o | 128K | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | 高 | 通用 Agent |
| Claude 3.5 Sonnet | 200K | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | 中 | 性价比 Agent |
| Claude 3.5 Opus | 200K | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | 高 | 复杂推理 |
| Gemini 2.0 Pro | 1M | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | 中 | 超长上下文 |
| DeepSeek-R1 | 128K | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | 低 | 自部署 |
| Llama 3.1 405B | 128K | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | 低 | 开源自部署 |
2.2 选型决策树
Agent 场景选型:
├── 需要 Function Calling 成熟度?
│ ├── GPT-4o(最成熟)
│ └── Claude 3.5 Sonnet(性价比高)
├── 需要超长上下文?
│ ├── Claude 3.5 Sonnet(200K)
│ └── Gemini 2.0 Pro(1M)
├── 推理能力优先?
│ ├── Claude 3.5 Opus
│ └── DeepSeek-R1(开源)
├── 成本敏感?
│ ├── DeepSeek-R1(极低)
│ └── Claude 3.5 Haiku(低)
└── 需要多模态?
├── GPT-4o(图像+音频)
└── Gemini 2.0(原生多模态)3. Agent 框架选型
3.1 主流框架对比
| 框架 | 核心范式 | 优势 | 劣势 | 适合场景 |
|---|---|---|---|---|
| OpenAI Agents SDK | 轻量 Agent | 官方 SDK,最小代码 | 仅支持 OpenAI | 快速原型 |
| LangGraph | 有向图状态机 | 复杂工作流,有状态 | 学习曲线陡 | 生产级复杂流程 |
| LangChain | 链式编排 | 生态最大 | 重,性能差 | 简单链式 |
| LlamaIndex | 检索优先 | RAG 最强 | Agent 能力弱 | 知识库 |
| CrewAI | 多Agent团队 | 角色分工 | 较新 | 多Agent协作 |
| AutoGen | 多Agent对话 | 微软支持 | 调试困难 | 多Agent |
| DSPy | 程序化提示 | 声明式优化 | 范式新颖 | 提示工程 |
| Pydantic AI | 类型安全 | Python 原生 | 生态小 | 快速开发 |
3.2 框架选型决策树
选 Agent 框架:
├── 追求最小代码?
│ → OpenAI Agents SDK
├── 复杂有状态工作流?
│ → LangGraph
├── 多Agent协作?
│ → CrewAI / AutoGen
├── 检索优先(RAG)?
│ → LlamaIndex
├── 提示工程优化?
│ → DSPy
├── 类型安全?
│ → Pydantic AI
└── 简单链式?
→ LangChain4. 工具链选型
4.1 记忆/数据库
| 工具 | 类型 | 适合 |
|---|---|---|
| Chroma | 本地向量DB | 开发/原型 |
| Pinecone | 云端向量DB | 生产环境 |
| Weaviate | 开源向量DB | 自部署 |
| pgvector | PostgreSQL 插件 | 已有 Postgres |
| Qdrant | 高性能向量DB | 大规模检索 |
4.2 监控/观测
| 工具 | 用途 |
|---|---|
| LangSmith | LangChain 专用追踪 |
| Arize Phoenix | 通用 Agent 观测 |
| Langfuse | 开源追踪 |
| LangSmith | 商业化追踪 |
4.3 Browser 自动化
| 工具 | 用途 |
|---|---|
| Browserbase | 云浏览器 |
| Playwright | 本地浏览器自动化 |
| Puppeteer | Chrome 自动化 |
5. 推荐组合
5.1 快速原型(开发/POC)
LLM: GPT-4o / Claude 3.5 Sonnet
框架: OpenAI Agents SDK / Pydantic AI
记忆: Chroma
工具: MCP SDK5.2 生产环境(中型团队)
LLM: Claude 3.5 Sonnet(主力)+ GPT-4o(备用)
框架: LangGraph
记忆: Pinecone / Weaviate
工具: MCP + 自定义 Tools
监控: Langfuse5.3 企业级(大型组织)
LLM: 多模型路由(LiteLLM)
框架: 自研 / LangGraph
记忆: pgvector / Pinecone
工具: MCP + OpenAPI
监控: Arize Phoenix + 自研
部署: Docker + K8s6. 成本估算(参考)
| 任务复杂度 | 每轮 tokens | 月调用量 | 月成本(USD) | |------|------|------|--|-| | 简单(单工具) | 500 | 10K | ~$0.35 | | 中等(多步) | 2K | 5K | ~$10 | | 复杂(多Agent) | 5K | 1K | ~$50 | | 重度(企业) | 10K | 10K | ~$200+ |