Skip to content

监控与可观测性

在知识图谱中的位置:模块四 · 04_工程实践 · 第 5 节 难度:⭐⭐ | 前置知识:Agent 工程化


1. 概述

Agent 的不可观测性比传统应用更严重——你不知道 LLM 内部在想什么。可观测性是 Agent 生产化的关键。


2. 监控维度

维度指标工具
延迟Token/s, 端到端延迟LangSmith, Prometheus
成本每轮成本, 总成本LiteLLM, 自研
质量任务完成率, 工具准确率自建评测
稳定性失败率, 超时率Grafana
Token 使用输入/输出/缓存 TokenAPI 日志

3. 实现

3.1 LangSmith 追踪

python
from langsmith import Client

client = Client()

# 追踪 Agent 执行
with client.run_trace(
    name="weather_agent",
    inputs={"query": "北京天气"},
    outputs={"result": "25°C 晴"},
    tags=["production", "weather"],
) as trace:
    result = agent.run("北京天气")

3.2 成本追踪

python
from litellm import completion_cost

cost = completion_cost(
    model="gpt-4o",
    response=response,
)
print(f"本轮成本: ${cost:.4f}")

4. 参考资料