导读:AI Agent 技术栈不是越复杂越好。你可以把这篇当成 Agent 技术栈选型流程来用:先判断任务是否真的需要 Agent,再选择框架、工具、状态管理和验证方式。


系列文章导航

  1. AI 智能体开发(一):从概念到架构设计
  2. AI 智能体开发(二):技术栈选择与工具集成
  3. AI智能体开发(三):实战构建研究助手Agent
  4. AI 智能体开发(四):性能优化、监控与生产边界

先判断:你真的需要 Agent 框架吗?

很多项目不需要 LangChain、CrewAI 或 AutoGen。一个普通 LLM 调用加几条规则就能解决的任务,强行上 Agent 框架只会增加调试成本。

任务类型推荐方案原因
单轮问答/摘要直接调用模型 API框架收益低
文档问答/RAGLlamaIndex / LangChain需要检索和上下文管理
多工具调用LangChain / 自研轻量 runtime需要工具 schema 和日志
多角色协作CrewAI / AutoGen需要角色、任务和流程编排
生产级 Agent自研 runtime + 框架组件更好控制权限、日志和回滚

选型公式:

1
框架价值 = 减少开发成本 + 生态组件复用 - 学习成本 - 调试成本 - 运行时复杂度

如果这个公式算下来为负,就先别上复杂框架。

官方来源与核验规则

框架能力、API 和最佳实践变化很快。优先看 官方来源:

核验规则:

  1. Star 数和热度不能代表适合你的项目;
  2. 必须用自己的工具调用和数据源测试;
  3. 生产前要验证日志、重试、超时、权限;
  4. 框架升级前先跑回归测试;
  5. 不把 demo 成功当成生产可用。

技术栈分层

一个可维护 Agent 系统一般分 6 层:

1
模型层 → Prompt/Planner → Tool Registry → State/Memory → Observability → Human Approval
要解决的问题
模型层选择 Claude/OpenAI/DeepSeek/Gemini 等模型
Planner任务拆解和下一步决策
Tool Registry工具定义、参数 schema、权限
State/Memory多轮状态、短期上下文、长期记忆
Observability日志、成本、错误、链路追踪
Human Approval高风险动作人工确认

框架只能帮你解决一部分,不能替你设计边界。

LangChain 适合什么

LangChain 的优势是生态丰富,适合快速接入模型、工具、检索、链式流程。

适合:

  • RAG 原型;
  • 多工具调用;
  • 需要大量现成集成;
  • 快速验证 LLM 应用。

风险:

  • 抽象层多,出错时不容易定位;
  • 版本变化可能影响旧代码;
  • 生产场景需要额外封装日志和权限。

最小验证:

1
让 Agent 调用一个 search 工具、一个 read 工具、一个失败工具,观察日志是否能定位问题。

LlamaIndex 适合什么

LlamaIndex 更偏数据和检索。适合文档问答、知识库、结构化数据检索。

适合:

  • 企业知识库;
  • 文档检索;
  • RAG pipeline;
  • 数据源连接。

风险:

  • 检索质量比模型更关键;
  • 数据切块、embedding、rerank 都要调;
  • 不适合把所有问题都交给生成模型。

CrewAI / AutoGen 适合什么

多 Agent 框架适合任务角色明确的场景,比如研究员、写作者、审稿员、执行器分工。

适合:

  • 研究报告;
  • 多角色流程;
  • 需要交叉审查的任务;
  • 教学和原型演示。

风险:

  • 多 Agent 容易增加 token 成本;
  • 角色越多,越难调试;
  • 如果没有明确验收标准,多个 Agent 只会互相放大错误。

什么时候自研轻量 runtime

如果你的工具、权限、日志、人工确认要求很强,自研轻量 runtime 反而更稳。

适合自研的情况:

  1. 工具调用很少但安全要求高;
  2. 需要严格审计;
  3. 框架抽象反而妨碍调试;
  4. 要和内部系统深度集成;
  5. 要控制每一步成本。

自研不等于从零造轮子。可以复用模型 SDK、向量库、队列和日志系统,只把 Agent 控制层自己掌握。

工具集成 checklist

检查项合格标准
schema每个工具有明确参数和返回结构
permission写操作、删除、支付等需要人工确认
timeout每个工具有超时
retry重试次数有限制
logging记录工具名、参数摘要、结果、错误
fallback关键工具失败有替代路径

选型决策表

项目需求建议
快速 RAG 原型LlamaIndex / LangChain
多工具 LLM 应用LangChain + 自定义日志
多角色协作演示CrewAI / AutoGen
生产级自动化自研 runtime + 框架组件
强安全和审计自研权限层,限制工具能力

FAQ

LangChain、CrewAI、AutoGen 哪个最好?

没有绝对最好。LangChain 偏生态,LlamaIndex 偏数据检索,CrewAI/AutoGen 偏多 Agent 协作。按任务选,不按热度选。

Agent 项目一定需要向量数据库吗?

不一定。只有需要检索外部知识或长期记忆时才需要。很多工具型 Agent 不需要向量库。

多 Agent 是否一定更强?

不一定。多 Agent 会增加成本和调试难度。只有角色分工确实能提高质量时才值得用。

总结

AI Agent 技术栈选择的核心不是追框架,而是明确任务边界、工具权限、状态管理和验证方式。先用最简单方案跑通,再逐步引入框架组件,才是更稳的 Agent 开发路线。