架构

2025年6月12日 · 1069 字 · 6 分钟 · RAG Agent AI LLM 架构

封面图：如果把这篇先压成一眼能懂的画面，大概就是这样。左边负责把资料和证据找回来，右边负责拿着上下文把事做下去，中间最关键的是交接。

这两年很多 AI 产品介绍里，RAG 和 Agent 经常被放在一起讲，听久了很容易产生一种错觉：只要模型会检索、会调用工具、会多轮推理，这些东西差不多就是一回事。

但真到了落地阶段，这种混用会很快带来问题。有人把本来适合做检索问答的系统做成了复杂 Agent，结果成本高、延迟大、稳定性差；也有人把本来需要行动能力的任务硬塞进 RAG，最后模型只能“知道”，却做不了事。

最近整理了一批本地资料，里面既有检索、向量库、混合搜索，也有工具调用、上下文注入、自动化和多代理协作。抽出来以后，我越来越觉得：RAG 和 Agent 最重要的不是谁更高级，而是它们解决的问题完全不同。

RAG 解决的是“模型不知道”的问题

RAG，检索增强生成，本质上是在回答前先补证据。

它最适合的场景通常有几个共同点：

比如：

这类问题的核心不是“推理链多长”，而是能不能先把对的材料找回来。

所以一个像样的 RAG 系统，重点通常都落在这些地方：

说白了，RAG 的第一目标不是“聪明”，而是把上下文准备对。

Agent 则完全是另一类能力。

它关心的不是有没有资料，而是模型能不能围绕一个目标，调用工具、拆分步骤、处理中间状态，并最终把事情做完。

典型任务包括：

这类任务即使完全不需要 RAG，依然需要 Agent，因为难点不在知识召回，而在：

如果说 RAG 像“先去图书馆找参考资料”，那 Agent 更像“拿着目标开始干活的人”。