2.4 KiB
2.4 KiB
categories, tags, created, source, type, aliases
| categories | tags | created | source | type | aliases | |||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|
2026-04-07 | llm-wiki | concept |
|
RAG vs 持久化知识库
核心差异:RAG 每次查询都从原始文档重新发现知识;LLM Wiki 将知识编译一次并持续维护。
对比表
| 维度 | RAG | LLM Wiki |
|---|---|---|
| 知识存储 | 原始文档分块 | 结构化 Markdown 页面 |
| 查询方式 | 向量检索 + 生成 | 读取已编译的页面 |
| 知识积累 | ❌ 无积累 | ✅ 持续复合 |
| 交叉引用 | ❌ 每次重新发现 | ✅ 已建立并维护 |
| 矛盾检测 | ❌ 每次需重新比对 | ✅ 已标记并追踪 |
| 综合分析 | 每次从零拼接 | 已反映所有已读内容 |
| 规模限制 | 嵌入维度限制 | ~100 来源 / 数百页面可行 |
| 维护成本 | 低(无需维护) | 需 LLM 持续维护 |
RAG 的局限
大多数人的 LLM 文档体验是 RAG:
- 上传文件集合
- 查询时检索相关分块
- 生成回答
问题:
- 提一个需要综合五篇文档的微妙问题,LLM 每次都要重新找到并拼凑相关片段
- ==没有积累==,知识从不复合
- NotebookLM、ChatGPT 文件上传、多数 RAG 系统都是这种模式
LLM Wiki 的优势
传统 RAG: Query → Retrieve → Generate → 丢弃
LLM Wiki: Ingest → Compile → Maintain → Query → 复用
关键区别在于 wiki 是一个持久的、复合的制品:
- 交叉引用已经存在
- 矛盾已经被标记
- 综合分析已经反映了所有已读内容
- 每添加一个来源,wiki 都变得更丰富
何时用 RAG vs Wiki
| 场景 | 推荐 | 原因 |
|---|---|---|
| 一次性查询文档 | RAG | 无需积累 |
| 持续研究某主题 | Wiki | 知识需要复合增长 |
| 快速问答 | RAG | 简单快速 |
| 需要综合分析 | Wiki | 已有交叉引用 |
| 大量文档一次性搜索 | RAG | Wiki 规模受限 |
| 长期知识管理 | Wiki | 持续积累价值 |
来源
实践佐证
Farzapedia 在构建个人 Wiki 前曾用 RAG 做过类似系统,但效果"一言难尽"。转为基于文件系统的知识库后,Agent 天然就能理解文件结构和反向链接,反而好用得多。