Files
llm_wiki/wiki/RAG vs 持久化知识库.md

80 lines
2.4 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
categories:
- "[[LLM Wiki]]"
tags:
- wiki
- rag
- comparison
- 知识管理/方法
created: 2026-04-07
source: "[[llm-wiki]]"
type: concept
aliases:
- RAG 对比
- 检索 vs 持久化
---
# RAG vs 持久化知识库
> **核心差异**RAG 每次查询都从原始文档重新发现知识LLM Wiki 将知识编译一次并持续维护。
## 对比表
| 维度 | RAG | LLM Wiki |
|------|-----|----------|
| **知识存储** | 原始文档分块 | 结构化 Markdown 页面 |
| **查询方式** | 向量检索 + 生成 | 读取已编译的页面 |
| **知识积累** | ❌ 无积累 | ✅ 持续复合 |
| **交叉引用** | ❌ 每次重新发现 | ✅ 已建立并维护 |
| **矛盾检测** | ❌ 每次需重新比对 | ✅ 已标记并追踪 |
| **综合分析** | 每次从零拼接 | 已反映所有已读内容 |
| **规模限制** | 嵌入维度限制 | ~100 来源 / 数百页面可行 |
| **维护成本** | 低(无需维护) | 需 LLM 持续维护 |
## RAG 的局限
大多数人的 LLM 文档体验是 RAG
1. 上传文件集合
2. 查询时检索相关分块
3. 生成回答
**问题**
- 提一个需要综合五篇文档的微妙问题LLM 每次都要重新找到并拼凑相关片段
- ==没有积累==,知识从不复合
- NotebookLM、ChatGPT 文件上传、多数 RAG 系统都是这种模式
## LLM Wiki 的优势
```
传统 RAG: Query → Retrieve → Generate → 丢弃
LLM Wiki: Ingest → Compile → Maintain → Query → 复用
```
关键区别在于 **wiki 是一个持久的、复合的制品**
- 交叉引用已经存在
- 矛盾已经被标记
- 综合分析已经反映了所有已读内容
- 每添加一个来源wiki 都变得更丰富
## 何时用 RAG vs Wiki
| 场景 | 推荐 | 原因 |
|------|------|------|
| 一次性查询文档 | RAG | 无需积累 |
| 持续研究某主题 | Wiki | 知识需要复合增长 |
| 快速问答 | RAG | 简单快速 |
| 需要综合分析 | Wiki | 已有交叉引用 |
| 大量文档一次性搜索 | RAG | Wiki 规模受限 |
| 长期知识管理 | Wiki | 持续积累价值 |
## 来源
- [[llm-wiki]] — Karpathy Gist 原文
- [[LLM Wiki]] — 核心概念页
## 实践佐证
[[Farzapedia|Farza]] 在构建个人 Wiki 前曾用 RAG 做过类似系统,但效果"一言难尽"。转为基于文件系统的知识库后Agent 天然就能理解文件结构和反向链接,反而好用得多。