Initial commit: LLM Wiki with raw and wiki folders only

2026-04-07 21:10:43 +08:00
commit 80bc593b36
25 changed files with 2996 additions and 0 deletions
@@ -0,0 +1,79 @@
+---
+categories:
+  - "[[LLM Wiki]]"
+tags:
+  - wiki
+  - rag
+  - comparison
+  - 知识管理/方法
+created: 2026-04-07
+source: "[[llm-wiki]]"
+type: concept
+aliases:
+  - RAG 对比
+  - 检索 vs 持久化
+---
+
+# RAG vs 持久化知识库
+
+> **核心差异**：RAG 每次查询都从原始文档重新发现知识；LLM Wiki 将知识编译一次并持续维护。
+
+## 对比表
+
+| 维度 | RAG | LLM Wiki |
+|------|-----|----------|
+| **知识存储** | 原始文档分块 | 结构化 Markdown 页面 |
+| **查询方式** | 向量检索 + 生成 | 读取已编译的页面 |
+| **知识积累** | ❌ 无积累 | ✅ 持续复合 |
+| **交叉引用** | ❌ 每次重新发现 | ✅ 已建立并维护 |
+| **矛盾检测** | ❌ 每次需重新比对 | ✅ 已标记并追踪 |
+| **综合分析** | 每次从零拼接 | 已反映所有已读内容 |
+| **规模限制** | 嵌入维度限制 | ~100 来源 / 数百页面可行 |
+| **维护成本** | 低（无需维护） | 需 LLM 持续维护 |
+
+## RAG 的局限
+
+大多数人的 LLM 文档体验是 RAG：
+
+1. 上传文件集合
+2. 查询时检索相关分块
+3. 生成回答
+
+**问题**：
+- 提一个需要综合五篇文档的微妙问题，LLM 每次都要重新找到并拼凑相关片段
+- ==没有积累==，知识从不复合
+- NotebookLM、ChatGPT 文件上传、多数 RAG 系统都是这种模式
+
+## LLM Wiki 的优势
+
+```
+传统 RAG:  Query → Retrieve → Generate → 丢弃
+LLM Wiki:  Ingest → Compile → Maintain → Query → 复用
+```
+
+关键区别在于 **wiki 是一个持久的、复合的制品**：
+
+- 交叉引用已经存在
+- 矛盾已经被标记
+- 综合分析已经反映了所有已读内容
+- 每添加一个来源，wiki 都变得更丰富
+
+## 何时用 RAG vs Wiki
+
+| 场景 | 推荐 | 原因 |
+|------|------|------|
+| 一次性查询文档 | RAG | 无需积累 |
+| 持续研究某主题 | Wiki | 知识需要复合增长 |
+| 快速问答 | RAG | 简单快速 |
+| 需要综合分析 | Wiki | 已有交叉引用 |
+| 大量文档一次性搜索 | RAG | Wiki 规模受限 |
+| 长期知识管理 | Wiki | 持续积累价值 |
+
+## 来源
+
+- [[llm-wiki]] — Karpathy Gist 原文
+- [[LLM Wiki]] — 核心概念页
+
+## 实践佐证
+
+[[Farzapedia|Farza]] 在构建个人 Wiki 前曾用 RAG 做过类似系统，但效果"一言难尽"。转为基于文件系统的知识库后，Agent 天然就能理解文件结构和反向链接，反而好用得多。