giteahh/llm_wiki

Files

豆儿雷锋大道 80bc593b36 Initial commit: LLM Wiki with raw and wiki folders only

2026-04-07 21:10:43 +08:00

2.4 KiB

Raw Blame History

categories, tags, created, source, type, aliases

categories

tags

created

source

type

aliases

wiki

rag

comparison

知识管理/方法

2026-04-07

concept

RAG 对比

检索 vs 持久化

RAG vs 持久化知识库

核心差异：RAG 每次查询都从原始文档重新发现知识；LLM Wiki 将知识编译一次并持续维护。

对比表

维度	RAG	LLM Wiki
知识存储	原始文档分块	结构化 Markdown 页面
查询方式	向量检索 + 生成	读取已编译的页面
知识积累	❌ 无积累	✅ 持续复合
交叉引用	❌ 每次重新发现	✅ 已建立并维护
矛盾检测	❌ 每次需重新比对	✅ 已标记并追踪
综合分析	每次从零拼接	已反映所有已读内容
规模限制	嵌入维度限制	~100 来源 / 数百页面可行
维护成本	低（无需维护）	需 LLM 持续维护

RAG 的局限

大多数人的 LLM 文档体验是 RAG：

上传文件集合
查询时检索相关分块
生成回答

问题：

提一个需要综合五篇文档的微妙问题，LLM 每次都要重新找到并拼凑相关片段
==没有积累==，知识从不复合
NotebookLM、ChatGPT 文件上传、多数 RAG 系统都是这种模式

LLM Wiki 的优势

传统 RAG:  Query → Retrieve → Generate → 丢弃
LLM Wiki:  Ingest → Compile → Maintain → Query → 复用

关键区别在于 wiki 是一个持久的、复合的制品：

交叉引用已经存在
矛盾已经被标记
综合分析已经反映了所有已读内容
每添加一个来源，wiki 都变得更丰富

何时用 RAG vs Wiki

场景	推荐	原因
一次性查询文档	RAG	无需积累
持续研究某主题	Wiki	知识需要复合增长
快速问答	RAG	简单快速
需要综合分析	Wiki	已有交叉引用
大量文档一次性搜索	RAG	Wiki 规模受限
长期知识管理	Wiki	持续积累价值

来源

llm-wiki — Karpathy Gist 原文
LLM Wiki — 核心概念页

实践佐证

Farzapedia 在构建个人 Wiki 前曾用 RAG 做过类似系统，但效果"一言难尽"。转为基于文件系统的知识库后，Agent 天然就能理解文件结构和反向链接，反而好用得多。