RAG 与知识库专有名词

程小虎

RAG 与知识库专有名词

学习目标：理解如何让 AI Agent 使用外部知识库，减少幻觉并回答私有知识问题。

1. 这一类为什么重要

模型参数里不一定包含企业内部知识，也不一定包含最新信息。RAG 通过“先检索、再生成”的方式，把相关资料放进上下文，让 Agent 能基于资料回答。

2. 核心名词详解

名词	详细说明	常见使用场景
RAG	Retrieval-Augmented Generation，检索增强生成。	企业知识库问答、文档助手、客服机器人。
Retriever（检索器）	根据用户问题从知识库找相关内容的组件。	向量检索、关键词检索、混合检索。
Vector Database（向量数据库）	存储 Embedding 向量并支持相似度搜索的数据库。	Milvus、FAISS、Chroma、Pinecone。
Embedding Model	把文本转换为向量的模型。	文档入库、语义检索、相似问答。
Chunk（文本块）	文档切分后的片段。	控制检索粒度和上下文长度。
Chunking（切分）	将长文档切成适合检索的小段。	PDF、Markdown、网页文档入库。
Semantic Search（语义搜索）	根据语义相似度检索，而不是只看关键词。	同义表达、自然语言问答。
Hybrid Search（混合搜索）	同时使用关键词检索和向量检索。	专有名词、编号、代码和自然语言混合场景。
Rerank（重排序）	对初步检索结果再次排序，提升相关性。	高质量 RAG、复杂问答。
BM25	经典关键词检索算法。	精确关键词、日志编号、错误码搜索。
Recall（召回率）	相关内容被检索出来的比例。	评估检索是否漏掉关键资料。
Precision（精确率）	检索结果中真正相关内容的比例。	控制无关资料进入上下文。
Top-k Retrieval	返回相似度最高的 k 个片段。	控制上下文数量和成本。
Knowledge Base（知识库）	存放可检索知识的系统。	企业文档、运维手册、代码文档。

3. 使用场景

将内部运维文档接入 Agent，实现“问问题 → 查文档 → 给答案”。
对长文档进行分块、向量化和检索。
使用 Rerank 提高答案引用资料的准确性。
使用 Hybrid Search 处理错误码、命令和专有名词。

4. RAG 流程图

RAG 从文档入库到生成答案的流程图

5. 学习建议

RAG 的关键不是“把文档都塞给模型”，而是把最相关、最可信、最少量的信息放进上下文。切分策略、召回和重排序往往比模型本身更影响效果。

目录