RAG 与知识库专有名词

程小虎

RAG 与知识库专有名词

学习目标:理解如何让 AI Agent 使用外部知识库,减少幻觉并回答私有知识问题。

1. 这一类为什么重要

模型参数里不一定包含企业内部知识,也不一定包含最新信息。RAG 通过“先检索、再生成”的方式,把相关资料放进上下文,让 Agent 能基于资料回答。

2. 核心名词详解

名词详细说明常见使用场景
RAGRetrieval-Augmented Generation,检索增强生成。企业知识库问答、文档助手、客服机器人。
Retriever(检索器)根据用户问题从知识库找相关内容的组件。向量检索、关键词检索、混合检索。
Vector Database(向量数据库)存储 Embedding 向量并支持相似度搜索的数据库。Milvus、FAISS、Chroma、Pinecone。
Embedding Model把文本转换为向量的模型。文档入库、语义检索、相似问答。
Chunk(文本块)文档切分后的片段。控制检索粒度和上下文长度。
Chunking(切分)将长文档切成适合检索的小段。PDF、Markdown、网页文档入库。
Semantic Search(语义搜索)根据语义相似度检索,而不是只看关键词。同义表达、自然语言问答。
Hybrid Search(混合搜索)同时使用关键词检索和向量检索。专有名词、编号、代码和自然语言混合场景。
Rerank(重排序)对初步检索结果再次排序,提升相关性。高质量 RAG、复杂问答。
BM25经典关键词检索算法。精确关键词、日志编号、错误码搜索。
Recall(召回率)相关内容被检索出来的比例。评估检索是否漏掉关键资料。
Precision(精确率)检索结果中真正相关内容的比例。控制无关资料进入上下文。
Top-k Retrieval返回相似度最高的 k 个片段。控制上下文数量和成本。
Knowledge Base(知识库)存放可检索知识的系统。企业文档、运维手册、代码文档。

3. 使用场景

  • 将内部运维文档接入 Agent,实现“问问题 → 查文档 → 给答案”。
  • 对长文档进行分块、向量化和检索。
  • 使用 Rerank 提高答案引用资料的准确性。
  • 使用 Hybrid Search 处理错误码、命令和专有名词。

4. RAG 流程图

RAG 从文档入库到生成答案的流程图

5. 学习建议

RAG 的关键不是“把文档都塞给模型”,而是把最相关、最可信、最少量的信息放进上下文。切分策略、召回和重排序往往比模型本身更影响效果。

最近更新 6/11/2026, 11:00:42 PM