RAG 与知识库专有名词
程小虎
RAG 与知识库专有名词
学习目标:理解如何让 AI Agent 使用外部知识库,减少幻觉并回答私有知识问题。
1. 这一类为什么重要
模型参数里不一定包含企业内部知识,也不一定包含最新信息。RAG 通过“先检索、再生成”的方式,把相关资料放进上下文,让 Agent 能基于资料回答。
2. 核心名词详解
| 名词 | 详细说明 | 常见使用场景 |
|---|---|---|
| RAG | Retrieval-Augmented Generation,检索增强生成。 | 企业知识库问答、文档助手、客服机器人。 |
| Retriever(检索器) | 根据用户问题从知识库找相关内容的组件。 | 向量检索、关键词检索、混合检索。 |
| Vector Database(向量数据库) | 存储 Embedding 向量并支持相似度搜索的数据库。 | Milvus、FAISS、Chroma、Pinecone。 |
| Embedding Model | 把文本转换为向量的模型。 | 文档入库、语义检索、相似问答。 |
| Chunk(文本块) | 文档切分后的片段。 | 控制检索粒度和上下文长度。 |
| Chunking(切分) | 将长文档切成适合检索的小段。 | PDF、Markdown、网页文档入库。 |
| Semantic Search(语义搜索) | 根据语义相似度检索,而不是只看关键词。 | 同义表达、自然语言问答。 |
| Hybrid Search(混合搜索) | 同时使用关键词检索和向量检索。 | 专有名词、编号、代码和自然语言混合场景。 |
| Rerank(重排序) | 对初步检索结果再次排序,提升相关性。 | 高质量 RAG、复杂问答。 |
| BM25 | 经典关键词检索算法。 | 精确关键词、日志编号、错误码搜索。 |
| Recall(召回率) | 相关内容被检索出来的比例。 | 评估检索是否漏掉关键资料。 |
| Precision(精确率) | 检索结果中真正相关内容的比例。 | 控制无关资料进入上下文。 |
| Top-k Retrieval | 返回相似度最高的 k 个片段。 | 控制上下文数量和成本。 |
| Knowledge Base(知识库) | 存放可检索知识的系统。 | 企业文档、运维手册、代码文档。 |
3. 使用场景
- 将内部运维文档接入 Agent,实现“问问题 → 查文档 → 给答案”。
- 对长文档进行分块、向量化和检索。
- 使用 Rerank 提高答案引用资料的准确性。
- 使用 Hybrid Search 处理错误码、命令和专有名词。
4. RAG 流程图
5. 学习建议
RAG 的关键不是“把文档都塞给模型”,而是把最相关、最可信、最少量的信息放进上下文。切分策略、召回和重排序往往比模型本身更影响效果。
