什么是rag
RAG 是 Retrieval-Augmented Generation,中文常叫“检索增强生成”。
简单说:先查资料,再让大模型回答。它把“搜索/检索系统”和“大语言模型”结合起来,让模型基于外部知识库、文档、数据库或网页内容生成答案,而不是只依赖模型训练时记住的知识。
典型流程:
- 用户提问:比如“公司报销制度里机票怎么报?”
- 系统检索:去知识库里找相关文档片段。
- 拼接上下文:把检索到的内容连同问题一起发给大模型。
- 模型回答:模型根据这些资料生成答案,并可附带来源。
RAG 主要解决几个问题:
- 知识更新:不用重新训练模型,也能回答最新或内部资料相关问题。
- 减少幻觉:模型有明确参考材料,答案更可控。
- 私有知识问答:适合企业文档、客服知识库、法律/医疗/金融资料检索等场景。
- 可追溯:可以返回引用来源,方便验证答案。



