RAG – 晚风初歇

RAG

2026-6-27 19:54

|

前端

|

2

319 字

|

2 分钟

什么是rag

RAG 是 Retrieval-Augmented Generation，中文常叫“检索增强生成”。

简单说：先查资料，再让大模型回答。它把“搜索/检索系统”和“大语言模型”结合起来，让模型基于外部知识库、文档、数据库或网页内容生成答案，而不是只依赖模型训练时记住的知识。

典型流程：

用户提问：比如“公司报销制度里机票怎么报？”
系统检索：去知识库里找相关文档片段。
拼接上下文：把检索到的内容连同问题一起发给大模型。
模型回答：模型根据这些资料生成答案，并可附带来源。

RAG 主要解决几个问题：

知识更新：不用重新训练模型，也能回答最新或内部资料相关问题。
减少幻觉：模型有明确参考材料，答案更可控。
私有知识问答：适合企业文档、客服知识库、法律/医疗/金融资料检索等场景。
可追溯：可以返回引用来源，方便验证答案。

文末附加内容

暂无评论

发送评论编辑评论

Markdown

悄悄话

邮件提醒

|´・ω・)ノ

ヾ(≧∇≦*)ゝ

(☆ω☆)

（╯‵□′）╯︵┴─┴

￣﹃￣

(/ω＼)

∠( ᐛ 」∠)＿

(๑•̀ㅁ•́ฅ)

→_→

୧(๑•̀⌄•́๑)૭

٩(ˊᗜˋ*)و

(ノ°ο°)ノ

(´இ皿இ｀)

⌇●﹏●⌇

(ฅ´ω`ฅ)

(╯°A°)╯︵○○○

φ(￣∇￣o)

ヾ(´･･｀｡)ノ"

( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃

(ó﹏ò｡)

Σ(っ °Д °;)っ

( ,,´･ω･)ﾉ"(´っω･｀｡)

╮(╯▽╰)╭

o(*////▽////*)q

＞﹏＜

( ๑´•ω•) "(ㆆᴗㆆ)

颜文字

Emoji

小恐龙

花!