检索增强生成
Retrieval-Augmented Generation (RAG)
AI 回答前先去'翻你给的资料库或文档',照着真材料说话,像开卷考试而不是凭记忆瞎答。
先打个比方
想象你参加一场考试。一种是闭卷,全凭脑子里记的东西硬答,记不清就只能瞎编;另一种是开卷,答题前先翻一翻手边的资料,照着写。
普通的 AI 就像闭卷考生——它把训练时"读过"的东西塞进脑子,答题时全靠回忆。回忆不准,它又不肯交白卷,于是就一本正经地胡说,这就是大家常说的"AI 幻觉"。
RAG(检索增强生成)干的事,就是把 AI 从闭卷改成开卷。 📖
它到底是怎么干的
拆开这个名字就懂了:先"检索",再"生成"。
你问一个问题,AI 不急着张口,而是先去一个指定的资料库里翻——找出几段最相关的内容,比如公司的产品手册、规章制度、历史订单。然后它把"你的问题 + 翻到的资料"一起读一遍,再组织成人话回答你。
说白了,就是答题前先递给它一份小抄,让它照着小抄说,而不是凭空想象。
为什么和你有关
如果你在公司里想让 AI 帮忙,麻烦就来了:通用 AI 根本不知道你们内部的文件、流程、客户信息——这些它训练时压根没见过。
RAG 正是企业现在最常用的招数:把自家文件喂进资料库,让 AI 答问题时先去翻,既能用上私有知识,又能少胡说、还能告诉你答案出自哪份文件。客服机器人、内部问答助手,背后基本都是它。
一句话记住它:想让 AI 别瞎编,就给它一个能翻的资料库。 下次用 AI 工具,留意一下它能不能"上传文件再回答"——能的,多半就用了 RAG。
本文为 AI 整理的科普解读,可能有误,仅供入门参考。
没看懂?让 AI 再讲一遍:
延伸阅读:可在公众号「数字生命卡兹克」「Datawhale」搜同名概念的科普文章。