kylearn
应用与工具

检索增强生成

Retrieval-Augmented Generation (RAG)

AI 回答前先去'翻你给的资料库或文档',照着真材料说话,像开卷考试而不是凭记忆瞎答。

先打个比方

想象你参加一场考试。一种是闭卷,全凭脑子里记的东西硬答,记不清就只能瞎编;另一种是开卷,答题前先翻一翻手边的资料,照着写。

普通的 AI 就像闭卷考生——它把训练时"读过"的东西塞进脑子,答题时全靠回忆。回忆不准,它又不肯交白卷,于是就一本正经地胡说,这就是大家常说的"AI 幻觉"。

RAG(检索增强生成)干的事,就是把 AI 从闭卷改成开卷。 📖

它到底是怎么干的

拆开这个名字就懂了:先"检索",再"生成"。

你问一个问题,AI 不急着张口,而是先去一个指定的资料库里翻——找出几段最相关的内容,比如公司的产品手册、规章制度、历史订单。然后它把"你的问题 + 翻到的资料"一起读一遍,再组织成人话回答你。

说白了,就是答题前先递给它一份小抄,让它照着小抄说,而不是凭空想象。

为什么和你有关

如果你在公司里想让 AI 帮忙,麻烦就来了:通用 AI 根本不知道你们内部的文件、流程、客户信息——这些它训练时压根没见过。

RAG 正是企业现在最常用的招数:把自家文件喂进资料库,让 AI 答问题时先去翻,既能用上私有知识,又能少胡说、还能告诉你答案出自哪份文件。客服机器人、内部问答助手,背后基本都是它。

一句话记住它:想让 AI 别瞎编,就给它一个能翻的资料库。 下次用 AI 工具,留意一下它能不能"上传文件再回答"——能的,多半就用了 RAG。

本文为 AI 整理的科普解读,可能有误,仅供入门参考。

没看懂?让 AI 再讲一遍:

延伸阅读:可在公众号「数字生命卡兹克」「Datawhale」搜同名概念的科普文章。