kylearn
应用与工具

向量数据库

Vector Database

专门存'语义坐标'的仓库,你问一句它能秒速捞出'意思最像的几条',像个按含义而不是按关键词找东西的图书馆。

先打个比方

普通搜索像图书馆里用"书名关键词"找书:你搜"狗",它只翻出标题里有"狗"字的。可你要是搜"汪星人",它就懵了——明明是一个意思,字不一样就找不到。

向量数据库换了个思路:它给每段文字、每张图都打上一串数字坐标(业内叫"向量",你可以理解成"含义的GPS定位")。意思越接近的内容,坐标挨得越近。于是搜"汪星人",它照样能把"狗""宠物犬"全捞出来——它认的是含义,不是字面。

它到底是什么

说白了,向量数据库就是一个专门按"意思"存取东西的仓库

东西进来之前,先被一个AI模型翻译成坐标存进去;你提问时,问题也被翻成坐标,数据库飞快地算出"谁离你最近",把最贴题的内容端上来。普通数据库比的是"一模一样",它比的是"像不像" 🧭。

为什么和你有关

现在企业里火的"AI知识库问答"——把公司几千份文档喂给AI,员工随口一问就能得到答案——背后基本都靠它撑着。AI本身记不住这么多资料,得先让向量数据库帮忙"按含义捞出相关段落",再交给AI组织成人话。可以说,它是企业级AI、智能客服、私有知识库的标配后端。

下次你用某个AI助手问公司文档,它秒答还答得准,幕后大概率就有一个向量数据库在默默打工。想真懂AI落地,记住这个"按意思找东西的仓库"就够入门了。

本文为 AI 整理的科普解读,可能有误,仅供入门参考。

没看懂?让 AI 再讲一遍:

延伸阅读:可在公众号「数字生命卡兹克」「Datawhale」搜同名概念的科普文章。