应用与工具

向量数据库

Vector Database

专门存'语义坐标'的仓库，你问一句它能秒速捞出'意思最像的几条'，像个按含义而不是按关键词找东西的图书馆。

先打个比方

普通搜索像图书馆里用"书名关键词"找书：你搜"狗"，它只翻出标题里有"狗"字的。可你要是搜"汪星人"，它就懵了——明明是一个意思，字不一样就找不到。

向量数据库换了个思路：它给每段文字、每张图都打上一串数字坐标（业内叫"向量"，你可以理解成"含义的GPS定位"）。意思越接近的内容，坐标挨得越近。于是搜"汪星人"，它照样能把"狗""宠物犬"全捞出来——它认的是含义，不是字面。

说白了，向量数据库就是一个专门按"意思"存取东西的仓库。

东西进来之前，先被一个AI模型翻译成坐标存进去；你提问时，问题也被翻成坐标，数据库飞快地算出"谁离你最近"，把最贴题的内容端上来。普通数据库比的是"一模一样"，它比的是"像不像" 🧭。

现在企业里火的"AI知识库问答"——把公司几千份文档喂给AI，员工随口一问就能得到答案——背后基本都靠它撑着。AI本身记不住这么多资料，得先让向量数据库帮忙"按含义捞出相关段落"，再交给AI组织成人话。可以说，它是企业级AI、智能客服、私有知识库的标配后端。

下次你用某个AI助手问公司文档，它秒答还答得准，幕后大概率就有一个向量数据库在默默打工。想真懂AI落地，记住这个"按意思找东西的仓库"就够入门了。

本文为 AI 整理的科普解读，可能有误，仅供入门参考。

没看懂？让 AI 再讲一遍：

延伸阅读：可在公众号「数字生命卡兹克」「Datawhale」搜同名概念的科普文章。