什么是向量数据库？

Translated for your language. 阅读原文.

AI-assisted draft.

GyaanSetu Editorial9小时前1分钟阅读

什么是向量数据库？

在阅读有关 AI 搜索或 RAG 的内容时，你很可能会看到“向量数据库”这个术语。

向量数据库将数据存储为向量。这些向量是代表含义的数字列表。它不是寻找精确的词语匹配，而是通过相似性来查找项目。

普通数据库适用于精确的问题。它们可以找到特定的用户 ID 或特定的日期。但当你询问具有相似含义的内容时，它们就会失效。

向量数据库解决了这个问题。它们使用嵌入（embeddings）。AI 模型将文本、图像或音频转换为数字指纹。含义相似的项目会获得在数学空间中彼此靠近的向量。

该过程分为三个步骤：

这就是为什么搜索“如何重置我的密码”时，能找到标题为“找回遗忘的登录信息”的文章。虽然词语不同，但含义相同。

你不需要在普通数据库和向量数据库之间做出选择。大多数应用会同时使用两者。你将结构化的客户记录保存在关系型数据库中，而将可搜索的含义存储在向量数据库中。一些工具（如 pgvector）允许你直接在 PostgreSQL 中添加向量搜索。

向量数据库为最实用的 AI 功能提供动力：

如果你构建的 AI 需要大规模查找相关信息，那么你就需要一个向量数据库。

热门选项包括：

继续阅读