Aaron Ricadela | 资深撰稿人 | 2025 年 3 月 18 日
正如生成式 AI 正在重塑用户与计算机的交互方式一样,它对存储和检索系统答案信息数据库提出了新的需求。向量数据库专为使用非常大的非结构化或半结构化数据集的开发人员而设计,用于存储根据原始数据计算出的数十亿个向量的嵌入或数学空间中的位置。数据库可以返回答案,通过快速计算向量之间的关系来增强 AI 模型的知识。
与擅长查找精确查询匹配的传统数据库不同,向量数据库,例如 Weaviate(以及 Milvus、Pinecone、Chroma 和 Qdrant 等)通过多维向量空间中彼此之间的距离来表示存储对象之间的相似性。数据库可以快速找到相关信息,并根据假设用户的模型返回答案,即使它们大约接近查询而不是与查询完全匹配。
这使得 Weaviate 和其他向量数据库成为强大的自然语言处理工具,适用于电子商务和流媒体服务、语义或相似性搜索、欺诈检测和检索增强生成 (RAG) 等应用。
Weaviate 由荷兰同名的初创公司拥有,是一个专门的向量数据库,擅长跨数十亿个向量的快速搜索。它的搜索架构使用数据库分片技术,这种技术可以在许多服务器上传播信息,以提高可扩展性和性能。
Weaviate 使用不同类型的数据库索引来提高性能,具体取决于数据集的大小。它的平面索引存储向量位置,适用于小型数据集。其 HNSW(分层可导航小世界)索引的构建速度较慢,但更适合大型数据集。
Weaviate 通过提供一系列工具和接口(包括 Python、JavaScript、Go 和 Java 的客户端库)以及 GraphQL 查询语言的 API 来提高开发人员的工作效率。数据库在开源 BSD-3-Clause 许可证下分发。它的优势是近似邻 (ANN) 搜索,其结果增强了生成式 AI 查询。
客户可以在自己的计算机上、公有云服务中以无服务器模式运行 Weaviate,或者通过公司的托管云服务使用专用硬件运行。
Oracle Database 23ai 还提供 AI 向量搜索,可像 Weaviate 一样存储和搜索向量,响应时间仅为亚秒。但是,使用 Oracle Database 23ai 的开发团队不仅可以存储和检索单一用途向量数据库中的数据,还可以存储和搜索关系、图形、空间、JSON 和物联网数据以及向量搜索。借助 Oracle 数据库,IT 组无需管理多个数据库和数据副本,从而降低复杂性。
尽管 Weaviate 支持集群以提高数据库可用性,但 Oracle Database 23ai 提供了更广泛的高可用性选项,包括 Oracle Real Application Clusters(允许数据库实例在单独的服务器上运行以实现容错和负载平衡);Oracle Active Data Guard(用于立即复制到备用数据库),以便在计划外停机期间不会丢失数据;Oracle GoldenGate(用于跨多个站点的数据一致性)。为了实现可扩展性,Oracle Globally Distributed Database 支持向量搜索分片;路由查询;更新、插入和删除分片操作。
专业向量数据库可以依靠定期批量更新来快速更改数据,这可能会导致数据集不一致。借助 Oracle Database 23ai,RAG 管道和底层数据源保持同步。对于查询,Oracle Autonomous Database Select AI 使用 Anthropic、Cohere、Google、Meta、Microsoft 和 OpenAI 中的 LLM 将自然语言查询转换为 SQL 命令。Oracle Database 23ai 还支持开发人员利用来自其他大型云技术提供商的 AI 服务,包括 Google 的 Gemini 模型、Microsoft 的 Azure AI 服务和 OpenAI 的 LLM,与存储在 Oracle 中的企业数据结合使用。
了解 Oracle Database 23ai 向量搜索如何与您的应用协同工作。
Weaviate 如何处理语义和向量搜索?
Weaviate 数据库支持低延迟搜索从各种应用的非结构化数据构建的向量嵌入。这些包括推荐引擎和 RAG,以及混合搜索,将文本,图像,音频和视频之间的关系的语义理解与传统的关键字搜索相结合。
Pinecone 和 Weaviate 有什么区别?
Weaviate 具有 BSD-3-Clause 许可证,可以在本地或公有云服务中运行。Pinecone 以专有许可证分发,并在云端运行(以及通过与 AWS 私有云的链接)。Pinecone 支持广泛的数据类型,而 Weaviate 可以通过其开源许可进行自定义。
Weaviate 是否可以与 NLP 模型结合使用?
是的,Weaviate 允许用户运行和扩展自己的自然语言处理模型,以及使用随软件附带的模型。
Weaviate 与其他向量数据库有什么区别?
Weaviate 专注于通过支持各种编程语言和 AI 工具来吸引开发人员使用其产品。其架构旨在通过数据分片实现横向扩展。
注:为免疑义,本网页所用以下术语专指以下含义: