AI Vector Search 的常见问题解答

常见问题解答主题

常见问题

什么是向量?

向量是用于编码数据的含义的文本、图像、音频或视频的数字表示形式,而不是底层单词或像素。

向量是如何创建的?

预训练的向量嵌入模型可对输入(文本、图像、音频或视频)进行推断,然后输出向量。向量是神经网络对输入进行推理之后的最后一层隐藏层的值。

支持多少个向量维度?

Oracle AI Vector Search 支持多达 65535 个向量维度。

支持哪些向量编号格式?

AI Vector Search 支持 INT8、Float32 和 Float64 格式。

向量有多大?

  • 向量的大小取决于公式,比如一个公式是维度的数量乘以数字格式的大小。
  • 大多数的向量具有 128 到 4096 个维度。
  • 大多数向量为 Float32(4 个字节)或更小。
  • 大多数向量一般介于 1.5 KB 和 8 KB 之间。

是否可以在数据库中创建向量?

可以,您可以通过 vector_embedding() SQL 函数在数据库中创建向量。

只需从 Hugging Face 中选择 Sentence-Transformer 嵌入模型,即可将其安全地上传到数据库。

是否可以在数据库外创建向量?

可以,您可以将商业和开源模型与 REST 调用或本地库结合使用,在数据库外部创建向量。

已测试的嵌入模型包括 openai.com、cohere.com、Hugging Face Transformers、Sentence-Transformers、Transformers.js 和 ONNX Runtime。

创建向量是否需要 GPU?

您可以使用 CPU 或 GPU 来创建向量。

AI Vector Search 使用哪些 LLM?

AI Vector Search 应该能够与任何 LLM 协同工作。

截止目前,已经通过测试的 LLM 包括有:Llama2、Gemini 和 PaLM 2;OpenAI 的 ChatGPT;以及由 Cohere、Vertex AI 和 Mistral AI 开发的 LLM。

AI Vector Search 使用哪些嵌入式模型?

已测试了来自 OpenAI、Cohere、和 ONNX Runtime 的 90 多种嵌入式模型,并具备 Transformer、Sentence Transformer、Transformer.js、Xenova 和 FastEmbed 模型。

AI Vector Search 是否支持 LangChain?

Oracle AI Vector Search 支持面向 LangChain 的 Oracle AI Vector Search 提供商。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. 除Oracle隐私政策外,本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国 。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。