向量是用于编码数据的含义的文本、图像、音频或视频的数字表示形式,而不是底层单词或像素。
预训练的向量嵌入模型可对输入(文本、图像、音频或视频)进行推断,然后输出向量。向量是神经网络对输入进行推理之后的最后一层隐藏层的值。
Oracle AI Vector Search 支持多达 65535 个向量维度。
AI Vector Search 支持 INT8、Float32 和 Float64 格式。
可以,您可以通过 vector_embedding() SQL 函数在数据库中创建向量。
只需从 Hugging Face 中选择 Sentence-Transformer 嵌入模型,即可将其安全地上传到数据库。
可以,您可以将商业和开源模型与 REST 调用或本地库结合使用,在数据库外部创建向量。
已测试的嵌入模型包括 openai.com、cohere.com、Hugging Face Transformers、Sentence-Transformers、Transformers.js 和 ONNX Runtime。
您可以使用 CPU 或 GPU 来创建向量。
AI Vector Search 应该能够与任何 LLM 协同工作。
截止目前,已经通过测试的 LLM 包括有:Llama2、Gemini 和 PaLM 2;OpenAI 的 ChatGPT;以及由 Cohere、Vertex AI 和 Mistral AI 开发的 LLM。
已测试了来自 OpenAI、Cohere、和 ONNX Runtime 的 90 多种嵌入式模型,并具备 Transformer、Sentence Transformer、Transformer.js、Xenova 和 FastEmbed 模型。
Oracle AI Vector Search 支持面向 LangChain 的 Oracle AI Vector Search 提供商。
注:为免疑义,本网页所用以下术语专指以下含义: