Un vector es una representación numérica de texto, imágenes, audio o video que codifica el significado de los datos, no las palabras o píxeles subyacentes.
Un modelo de incrustación vectorial preentrenado realiza una inferencia sobre una entrada (texto, imagen, audio o video) y genera un vector como salida. El vector representa los valores de la última capa oculta de la red neuronal después de realizar una inferencia con la entrada.
Oracle AI Vector Search admite hasta 65 535 dimensiones.
AI Vector Search admite los formatos INT8, Float32 y Float64.
Sí, puedes crear vectores dentro de la base de datos usando la función SQL vector_embedding().
Puedes elegir modelos de incrustación Sentence-Transformer de Hugging Face y cargarlos de forma segura en la base de datos.
Sí, puedes crear vectores fuera de la base de datos utilizando tanto modelos comerciales como de código abierto mediante llamadas REST o bibliotecas locales.
Los modelos de incrustación que han sido probados incluyen OpenAI, Cohere, Hugging Face Transformers, Sentence-Transformers, Transformers.js y ONNX Runtime.
Puedes crear vectores utilizando tanto CPU y GPU.
AI Vector Search debe ser capaz de trabajar con cualquier LLM.
Hasta ahora se han probado modelos como Llama2, Gemini, PaLM 2, ChatGPT de OpenAI y LLM desarrollados por Cohere, Vertex AI y Mistral AI.
Se han probado más de 90 modelos de incrustación de OpenAI, Cohere y ONNX Runtime, así como modelos como Transformer, Sentence Transformer, Transformer.js, Xenova y FastEmbed.
Oracle AI Vector Search admite el proveedor Oracle AI Vector Search para LangChain.