벡터는 텍스트, 이미지, 오디오 또는 비디오의 숫자 표현입니다. 벡터는 기본 단어나 픽셀이 아닌 데이터의 의미를 인코딩합니다.
사전 학습된 벡터 임베딩 모델은 입력 데이터(텍스트, 이미지, 오디오 또는 비디오)를 추론해 그 산출물로서 벡터를 생성합니다. 벡터는 입력에 대한 추론 후 신경망의 마지막 숨겨진 계층의 값입니다.
Oracle AI Vector Search는 최대 65,535개 차원을 지원합니다.
AI Vector Search는 INT8, Float32, Float64 형식을 지원합니다.
예. vector_embedding() SQL 함수를 사용해 데이터베이스 내부에서 벡터를 생성할 수 있습니다.
Hugging Face에서 Sentence-Transformer 임베딩 모델을 선택한 뒤 데이터베이스에 안전하게 업로드할 수 있습니다.
예. REST 호출 또는 로컬 라이브러리를 사용하는 상용 및 오픈 소스 모델로 데이터베이스 외부에서 벡터를 생성할 수 있습니다.
테스트가 완료된 임베딩 모델로는 openai.com, cohere.com, Hugging Face Transformers, Sentence-Transformers, Transformers.js, ONNX Runtime 사용하기 등이 있습니다.
CPU 또는 GPU를 사용해 벡터를 생성할 수 있습니다.
AI Vector Search는 모든 LLM과 함께 작동할 수 있는 호환성을 지향합니다.
현재 Llama2, Gemini, PaLM 2, OpenAI의 ChatGPT, 또한 Cohere, Vertex AI, Mistral AI의 LLM과의 호환성 테스트를 통과했습니다.
AI Vector Search는 OpenAI, Cohere, ONNX Runtime의 90개 이상의 임베딩 모델, Transformer, Sentence Transformer, Transformer.js, Xenova, FastEmbed 모델과의 호환성 테스트를 통과했습니다.
Oracle AI Vector Search는 LangChain용 Oracle AI Vector Search 공급자를 지원합니다.