AI Vector Search FAQ

FAQ 주제

일반적인 질문

벡터란 무엇인가요?

벡터는 텍스트, 이미지, 오디오 또는 비디오의 숫자 표현입니다. 벡터는 기본 단어나 픽셀이 아닌 데이터의 의미를 인코딩합니다.

벡터는 어떻게 생성되나요?

사전 학습된 벡터 임베딩 모델은 입력 데이터(텍스트, 이미지, 오디오 또는 비디오)를 추론해 그 산출물로서 벡터를 생성합니다. 벡터는 입력에 대한 추론 후 신경망의 마지막 숨겨진 계층의 값입니다.

지원되는 벡터 차원 갯수는 몇 개인가요?

Oracle AI Vector Search는 최대 65,535개 차원을 지원합니다.

벡터와 관련해 지원되는 숫자 형식은 무엇인가요?

AI Vector Search는 INT8, Float32, Float64 형식을 지원합니다.

벡터의 크기는 어느 정도인가요?

  • 공식에 따라 다릅니다. 예를 들어, 차원 수에 숫자 형식의 크기를 곱한 값을 구하는 공식을 사용할 수 있습니다.
  • 대부분의 벡터는 128~4,096개의 차원을 가지고 있습니다.
  • 대부분의 벡터는 Float32(4바이트) 이하입니다.
  • 대부분의 벡터 크기는 1.5KB에서 8KB 사이입니다.

데이터베이스 내에서 벡터를 생성할 수 있나요?

예. vector_embedding() SQL 함수를 사용해 데이터베이스 내부에서 벡터를 생성할 수 있습니다.

Hugging Face에서 Sentence-Transformer 임베딩 모델을 선택한 뒤 데이터베이스에 안전하게 업로드할 수 있습니다.

데이터베이스 외부에 벡터를 생성할 수 있나요?

예. REST 호출 또는 로컬 라이브러리를 사용하는 상용 및 오픈 소스 모델로 데이터베이스 외부에서 벡터를 생성할 수 있습니다.

테스트가 완료된 임베딩 모델로는 openai.com, cohere.com, Hugging Face Transformers, Sentence-Transformers, Transformers.js, ONNX Runtime 사용하기 등이 있습니다.

벡터를 생성하기 위해서는 GPU가 필요한가요?

CPU 또는 GPU를 사용해 벡터를 생성할 수 있습니다.

AI Vector Search는 어떤 LLM과 함께 작동하나요?

AI Vector Search는 모든 LLM과 함께 작동할 수 있는 호환성을 지향합니다.

현재 Llama2, Gemini, PaLM 2, OpenAI의 ChatGPT, 또한 Cohere, Vertex AI, Mistral AI의 LLM과의 호환성 테스트를 통과했습니다.

AI Vector Search는 어떤 임베딩 모델과 함께 작동하나요?

AI Vector Search는 OpenAI, Cohere, ONNX Runtime의 90개 이상의 임베딩 모델, Transformer, Sentence Transformer, Transformer.js, Xenova, FastEmbed 모델과의 호환성 테스트를 통과했습니다.

AI Vector Search는 LangChain을 지원하나요?

Oracle AI Vector Search는 LangChain용 Oracle AI Vector Search 공급자를 지원합니다.