Oracle MySQL HeatWave, 벡터 저장소 및 생성형 AI 지원 추가

Oracle CloudWorld 2023에서 벡터 저장소, LLM용 생성형 AI, AWS에서의 네이티브 레이크하우스 액세스를 비롯한 Oracle MySQL HeatWave의 신기능이 대거 발표되었습니다.

Mike Chen | 2023년 9월 28일


Oracle의 MySQL HeatWave는 트랜잭션, 데이터 웨어하우스와 데이터 레이크를 포괄하는 실시간 분석, 머신러닝을 하나의 MySQL 데이터베이스에서 모두 제공할 수 있는 유일한 클라우드 데이터베이스 서비스로 인정받고 있습니다. 또한 그 모든 기능을 ETL 중복으로 인한 복잡성, 위험, 비용 없이 사용할 수 있습니다. Forbes 기사에서 오라클의 '킬러 앱'이 될 가능성이 있다는 평가를 받기도 했던 MySQL HeatWave가 이제 벡터 스토어, 생성형 AI 기능 모음집, Amazon Web Services(AWS)에서의 MySQL HeatWave 레이크하우스 가용성 등의 신기능들과 함께 다시 한 번 도약합니다.

기업의 자체 데이터로 대규모 언어 모델(LLM) 학습을 보강할 수 있는 기능이 포함된 생성형 AI 관련 지원은 올해 Oracle CloudWorld에서 발표된 MySQL HeatWave의 가장 중요한 업데이트였습니다. Oracle의 Chief Corporate Architect인 Edward Screven은 "오늘 발표한 MySQL HeatWave의 개선사항들은 갈수록 까다로워지는 고객 데이터, 분석, AI 관련 문제들을 해결하기 위한 Oracle의 여정에서 또 하나의 중요한 이정표가 되어 줄 것입니다"라고 말했습니다. "이제 Oracle의 고객들은 벡터 스토어와 생성형 AI 관련 기능들을 통해 LLM을 원하는 대로 활용할 수 있게 되었습니다. 보유 중인 데이터와 상호작용하고, 자사의 비즈니스에 필요한 정확한 답변을 도출할 수 있는 직관적인 수단이 주어진 것이죠."

이제 Oracle의 고객들은 벡터 스토어와 생성형 AI 관련 기능들을 통해 LLM을 원하는 대로 활용할 수 있게 되었습니다. 보유 중인 데이터와 상호작용하고, 자사의 비즈니스에 필요한 정확한 답변을 도출할 수 있는 직관적인 수단이 주어진 것이죠.”

Edward Screven Oracle, Chief Corporate Architect

벡터 저장소는 데이터 레이크하우스에서 엔터프라이즈 데이터를 수집한 뒤 인코더를 통해 생성된 임베딩으로 저장하여 LLM 쿼리에 대한 추가 컨텍스트로 사용합니다. LLM에 대한 사용자 프롬프트는 벡터 저장소에 대한 유사성 검색을 거칩니다. 검색 결과를 바탕으로 원본 프롬프트와 유사성 검색을 결합한 입력 쿼리를 사용할 수 있으므로, 결과적으로 LLM이 엔터프라이즈 데이터를 참고하여 보다 질문의 맥락에 부합하고 관련성이 높은 답변을 제공할 수 있게 됩니다.

Oracle의 MySQL HeatWave 개발 담당 SVP인 Nipun Agarwal은 "벡터 스토어의 출력은 LLM에 대한 입력일 뿐입니다"라고 말했습니다. "고객의 독점 데이터로 LLM을 학습시키는 것이 아니므로 정보 유출 위험은 전혀 없습니다."

현재 비공개 프리뷰 단계인 벡터 스토어와 생성형 AI 기능을 조합하면 기업이 쿼리 및 검색에 자사의 독점 데이터를 적용하여 자연어 쿼리에 대한 보다 정확한 응답을 구할 수 있는 강력한 도구로 사용할 수 있습니다.

2023년 7월 Oracle Cloud Infrastructure(OCI)용으로 출시된 MySQL HeatWave Lakehouse를 사용하면 다양한 형식의 객체 저장소 데이터를 MySQL로 가져올 필요 없이 더욱 빠르게 분석할 수 있고, 비 MySQL 워크로드도 HeatWave에 액세스할 수 있습니다. 또한 이제 AWS 고객도 AWS 플랫폼에서 네이티브 서비스로 제공되는 MySQL HeatWave Lakehouse를 사용하여 동일한 기능을 이용할 수 있게 되었습니다.

"이제 AWS 인프라를 사용하여 HeatWave Lakehouse를 포함한 MySQL HeatWave를 AWS에서 실행할 수 있게 되었습니다." Screven은 말했습니다. "즉, AWS에서 HeatWave Lakehouse를 사용하면 더 이상 데이터 송신 수수료가 발생하지 않습니다. S3 버킷에 저장된 파일을 분석할 수도 있죠."

다른 데이터베이스에서 내보낸 데이터를 포함해 CSV, Apache Parquet, Avro 및 기타 다양한 형식으로 구성된 수백 테라바이트 규모의 데이터 쿼리를 기본 지원합니다. Microsoft Azure 사용자 또한 Oracle Database Service for Microsoft Azure에 포함된 MySQL HeatWave를 사용할 수 있습니다.

"이제 MySQL HeatWave를 사용하여 객체 저장소의 파일에 저장된 데이터를 직접 쿼리할 수 있습니다. 다시 말해서 MySQL로 데이터를 끌어올 필요가 없어졌습니다." Screven은 말했습니다. "이는 또한 MySQL HeatWave 레이크하우스가 IoT 장치, 로그 파일, 다른 데이터베이스에서 내보낸 파일 등 모든 데이터를 저장할 수 있는 서비스가 되었다는 의미이기도 합니다."

MySQL Autopilot Indexing은 Screven이 CloudWorld에서 발표한 또 다른 신기능입니다. 현재 제한적으로 제공되는 Autopilot Indexing은 머신러닝을 사용하여 인덱스 생성 및 삭제에 대한 권장 사항을 제시함으로써 인덱싱 속도를 향상시키고 인덱싱 결과를 개선할 수 있습니다. 또한 Autopilot Indexing은 권장 사항과 함께 성능 영향 평가를 작성함으로써 튜닝 관련 결정에 참고할 수 있는 정보를 제공합니다. 마지막으로 최근 발표된 MySQL HeatWave의 다른 신기능들은 다음과 같습니다.

  • 고객이 객체 스토리지에 저장된 데이터를 사용하여 머신러닝 학습, 추론, 설명을 쉽고 안전하게 진행할 수 있는 MySQL HeatWave Lakehouse용 HeatWave AutoML 지원
  • 개인화된 권장 사항을 생성할 수 있는 HeatWave AutoML 추천 시스템 개선 사항
  • MySQL HeatWave에서 저장 프로시저 및 함수를 작성하고 실행하기 위한 JavaScript 지원
  • JSON 문서 실시간 분석
  • 자동 압축 및 적응형 쿼리 실행을 비롯한 MySQL Autopilot의 추가 기능

Oracle Connect 기사 더 읽어보기