미국 라스베이거스에서 개최된 Oracle CloudWorld 2023에서 Oracle의 Executive Vice President인 Juan Loaiza는 기조연설을 통해 생성형 AI 기술 통합으로 개발자, 데이터 전문가, 애플리케이션 사용자의 작업 편의성을 향상시켜 주는 Oracle Database 23c의 최신 기능들을 자세히 소개하였습니다.
이 기능에는 개발자의 JSON 문서 관련 작업 효율성을 크게 향상해 주는 기능, 자연어 쿼리를 지원하고 고객이 생성형 AI 모델과 자체 데이터를 결합하는 앱을 구축할 수 있도록 지원하는 새로운 벡터 데이터베이스 기능 등이 포함되어 있다고 Loaiza는 말합니다.
보다 구체적으로 설명하자면, Oracle Database 23c는 이제 벡터를 데이터베이스 내의 기본 데이터 유형 중 하나로서 지원합니다. 결과적으로 시맨틱 데이터와 비즈니스 데이터의 검색을 더욱 간단히 결합할 수 있고, 개발자들이 애플리케이션에 대규모 언어 모델(LLM)을 도입할 수 있게 될 것이라고 Loaiza는 말했습니다.
Loaiza에 따르면 벡터란 복잡한 비정형 데이터를 자연어 쿼리를 기반으로 간단히 찾을 수 있게 표현하는 방식을 의미합니다. 예를 들어 집 한 채가 찍힌 사진에는 건축 자재의 종류, 층 수, 창문 수 등 그 집을 구성하는 다양한 요소별로 수천 가지의 숫자들을 할당할 수 있습니다. 해당 숫자들로 이루어진 문자열이 바로 그 이미지의 '벡터'입니다. 숫자 문자열은 텍스트 문서 및 비디오의 콘텐츠 및 테마를 설명하는 데에도 사용할 수 있습니다.
Loaiza는 개발자가 Oracle Database의 네이티브 벡터 저장 기능을 통해 생성형 AI를 사용하는 엔터프라이즈 앱을 구축할 수 있다고 말했습니다. "데이터베이스는 이러한 벡터를 저장하고 쿼리할 수 있을 뿐만 아니라 비즈니스 데이터와도 일치시킬 수 있습니다." Loaiza의 말입니다. "Oracle은 고객이 보안성, 데이터 무결성, 성능을 희생할 필요 없이 인공지능의 이점만을 빠르고 간단히 누릴 수 있도록 Oracle Database에 AI 벡터 검색을 추가했습니다."
“Oracle은 고객이 보안성, 데이터 무결성, 성능을 희생할 필요 없이 인공지능의 이점만을 빠르고 간단히 누릴 수 있도록 Oracle Database에 AI 벡터 검색을 추가했습니다.”
Loaiza는 부연 설명을 위해 마음에 드는 집을 발견하면 사진을 찍어 부동산 앱에 업로드하는 구매자를 예로 들었습니다. 생성형 AI는 업로드된 사진을 학습하여 비슷한 집을 검색할 수 있습니다. 한편 Oracle Database는 가격, 위치 등이 유사한 주택들에 대한 비즈니스 데이터를 불러옵니다. AI는 해당 데이터를 활용하여 업로드된 집 사진과 비슷하고, 구매자가 원하는 가격대 및 지역과 일치하는 매물을 빠르게 검색할 수 있습니다. 이는 데이터 검색 및 사용 방식의 큰 변화를 보여주는 작은 사례라고 Loaiza는 말했습니다. "바로 이곳이 데이터의 세계와 생성형 AI의 세계가 서로 맞닿는 지점입니다."
뒤이어 Cohere의 CEO인 Aidan Gomez가 무대에 올라 Loaiza와 합류하였습니다. Cohere는 기업의 AI 활용을 지원하기 위한 LLM을 구축하고 있는 기업입니다. Gomez는 생성형 AI의 기반인 트랜스포머(Transformer) 아키텍처의 공동 발명자 중 한 명입니다. 그는 Oracle Database 23c의 AI 벡터 검색 기능을 검색 증강 생성(retrieval-augmented generation, RAG)이라는 Oracle Database 23c의 또 다른 신기능과 결합하면 AppDev 생산성의 새로운 시대를 열 수 있을 것이라는 예측에 동의하였습니다. RAG는 벡터를 사용하여 LLM과 기업별 자체 비즈니스 데이터를 결합함으로써 자연어 질문에 보다 나은 답변을 제공할 수 있는 획기적인 생성형 AI 기술입니다. Gomez는 Cohere 엔지니어들이 RAG를 흥미롭다고 느끼는 두 가지 이유를 이야기했습니다. RAG는 특정 기업용 LLM이 해당 기업이 유출을 극도로 꺼리는 민감한 엔터프라이즈 데이터를 LLM 학습용 데이터에 직접 포함시키지 않고도 엑세스할 수 있도록 만들어 줍니다. 또한 RAG는 LLM이 잘못된 정보를 마치 사실인 것처럼 제시하는, AI 환각(hallucinations) 현상이라는 민감한 문제를 해결하는 데에도 도움을 줍니다.
RAG를 사용하면 LLM이 답변을 생성하며 참고한 정보의 출처를 함께 제공할 수 있습니다. 따라서 엔터프라이즈 애플리케이션 사용자들은 AI 출력물의 환각 현상 유무를 쉽게 확인할 수 있습니다. "이제 RAG를 통해 AI가 참고한 정보의 출처를 제공할 수 있게 되었고, 이는 AI의 신뢰도 향상에 도움을 줍니다." Gomez는 말했습니다.
Oracle Database에 AI 벡터 검색과 RAG를 도입함으로써 사용자들은 간단한 API를 통해 자체 애플리케이션과 워크플로에 생성형 AI 기능을 추가할 수 있게 되었고, 기존의 보안성, 성능, 비용상의 이점 또한 그대로 누릴 수 있을 것이라고 Loaiza는 말했습니다.
Loaiza는 자신의 팀이 한 단계 더 나아가 로코드 플랫폼인 Oracle APEX 및 SQL Developer 등의 Oracle Database 도구들에도 생성형 AI 기능을 탑재하는 작업을 진행 중에 있다고 말했습니다. 개발자들은 해당 도구들을 사용하여 직접 코드를 작성할 필요 없이 자연어를 사용하여 애플리케이션 또는 SQL 쿼리를 생성할 수 있습니다. "우리는 생성형 AI를 사용하여 생산성을 개선하기 위한 여러 프로젝트를 진행하고 있습니다." Loaiza의 말입니다.
또한 Loaiza는 데이터 전문가, 개발자, 데이터 사용자가 데이터와 상호 작용하는 방식을 단순화하는 데 집중하고 있다고 말했습니다. 앞으로 Oracle 개발 도구들은 개발자가 입력한 자연어를 기반으로 애플리케이션의 '청사진'을 생성해 줄 것입니다. 개발자는 직접 코딩하는 대신 개발 도구에 본인이 의도하는 결과를 선언하는 방식으로 원하는 애플리케이션의 초안을 작성할 수 있습니다.
Loaiza는 개발자가 애플리케이션에서 JSON 및 관계형 데이터 유형의 장점들을 함께 활용할 수 있도록 지원하는 JSON 관계형 이중성(JSON-Relational Duality) 기능을 비롯해 Oracle의 플래그십 데이터베이스와 관련된 다른 주요 개발 내역들에 대해서도 자세히 설명했습니다. "JSON 문서는 개발자가 완전한 기능 모음을 갖춘 애플리케이션을 통해 사용하고자 하는 데이터 유형 중 하나일 뿐입니다." Loaiza는 말했습니다. 개발자들은 관계형 데이터, 그래프, 공간, 블록체인을 비롯해 최근 각광받고 있는 벡터 데이터도 함께 사용할 수 있기를 원합니다.
이러한 모든 데이터 유형을 개별적으로 관리하면 애플리케이션의 복잡성은 높아지고 보안성은 낮아질 수 있다고 Loaiza는 말합니다. 완전한 기능 모음을 갖춘 하나의 컨버지드 데이터베이스로 모든 데이터 유형을 통합함으로써 애플리케이션 개발을 간소화할 수 있습니다. "Oracle Database 23c는 개발을 간소화하고 데이터 사용을 지원하는 LLM 도구들을 제공합니다. Oracle Database 23c를 통해 데이터베이스가 개발자와 데이터 전문가의 작업을 도울 수 있는 모든 구체적인 방법을 확인할 수 있습니다." Loaiza는 말했습니다. "정말 큰 변화들이 일어나고 있고, Oracle은 그 모든 변화를 하나의 서비스로 통합하는 중입니다."
Oracle의 데이터베이스 제품들에 대한 각종 데모와 사례, Oracle의 미션 크리티컬 데이터베이스 기술 담당 EVP인 Juan Loaiza의 Oracle CloudWorld 기조연설 등을 살펴보세요.
세상에서 가장 강력한 데이터베이스, Oracle Database의 최신 버전인 Oracle Database 23c에 대해 더 자세히 살펴보세요.