데이터 마트란 무엇인가?

데이터 마트의 정의

데이터 마트는 단일 주제 또는 LOB에 초점을 맞춘 단순한 형태의 데이터 웨어하우스입니다. 귀사의 팀은 데이터 마트를 사용해 데이터에 빠르게 액세스하고, 인사이트를 신속하게 얻을 수 있습니다. 복잡한 데이터 웨어하우스 또는 다양한 소스로부터 수동으로 집계된 데이터 내에서 원하는 데이터를 탐색하느라 시간을 낭비할 필요가 없기 때문이죠.

데이터 마트를 만드는 이유

데이터 마트는 기업 내 특정 팀 또는 LOB가 요청한 데이터에 대한 보다 손쉬운 액세스를 제공합니다. 예를 들어 마케팅 팀이 휴가 시즌 캠페인의 성과 개선에 도움이 될 데이터를 찾고 있다면, 여러 시스템에 흩어져 있는 데이터를 솎아내고 결합하는 작업이 시간, 정확도, 무엇보다도 비용 측면에서 더 큰 이익을 안겨줄 것입니다.

여러 소스에 흩어진 데이터 위치를 파악하는 일을 하는 팀의 경우, 데이터를 공유하고 협업하는 일에 스프레드시트를 주로 활용할 것입니다. 이와 같은 작업은 보통 인적 오류, 혼란, 복잡한 조정, 여러 개의 소스 저장소 등의 문제를 유발해 소위 말하는 '스프레드시트 악몽'을 초래하죠. 데이터 마트는 필요한 데이터가 보고서, 대시보드 및 시각화 자료로 생성되기 전에 수집 및 정리되는 중앙화된 공간으로 널리 활용되고 있습니다.

데이터 마트, 데이터 레이크 및 데이터 웨어하우스의 차이점

데이터 마트, 데이터 레이크 및 데이터 웨어하우스는 각기 다른 목표 및 니즈를 충족시킵니다.

데이터 웨어하우스는 기업 전체에 대한 비즈니스 인텔리전스 및 분석을 지원하도록 설계된 데이터 관리 시스템입니다. 데이터 웨어하우스에는 보통 기록 데이터를 포함한 방대한 데이터가 담겨있죠. 일반적으로 데이터 웨어하우스 내에 저장된 데이터는 애플리케이션 로그 파일, 트랜잭션 애플리케이션 등 광범위한 소스로부터 추출된 것들입니다. 데이터 웨어하우스는 보통의 경우 그 목적이 명확히 정의된, 구조화된 데이터를 보관합니다.

데이터 레이크는 기업이 많은 양의 정형 및 비정형 데이터(예: 소셜 미디어 또는 클릭스트림 데이터)를 저장하고, 이를 실시간 분석, 데이터 과학 및 머신러닝 사용 사례에 즉시 이용할 수 있게 해줍니다. 데이터 레이크를 사용하면 형식의 변경 없이 데이터를 원본 형식 그대로 수집할 수 있습니다.

데이터 레이크와 데이터 웨어하우스의 주된 차이점은 데이터 레이크에는 사전 정의된 구조 없이 방대한 양의 원시 데이터가 그대로 저장된다는 것입니다. 기업은 데이터의 쓰임새를 미리 파악하고 있을 필요가 없으니까요.

데이터 마트는 영업, 재무, 마케팅 등 단일 주제 또는 LOB에 중점을 둔 단순한 형태의 데이터 웨어하우스입니다. 그렇기 때문에 데이터 마트는 데이터 웨어하우스보다 적은 소스로부터 데이터를 수집합니다. 데이터 마트의 소스에는 내부 운영체제, 중앙 데이터 웨어하우스, 외부 데이터가 포함됩니다.

데이터 마트의 이점

팀 또는 특정 LOB 전용 데이터 마트는 다음과 같은 여러 이점을 제공합니다:

  • SSOT. 데이터 마트의 중앙화된 특성은 부서 또는 기업의 모든 구성원이 동일한 데이터를 기반으로 의사결정을 내릴 수 있게 해줍니다. 이와 같은 특징이 주요 이점인 이유는 데이터 및 해당 데이터를 기반으로 한 예측을 신뢰할 수 있고, 덕분에 이해관계자들은 데이터 자체에 대한 논쟁을 벌이는 대신 의사결정 도출과 조치 실행에 집중할 수 있기 때문입니다.
  • 데이터 액세스 가속화. 특정 비즈니스 팀과 사용자들은 기업 데이터 웨어하우스 내 필요한 데이터의 하위 집합에 신속하게 액세스할 수 있습니다. 그리고 이를 다양한 소스로부터 수집한 데이터와 결합할 수 있죠. 원하는 데이터 소스에 대한 연결이 설정되면, 이들은 주기적인 데이터 추출을 위해 IT 팀을 방문할 필요 없이 필요할 때마다 데이터 마트로부터 라이브 데이터를 얻을 수 있습니다. 그 결과 귀사의 비즈니스 및 IT 팀 모두 생산성 향상이라는 성과를 얻게 되죠.
  • 빠른 의사결정을 가능케 하는 빠른 인사이트. 데이터 웨어하우스가 엔터프라이즈급 의사결정을 가능하게 한다면, 데이터 마트는 부서 수준의 데이터 분석을 가능하게 합니다. 분석가들은 재무, HR 등의 영역이 직면한 특정 도전과 기회에 집중해, 데이터에서 인사이트를 더욱 신속하게 도출합니다. 덕분에 더욱 현명하고 빠른 의사결정을 내릴 수 있죠.
  • 보다 단순하고 신속한 구현. 기업 전체의 요구사항을 충족시킬 기업 데이터 웨어하우스를 구축하는 일은 상당한 시간과 노력이 필요한 일입니다. 반면 데이터 마트는 몇 개의 데이터 세트에 대한 액세스만 요구하는 특정 비즈니스 팀의 요구사항에 중점을 둘 수 있죠. 따라서 구현도 훨씬 간편하고 신속합니다.
  • 민첩하고 확장 가능한 데이터 관리 구현. 데이터 마트는 과거 프로젝트에서 수집한 정보를 현재 작업을 지원하는 데 활용할 수 있게 하는 등 비즈니스 요구 사항에 맞는 민첩한 데이터 관리 시스템을 제공합니다. 팀은 신규 분석 프로젝트 및 진행 중인 분석 프로젝트를 기반으로 데이터 마트를 업데이트 및 변경할 수 있죠.
  • 임시 분석. 일부 데이터 분석 프로젝트는 단기간 진행됩니다. 예를 들어, 팀 미팅에 앞서 2주간의 프로모션을 위한 특정 온라인 판매 분석을 완료하는 프로젝트가 포함되죠. 팀은 이와 같은 프로젝트 수행을 위해 신속하게 데이터 마트를 설정할 수 있습니다.

데이터 마트를 클라우드로 이전하기

비즈니스 팀은 민첩성과 데이터를 중심에 두는 전략을 통해 전략을 이끌고 매일매일의 의사결정을 개선하고자 합니다. 그러나 보통은 그 어느 때보다 거대하게 쌓여가는 데이터를 인사이트로 전환하는 데 어려움을 겪죠. CFO는 하루 평균 2.24시간을 스프레드시트를 솎아내는 데 소비합니다. 일반적으로 비즈니스 팀이 IT 팀에 도움을 요청한다 하더라도, IT 팀이 비즈니스 사용자들의 서로 다른 데이터 소스, 방대한 양의 데이터, 더 빠른 쿼리 시간 등에 대한 액세스 확대 요구를 충족하기가 어려울 수 있습니다.

데이터 마트 설정은 이미 엄청난 워크로드에 시달리는 IT 팀에게도 우려사항일 수 있습니다. 데이터 마트를 정기적으로 관리하고 동시에 데이터 보안도 확보해야 하기 때문이죠. 데이터 마트를 클라우드로 이전하면 관리 및 보안 업무를 클라우드 서비스 제공업체로 이전할 수 있기 때문에 비즈니스 및 IT 팀의 우려를 완화하는 데 도움이 될 수 있습니다. 이를 통해 직접적인 개입의 필요성은 물론 운영 비용도 줄일 수 있죠.

Oracle Autonomous Database가 클라우드 데이터 마트를 지원하는 방법

Oracle은 완전한 셀프 서비스 솔루션을 제공해 비즈니스 팀이 신속한 의사결정을 위해 필요한 깊이 있고 신뢰할 수 있는 데이터 중심의 인사이트를 확보할 수 있게 해줍니다.

비즈니스 팀은 통합 데이터베이스 내에 공간, 그래프를 포함한 다양한 소스 및 형식 전반에 필요한 모든 데이터를 신속하게 통합할 수 있습니다. 이를 통해 데이터 마트가 제공한 SSOT에서 안전한 협업을 진행할 수 있죠. 분석가들은 셀프 서비스 데이터 도구와 코딩이 필요 없는 내장된 머신러닝을 손쉽게 활용하여 데이터 로드, 변환 및 준비 과정의 속도를 높이고, 패턴과 추세를 자동으로 파악 및 예측하고, 투명한 계보를 갖춘 데이터를 기반으로 인사이트를 확보할 수 있습니다.

안전하게 관리되는 Oracle의 솔루션은 IT 팀이 위험을 줄일 수 있게 해주죠. IT 팀은 비즈니스 부서로부터의 모든 데이터 분석 요청에 보다 간편하고, 안정적이며, 반복 가능한 접근 방식을 취함으로써 생산성을 크게 끌어올릴 수 있습니다.

분석 및 데이터 웨어하우징을 위한 Oracle Autonomous Database는 프로비저닝, 구성, 보안, 튜닝, 확장, 패치 적용, 백업 및 복구를 지능적으로 자동화합니다. 그 결과 인적 오류가 발생할 수 있는 거의 모든 수동 작업과 복잡한 작업들이 제거되죠. 기본 내장된 데이터 도구들은 데이터 마트를 위한 간편한 셀프 서비스 데이터 로딩, 데이터 변환, 비즈니스 모델링, 자동 인사이트 추출을 가능하게 해줍니다. DBA는 일상적인 데이터베이스 관리 노력을 새로운 애플리케이션 설계 노력으로 전환하고, 비즈니스 부서가 목표를 달성하도록 도울 수 있습니다. 재무, HR, 마케팅 분야의 비즈니스 사용자는 피크 시간에도 동시 사용자 수와 관계없이 데이터에 안전하게 액세스하고 높은 쿼리 성능을 일관되게 활용할 수 있습니다. Autonomous Database는 다운타임 없이 워크로드 니즈에 따라 자동으로 확장됩니다.