검색 결과가 없습니다

검색어와 일치하는 결과가 없습니다.

원하시는 정보를 찾는 데 도움이 되도록 다음을 시도해 보십시오.

  • 검색에 사용하신 키워드의 철자가 올바른지 확인하십시오.
  • 입력한 키워드에 동의어를 사용하십시오. 예를 들어 “소프트웨어” 대신 “애플리케이션”을 사용해 보십시오.
  • 아래에 표시된 인기 검색어 중 하나를 사용해 보십시오.
  • 새로운 검색을 시작하십시오.
인기 질문

데이터 웨어하우스란 무엇인가?

데이터 웨어하우스는 비즈니스 인텔리전스(BI) 활동, 특히 분석 작업을 지원하도록 설계된 일종의 데이터 관리 시스템입니다. 데이터 웨어하우스는 오로지 쿼리와 분석을 수행하기 위해 개발된 것으로, 주로 대량의 과거 데이터를 포함합니다. 데이터 웨어하우스에 있는 데이터는 일반적으로 애플리케이션 로그 파일이나 트랜잭션 애플리케이션과 같은 다양한 출처에서 수집됩니다.

데이터 웨어하우스는 여러 출처에서 수집된 대량의 데이터를 한데 모아 통합합니다. 데이터 웨어하우스의 분석 능력을 통해 조직은 데이터에서 가치 있는 비즈니스 인사이트를 도출하여 의사 결정을 개선할 수 있습니다. 데이터 웨어하우스는 데이터 과학자와 비즈니스 애널리스트에게 매우 유용한 기록을 오랫동안 축적합니다. 이러한 기능 덕분에 데이터 웨어하우스는 조직의 “진실된 단일 공급자”라고 볼 수 있습니다.

일반적으로 데이터 웨어하우스는 다음과 같은 요소들을 포함합니다.

  • 데이터의 저장 및 관리를 위한 관계형 데이터베이스
  • 분석에 사용할 데이터 준비를 위한 추출, 적재, 변환(ELT) 솔루션
  • 통계 분석, 보고 및 데이터 마이닝 기능
  • 비즈니스 사용자를 위한 데이터 시각화 및 표시를 위한 클라이언트 분석 툴
  • 머신 러닝 및 AI 알고리즘을 적용하여 실행 가능한 정보를 생성하는
  • 기타 고급 분석 애플리케이션

귀사의 OLTP 환경에 대한 분석을 수행해 보십시오.

데이터 웨어하우스는 데이터 분석, 특히 과거 데이터의 분석에 사용되는 관계형 환경입니다. 조직들은 데이터 웨어하우스를 사용하여 오랫동안 축적된 자사의 데이터 속에서 패턴과 관계를 파악할 수 있습니다.

반면에 트랜잭션 환경은 트랜잭션을 지속적으로 처리하는 데 사용되며, 주로 주문 입력이나 재무 및 소매 트랜잭션에 사용됩니다. 트랜잭션 환경은 과거 데이터를 기반으로 하지 않습니다. 사실, OLTP 환경에서 과거 데이터는 성능 개선을 위해 보관되거나 아예 삭제되는 경우도 많습니다.

데이터 웨어하우스와 OLTP 시스템에는 큰 차이점이 있습니다.

Data Warehouse OLTP 시스템
워크로드 Ad-hoc 쿼리와 데이터 분석을 수용합니다. 사전 정의된 작업만 지원합니다.
데이터 변경 자동 업데이트를 주기적으로 수행합니다. 개별 문을 발행하는 최종 사용자에 의해 업데이트됩니다.
스키마 설계 부분적으로 비정규화된 스키마를 사용하여 성능을 최적화합니다. 완전 정규화된 스키마를 사용하여 데이터 일관성을 보장합니다.
데이터 스캐닝 수천에서 수백만 개의 열을 포함합니다. 한 번에 몇 개의 레코드에만 액세스할 수 있습니다.
과거 데이터 수개월 내지 수년에 걸쳐 축적된 데이터를 저장합니다. 수주 내지 수개월 동안 축적된 데이터만 저장합니다.

데이터 웨어하우스, 데이터 마트 및 오퍼레이션 데이터 스토어

역할은 비슷해 보이지만 데이터 웨어하우스는 데이터 마트나 오퍼레이션 데이터 스토어(ODS)와 다릅니다. 데이터 마트는 기능 면에서는 데이터 웨어하우스와 동일하나 적용 범위가 보통 단일 부서나 LOB로 제한됩니다. 덕분에 데이터 마트가 데이터 웨어하우스에 비해 구축하기가 더 쉽습니다. 그러나 수많은 데이터 마트 사이에서 데이터를 일정하게 관리하고 제어하기가 어렵기 때문에 일관성 문제가 발생하기 쉽습니다.

ODS는 일일 작업만 지원하기 때문에 과거 데이터를 확인하는 것이 매우 제한적입니다. ODD는 현재 데이터의 소스로는 매우 유용하기 때문에 데이터 웨어하우스에서 이러한 용도로 자주 이용되기는 하지만, 히스토리적으로 풍부한 쿼리를 지원하지는 않습니다.

데이터 레이크가 필요한가?

조직들은 다양한 출처에서 수집되는 대량의 데이터에 대해 데이터 레이크와 데이터 웨어하우스를 모두 사용합니다. 데이터 레이크나 데이터 웨어하우스를 사용하는 시점은 조직이 데이터를 활용하는 목적에 따라 달라집니다. 다음은 데이터 레이크와 데이터 웨어하우스를 가장 효율적으로 사용하는 방법에 대한 설명입니다.

  • 데이터 레이크는 특정한 목적으로 나중에 사용될 이질적이고 필터링되지 않은 대량의 데이터를 저장합니다. LOB 애플리케이션, 모바일 앱, 소셜 미디어, IoT 기기 등에서 오는 데이터는 미가공 데이터로서 데이터 레이크 내에 저장됩니다. 다양한 데이터세트의 구조, 무결성, 선택 및 형식은 사용자가 분석을 수행할 때 얻어집니다. 다수의 출처에서 수집된 포맷되지 않은 비정형 데이터를 향후 특정 용도로 사용하기 위해 이를 저장할 저렴한 스토리지를 찾는 조직에게는 데이터 레이크가 가장 적합한 선택일 수 있습니다.
  • 데이터 웨어하우스는 데이터 분석용으로 개발되었습니다. 데이터 웨어하우스 내 분석 처리는 분석 기반 인사이트의 생성을 위해 준비, 수집, 컨텍스트화 및 변형된 데이터를 대상으로 수행됩니다. 데이터 웨어하우스는 또한 다양한 소스에서 수집된 대량의 데이터를 처리하는 데도 유용합니다. 사업 전반의 여러 출처에서 수집된 과거 데이터를 기반으로 고급 데이터 분석을 수행해야 하는 조직의 경우에는 데이터 웨어하우스가 더 적합할 가능성이 높습니다.

데이터 웨어하우스의 이점

데이터 웨어하우스는 조직이 대량의 이종 데이터를 분석하여 이로부터 상당한 가치를 얻고 과거 기록을 유지할 수 있게 해주는 매우 중요하고 특별한 이점을 제공합니다.

이러한 중요한 이점을 제공할 수 있는 것은 (데이터 웨어하우스의 아버지라고 불리는 컴퓨터 과학자 윌리엄 인먼(William Inmon)이 설명한) 데이터 웨어하우스의 네 가지 특성에서 기인합니다. 이 정의에 따르면, 데이터 웨어하우스는 다음과 같은 특성을 지닙니다.

  • 주체 지향(subject-oriented). 특정 주체 또는 기능 영역(세일즈 등)에 관한 데이터를 분석할 수 있습니다.
  • 통합성(Integrated). 데이터 웨어하우스는 서로 다른 출처로부터 얻은 다양한 데이터 유형 간 일관성을 제공합니다.
  • 비휘발성(Nonvolatile). 데이터 웨어하우스 안에 저장된 데이터는 안정적이며, 변하지 않습니다.
  • 시변성(time-variant). 데이터 웨어하우스 분석은 시간에 따른 변화를 관찰합니다.

탄탄하게 설계된 데이터 웨어하우스는 쿼리를 매우 신속하게 수행하고 높은 데이터 처리율을 제공하며 최종 사용자가 전체적으로든 매우 세밀한 수준에서든 다양한 요구를 만족하기 위해 상세한 검사를 수행할 수 있도록 데이터를 “슬라이싱/다이싱” 처리하거나 데이터 볼륨을 충분히 줄일 수 있는 유연성을 제공할 것입니다.— 데이터 웨어하우스는 최종 사용자에게 보고서, 대시보드 및 기타 인터페이스를 제공하는 미들웨어 BI 환경에 대한 기능적 기초로서의 역할을 수행합니다.

Data Warehouse Architecture

데이터 웨어하우스의 아키텍처는 해당 조직의 구체적인 요구사항에 따라 결정됩니다. 공통적인 아키텍처는 다음과 같습니다.

  • 단순성 모든 데이터 웨어하우스는 메타데이터, 요약 데이터 및 미가공 데이터가 웨어하우스의 중앙 리포지터리 내에 저장되는 기본 설계를 공유합니다. 리포지터리는 한 쪽에서는 데이터 소스로부터 데이터를 공급 받고 다른 한 쪽에서는 분석, 보고, 마이닝을 하려는 최종 사용자에 의해 액세스 됩니다.
  • 스테이징 영역을 통한 간소화 운영 데이터는 웨어하우스에 저장되기 전에 분류와 처리 과정을 거쳐야 합니다. 이러한 과정은 프로그래밍을 통해서도 가능하지만 다수의 데이터 웨어하우스는 데이터 준비를 간소화하기 위해 데이터가 웨어하우스에 들어오기 전에 데이터를 위한 스테이징 영역을 추가합니다.
  • 허브 앤 스포크(hub and spoke) 중앙 리포지터리와 최종 사용자 사이에 데이터 마트를 추가하면 조직은 자사의 데이터 웨어하우스가 다양한 LOB에 적용되도록 맞춤화할 수 있습니다. 사용 준비가 끝난 데이터는 해당 데이터 마트로 옮겨집니다.
  • 샌드박스 샌드박스는 기업들이 데이터 웨어하우스의 공식적인 규칙과 프로토콜을 따를 필요 없이 새로운 데이터세트나 데이터 분석 방법을 신속하게 비공식적으로 탐색할 수 있게 해주는 안전한 프라이빗 영역입니다.

데이터 웨어하우스의 진화—데이터 분석에서 AI 및 머신 러닝까지

데이터 웨어하우스가 1980년대 후반 처음 등장했을 때 데이터 웨어하우스의 목적은 운영 시스템에서 의사결정 지원 시스템(DSS)으로의 데이터 흐름을 돕는 것이었습니다. 이 당시의 데이터 웨어하우스에는 방대한 양의 중복성이 필요했습니다. 대부분의 조직들은 다양한 사용자들에게 서비스를 제공하기 위해 다수의 DSS 환경을 운영했습니다. 이러한 DSS 환경들은 동일한 데이터를 상당 수 사용했음에도 불구하고 데이터의 수집, 분류 및 통합은 각 환경에서 중복되는 경우가 많았습니다.

데이터 웨어하우스의 효율성이 높아지면서 데이터 웨어하우스는 기존의 BI 플랫폼을 지원하는 정보 스토어에서 벗어나 운영 분석이나 성능 관리와 같은 다양한 애플리케이션을 지원하는 광범위한 분석 인프라로 진화했습니다.

데이터 웨어하우스는 시간이 지나면서 비즈니스에 점점 더 많은 부가 가치를 제공하는 방향으로 발전해 왔습니다.

단계 용량 비즈니스 가치
1 트랜잭션 리포팅 관계 정보를 제공하여 비즈니스 성과의 스냅샷을 생성합니다.
2 슬라이싱/다이싱, Ad-hoc 쿼리, BI 툴 보다 심층적인 인사이트와 견고한 분석을 위해 기능을 확장합니다.
3 향후 성능 예측(데이터 마이닝) 시각화 및 전향적 비즈니스 인텔리전스를 개발합니다.
4 전술적 분석(공간, 통계) “what-if” 시나리오를 통해 보다 종합적인 분석에 기반한 실용적 의사결정을 위한 정보를 제공합니다.
5 수개월 내지 수년에 걸쳐 축적된 데이터를 저장합니다. 수주 내지 수개월 동안 축적된 데이터만 저장합니다.

이러한 다섯 가지 단계를 지원하는 과정에서 데이터세트의 종류도 증가했습니다. 특히 마지막 세 단계에서는 훨씬 더 광범위한 데이터와 분석 능력이 반드시 필요합니다.

오늘날 AI와 머신 러닝은 거의 모든 산업과 서비스 및 엔터프라이즈 자산을 변화시키고 있으며, 데이터 웨어하우스도 예외는 아닙니다. 빅데이터의 사용이 확대되고 새로운 디지털 기술이 적용되면서 데이터 웨어하우스에 대한 요구사항과 기능에도 큰 변화가 일어나고 있습니다.

자율 운영 데이터 웨어하우스는 이러한 진화의 최종 단계로서, 기업은 이를 통해 자사의 데이터로부터 훨씬 더 큰 가치를 얻으면서 동시에 비용은 낮추고 데이터 웨어하우스의 신뢰성과 성능을 높일 수 있습니다.

자율 운영 데이터 웨어하우스에 대해 자세히 알아보고귀사의 자율 운영 데이터 웨어하우스를 시작해 보십시오..

데이터 웨어하우스 설계

조직이 데이터 웨어하우스 설계를 할 때는 먼저 자사의 구체적인 비즈니스 요구사항을 정의하고 범위를 정하며 개념적 설계의 초안을 작성해야 합니다. 이후 조직은 해당 데이터 웨어하우스에 대한 논리 및 물리 설계를 작성할 수 있습니다. 논리 설계는 객체 간 관계와 관련이 있고, 물리 설계는 해당 객체들을 저장하고 조회하는 최적의 방법과 관련이 있습니다. 물리 설계는 또한 전송, 백업 및 복구 프로세스를 포함합니다.

모든 데이터 웨어하우스 설계는 다음 항목을 다뤄야 합니다.

  • 구체적인 데이터 콘텐츠
  • 데이터 그룹 내 관계 및 그룹 간 관계
  • 해당 데이터 웨어하우스를 지원할 시스템 환경
  • 요구되는 데이터 변환 유형
  • 데이터 리프레시 주기

이러한 설계에서의 일차적인 요소는 최종 사용자의 요구사항입니다. 대부분의 최종 사용자들은 분석을 수행하고 개별 트랜잭션이 아닌 전체 데이터를 보는 데 관심이 있습니다. 그러나 최종 사용자들은 구체적인 요구사항이 생기기 전까지는 자신이 정확히 무엇을 원하는지 모르는 경우가 많습니다. 따라서 계획 수립 과정에는 요구사항을 예측하기 위한 충분한 탐색 과정이 포함되어야 합니다. 마지막으로, 데이터 웨어하우스 설계는 최종 사용자의 진화하는 요구사항에 보조를 맞출 수 있도록 확장과 진화를 위한 공간을 남겨놓아야 합니다.

클라우드 및 데이터 웨어하우스

클라우드 내 데이터 웨어하우스는 온프레미스 데이터 웨어하우스와 동일한 특징과 이점을 제공할 뿐만 아니라 유연성, 확장성, 민첩성, 보안, 비용 절감과 같은 클라우드 컴퓨팅의 이점도 제공합니다. 클라우드 데이터 웨어하우스는 기업들이 데이터 웨어하우스를 지원하기 위한 하드웨어 및 소프트웨어 인프라를 구축하고 관리하는 대신, 자사의 데이터에서 가치를 창출하는 데 전념할 수 있게 해줍니다.

오라클 클라우드 및 데이터 웨어하우스에 대해 알아보기 (PDF)

복잡성을 완전히 없앤 배포 방식: 자율 운영 데이터 웨어하우스

가장 최근에 등장한 데이터 웨어하우스 유형은 자율 운영 데이터 웨어하우스입니다. 이 웨어하우스는 AI와 머신 러닝을 기반으로 수작업의 필요성을 없애고 설정, 배포 및 데이터 관리를 간소화합니다. 클라우드에서 서비스 형태로 제공되는 자율 운영 데이터 웨어하우스는 데이터베이스 관리, 하드웨어 구성/관리, 또는 소프트웨어 설치 과정에서 인적 개입을 요하지 않습니다.

데이터 웨어하우스의 생성, 데이터베이스의 백업, 패치 작업 및 업그레이드, 데이터베이스의 확장 또는 축소 작업이 모두 자동으로 수행되며, 클라우드 플랫폼이 제공하는 것과 동일한 수준의 유연성, 확장성, 민첩성 및 비용 감소 효과를 제공합니다. 자율 운영 데이터 웨어하우스는 복잡성을 제거하고 신속한 배포 과정을 지원하며 여유 리소스를 늘려주므로 조직이 비즈니스 가치를 창출하는 데 집중할 수 있습니다.

Oracle Autonomous Data Warehouse

Oracle Autonomous Data Warehouse는 사용하기 쉬운 완전한 자율운영 데이터베이스로서, 유연하게 확장되고 빠른 쿼리 성능을 지원하며, 데이터베이스를 따로 관리할 필요가 없습니다. Oracle Autonomous Data Warehouse는 매우 간편하고 신속하게 설정할 수 있습니다.

Oracle Autonomous Data Warehouse 자세히 알아보기 (PDF)