검색 결과가 없습니다

검색어와 일치하는 결과가 없습니다.

원하시는 정보를 찾는 데 도움이 되도록 다음을 시도해 보십시오.

  • 검색에 사용하신 키워드의 철자가 올바른지 확인하십시오.
  • 입력한 키워드에 동의어를 사용하십시오. 예를 들어 “소프트웨어” 대신 “애플리케이션”을 사용해 보십시오.
  • 아래에 표시된 인기 검색어 중 하나를 사용해 보십시오.
  • 새로운 검색을 시작하십시오.
인기 질문

데이터 웨어하우스 정의

데이터 웨어하우스는 비즈니스 인텔리전스(BI) 활동, 특히 분석을 활성화하고 지원하도록 설계된 데이터 관리 시스템 유형입니다. 데이터 웨어하우스는 쿼리 및 분석을 수행하기 위한 용도로만 사용되며 종종 많은 양의 기록 데이터를 포함합니다. 데이터 웨어하우스 내의 데이터는 일반적으로 애플리케이션 로그 파일 및 트랜잭션 애플리케이션과 같은 광범위한 소스에서 파생됩니다.

데이터 웨어하우스는 여러 소스의 대량 데이터를 중앙 집중화하고 통합합니다. 분석 기능을 통해 조직은 데이터에서 귀중한 비즈니스 통찰력을 도출하여 의사 결정을 개선할 수 있습니다. 시간이 지남에 따라 데이터 과학자와 비즈니스 분석가에게 귀중한 기록 레코드를 구축합니다. 이러한 기능으로 인해 데이터 웨어하우스는 조직의 “단일 신뢰 소스”로 간주될 수 있습니다.

Autonomous Data Warehouse에 대해 알아보기

일반적인 데이터 웨어하우스에는 종종 다음 요소가 포함됩니다.

  • 데이터를 저장 및 관리할 관계형 데이터베이스
  • 분석을 위해 데이터를 준비하기 위한 ELT(추출,로드 및 변환) 솔루션
  • 통계 분석,보고 및 데이터 마이닝 기능
  • 데이터를 시각화하고 비즈니스 사용자에게 제공하기 위한 클라이언트 분석 도구
  • 데이터 사이언스 및 인공 지능(AI) 알고리즘을 적용하여 실행 가능한 정보를 생성하는 기타 보다 정교한 분석 애플리케이션

데이터 웨어하우스의 이점

데이터 웨어하우스는 조직이 많은 양의 변형 데이터를 분석하고 그로부터 중요한 가치를 추출할 수 있을 뿐만 아니라 기록 데이터를 유지할 수 있도록 하는 매우 중요하고 고유한 이점을 제공합니다.

네 가지 고유한 특성(데이터 웨어하우스의 아버지로 간주되는 컴퓨터 과학자 William Inmon이 설명함)을 통해 데이터 웨어하우스는 이러한 중요한 이점을 제공할 수 있습니다. 이 정의에 따르면 데이터 웨어하우스는

  • 주제 지향적입니다. 특정 주제 또는 기능 영역(예: 판매)에 대한 데이터를 분석할 수 있습니다.
  • 통합되었습니다. 데이터 웨어하우스는 서로 다른 소스의 다양한 데이터 유형간에 일관성을 만듭니다.
  • 비 휘발성입니다. 데이터가 데이터 웨어하우스에 있으면 안정적이며 변경되지 않습니다.
  • 시간 변이적입니다. 데이터 웨어하우스 분석은 시간 경과에 따른 변화를 확인합니다.

잘 설계된 데이터웨어 하우스는 쿼리를 매우 빠르게 수행하고, 높은 데이터 처리량을 제공하고, 최종 사용자가 높은 수준이든 아주 세밀한 수준이든 다양한 요구 사항을 충족하기 위해 데이터 양을 줄이거나 “분석”할 수 있는 충분한 유연성을 제공합니다. 데이터 웨어하우스는 최종 사용자에게 보고서, 대시보드 및 기타 인터페이스를 제공하는 미들웨어 BI 환경의 기능적 기반 역할을 합니다.

데이터 웨어하우스 아키텍처

데이터 웨어하우스의 아키텍처는 조직의 특정 요구 사항에 따라 결정됩니다. 일반적인 아키텍처에는 다음이 포함됩니다.

  • 단순성. 모든 데이터 웨어하우스는 메타데이터, 요약 데이터 및 원시 데이터가 웨어하우스의 중앙 저장소에 저장되는 기본 설계를 공유합니다. 리포지토리는 한쪽 끝에서 데이터 소스로 공급되고 다른 쪽 끝에서 분석, 보고 및 마이닝을 위해 최종 사용자가 액세스합니다.
  • 준비 영역으로 간단. 운영 데이터는 웨어하우스에 넣기 전에 정리하고 처리해야 합니다. 프로그래밍 방식으로 수행할 수 있지만 많은 데이터 웨어하우스는 데이터 준비를 단순화하기 위해 데이터가 웨어하우스에 들어가기 전에 데이터를 위한 준비 영역을 추가합니다.
  • 허브 및 스포크. 중앙 저장소와 최종 사용자 사이에 데이터 마트를 추가하면 조직에서 데이터 웨어하우스를 사용자 정의하여 다양한 업무 라인에 서비스를 제공할 수 있습니다. 데이터를 사용할 준비가 되면 적절한 데이터 마트로 이동합니다.
  • 샌드박스. 샌드박스는 기업이 데이터 웨어하우스의 공식 규칙 및 프로토콜을 따르거나 준수할 필요 없이 새 데이터 세트 또는 데이터 분석 방법을 신속하고 비공식적으로 탐색할 수 있는 개인적이고 안전한 보안 영역입니다.

데이터 웨어하우스의 진화 — 데이터 분석에서 AI 및 머신 러닝까지

데이터 웨어하우스가 1980년대 후반에 처음 등장했을 때 그 목적은 운영 시스템에서 DSS(의사 결정 지원 시스템)로 데이터 흐름을 돕는 것이었습니다. 이러한 초기 데이터 웨어하우스에는 엄청난 양의 중복성이 필요했습니다. 대부분의 조직에는 다양한 사용자에게 서비스를 제공하는 여러 DSS 환경이 있습니다. DSS 환경은 동일한 데이터를 많이 사용했지만 데이터 수집, 정리 및 통합은 종종 각 환경에 대해 복제되었습니다.

데이터 웨어하우스가 더욱 효율적이 됨에 따라 기존 BI 플랫폼을 지원하는 정보 저장소에서 운영 분석 및 성능 관리와 같은 다양한 애플리케이션을 지원하는 광범위한 분석 인프라로 발전했습니다.

데이터 웨어하우스 반복은 시간이 지남에 따라 기업에 추가적인 가치를 제공하기 위해 진행되었습니다.

단계 능력 비즈니스 가치
1 거래 보고 비즈니스 성과의 스냅샷을 생성하기 위한 관계형 정보를 제공
2 분석, 임시 쿼리, BI 도구 더 깊은 통찰력과 더 강력한 분석을 위한 기능 확장
3 미래 성능 예측(데이터 마이닝) 시각화 및 미래 지향적인 비즈니스 인텔리전스 개발
4 전술적 분석(공간, 통계) 보다 포괄적인 분석을 기반으로 실질적인 결정을 내리는 “가정” 시나리오 제공
5 수개월 또는 수년간의 데이터 저장 몇 주 또는 몇 달 동안만 데이터 저장

이 다섯 단계를 각각 지원하려면 점점 더 다양한 데이터 세트가 필요했습니다. 특히 마지막 세 단계는 훨씬 더 광범위한 데이터 및 분석 기능에 대한 필수 사항을 만듭니다.

오늘날 AI 및 머신 러닝은 거의 모든 산업, 서비스 및 엔터프라이즈 자산을 변화시키고 있으며 데이터웨어 하우스도 예외는 아닙니다. 빅 데이터의 확장과 새로운 디지털 기술의 적용은 데이터 웨어하우스 요구 사항 및 기능의 변화를 주도하고 있습니다.

자율 운영 데이터 웨어하우스는 이 진화의 가장 최근 단계로, 기업이 데이터에서 더 큰 가치를 추출하는 동시에 비용을 낮추고 데이터 웨어하우스의 안정성과 성능을 향상시킬 수 있는 능력을 제공합니다.

자율 운영 데이터 웨어하우스에 대해 자세히 알아보고 나만의 자율 운영 데이터 웨어하우스를 시작해 보세요.

데이터 웨어하우스, 데이터 마트 및 운영 데이터 저장소

유사한 역할을 수행하지만 데이터 웨어하우스는 데이터 마트 및 운영 데이터 저장소(ODS)와 다릅니다. 데이터 마트는 데이터 웨어하우스와 동일한 기능을 수행하지만 일반적으로 단일 부서 또는 사업부 등 훨씬 더 제한된 범위 내에서 수행됩니다. 따라서 데이터 마트를 데이터 웨어하우스보다 쉽게 설정할 수 있습니다. 그러나 수많은 데이터 마트에서 데이터를 균일하게 관리하고 제어하기가 어려울 수 있기 때문에 불일치가 발생하는 경향이 있습니다.

ODS는 일일 작업만 지원하므로 기록 데이터 보기가 매우 제한적입니다. 현재 데이터의 소스로 매우 잘 작동하고 데이터 웨어하우스에서 자주 사용되지만 역사적으로 풍부한 쿼리를 지원하지 않습니다.

클라우드 데이터 웨어하우스란?

클라우드 데이터 웨어하우스는 클라우드를 사용하여 서로 다른 데이터 소스에서 데이터를 수집하고 저장합니다.

원래 데이터 웨어하우스는 온프레미스 서버에 구축되었습니다. 이러한 온프레미스 데이터 웨어하우스는 오늘날에도 계속해서 많은 이점을 가지고 있습니다. 경우에 따라 향상된 거버넌스, 보안 및 속도를 제공할 수 있습니다. 그러나 온프레미스 데이터 웨어하우스는 탄력적이지 않으며 향후 요구 사항에 맞게 데이터 웨어하우스를 확장하는 방법을 결정하기 위해 복잡한 예측이 필요합니다. 이러한 데이터 웨어하우스를 관리하는 것도 매우 복잡할 수 있습니다.

반면에 클라우드 데이터 웨어하우스의 몇 가지 이점은 다음과 같습니다.

  • 별도의 컴퓨팅 및 스토리지를 통한 탄력성
  • 컴퓨팅 또는 스토리지 요구 사항을 처리하기 위한 확장 기능
  • 사용 편의성
  • 관리 용이성
  • 비용 절감

최고의 클라우드 데이터 웨어하우스는 완전 관리형 및 자율 운영 방식의 데이터 웨어하우스이므로 초보자도 몇 번의 클릭만으로 데이터 웨어하우스를 생성하고 사용할 수 있습니다. 또한 대부분의 클라우드 데이터 웨어하우스는 Pay-As-You-Go 모델을 따르므로 고객은 추가적인 비용 절감 효과가 있습니다.

모던 데이터 웨어하우스란?

IT, 데이터 엔지니어링, 비즈니스 분석, 데이터 사이언스 등 어느 팀에 소속되어 있든 상관없이 조직 전체의 사용자마다 데이터 웨어하우스에 대한 요구 사항이 다릅니다.

모던 데이터 아키텍처는 모든 데이터 유형, 워크로드 및 분석을 관리하는 방법을 제공하여 이러한 다양한 요구 사항을 해결합니다. 이는 업계 모범 사례에 따라 함께 작동하는 데 필요한 구성요소가 통합되어 있는 아키텍처 패턴으로 구성됩니다. 모던 데이터 웨어하우스에는 다음이 포함됩니다.

  • 모든 데이터 유형의 관리를 간소화하고 다양한 데이터 사용 방법을 제공하는 컨버지드 데이터베이스
  • 셀프 서비스 데이터 수집 및 변환 서비스
  • SQL, 머신 러닝, 그래프 및 공간 처리 지원
  • 데이터를 이동하지 않고도 쉽게 사용할 수 있는 여러 분석 옵션
  • 간단한 프로비저닝, 확장 및 관리를 위한 자동화된 관리

모던 데이터 웨어하우스는 다른 웨어하우스가 할 수 없는 방식으로 데이터 워크플로를 효율적으로 간소화할 수 있습니다. 즉, 분석가와 데이터 엔지니어부터 데이터 과학자 및 IT 팀에 이르기까지 모든 사람이 작업을 더 효과적으로 수행하고 수많은 지연과 복잡성 없이 조직을 발전시키는 혁신적인 작업을 추구할 수 있습니다.

무료 워크샵에서 Oracle의 모던 데이터 웨어하우스 체험하기 .

데이터 웨어하우스 디자인

조직이 데이터 웨어하우스 설계를 시작하면 특정 비즈니스 요구 사항을 정의하고 범위에 동의하며 개념 설계 초안을 작성하는 것으로 시작해야 합니다. 그런 다음 조직은 데이터 웨어하우스에 대한 논리적 및 물리적 디자인을 모두 만들 수 있습니다. 논리적 디자인에는 개체 간의 관계가 포함되고 물리적 디자인에는 개체를 저장하고 검색하는 가장 좋은 방법이 포함됩니다. 물리적 디자인에는 운송, 백업 및 복구 프로세스도 포함됩니다.

모든 데이터 웨어하우스 설계는 다음 사항을 해결해야 합니다.

  • 특정 데이터 내용
  • 데이터 그룹 내 및 데이터 그룹 간의 관계
  • 데이터 웨어하우스를 지원할 시스템 환경
  • 필요한 데이터 변환 유형
  • 데이터 새로 고침 빈도

디자인의 주요 요소는 최종 사용자의 요구 사항입니다. 대부분의 최종 사용자는 분석을 수행하고 개별 트랜잭션이 아닌 집계된 데이터를 보는 데 관심이 있습니다. 그러나 종종 최종 사용자는 특정 요구가 발생할 때까지 자신이 원하는 것을 실제로 알지 못합니다. 따라서 계획 프로세스에는 요구 사항을 예상할 수 있는 충분한 탐색이 포함되어야 합니다. 마지막으로, 데이터 웨어하우스 설계는 최종 사용자의 변화하는 요구 사항에 보조를 맞추기 위해 확장 및 발전의 여지를 허용해야 합니다.

클라우드 및 데이터 웨어하우스

클라우드의 데이터 웨어하우스는 온프레미스 데이터 웨어하우스와 동일한 특성과 이점을 제공하지만 유연성, 확장성, 민첩성, 보안 및 비용 절감과 같은 클라우드 컴퓨팅의 추가 이점을 제공합니다. 클라우드 데이터 웨어하우스를 사용하면 기업이 데이터 웨어하우스를 지원하기 위해 하드웨어 및 소프트웨어 인프라를 구축하고 관리할 필요 없이 데이터에서 가치를 추출하는 데에만 집중할 수 있습니다.

오라클 클라우드 및 데이터 웨어하우스에 대해 읽어보기 (PDF)

데이터 레이크가 필요합니까?

조직은 다양한 소스의 대량 데이터를 위해 데이터 레이크와 데이터 웨어하우스를 모두 사용합니다. 둘 중 하나를 사용할 시기는 조직이 데이터로 무엇을 하려는지에 따라 결정됩니다. 다음은 각각이 가장 잘 사용되는 방법을 설명합니다.

  • 데이터 레이크는 나중에 특정 목적으로 사용할 수 있도록 필터링되지 않은 이질적인 데이터를 많이 저장합니다. LOB(기간 업무) 애플리케이션, 모바일 앱, 소셜 미디어, IoT 장치 등의 데이터는 데이터 레이크에서 원시 데이터로 캡처됩니다. 다양한 데이터 세트의 구조, 무결성, 선택 및 형식은 분석을 수행하는 사람이 분석할 때 파생됩니다. 조직이 향후 특정 목적으로 사용하려는 여러 소스의 형식화되지 않은 비정형 데이터를 위한 저비용 스토리지가 필요한 경우 데이터 레이크가 올바른 선택일 수 있습니다.
  • 데이터 웨어하우스는 특히 데이터 분석을 위한 것입니다. 데이터 웨어하우스 내의 분석 처리는 분석 기반 통찰력을 생성하기 위해 수집, 컨텍스트화 및 변환된 분석 준비가 완료된 데이터에 대해 수행됩니다. 데이터 웨어하우스는 또한 다양한 소스의 대량 데이터를 처리하는 데 능숙합니다. 조직에서 기업 전체의 여러 소스에서 기록 데이터를 가져오는 고급 데이터 분석 또는 분석이 필요한 경우 데이터 웨어하우스가 올바른 선택일 가능성이 높습니다.

OLTP 환경에 대해 분석을 실행하지 않는 이유는 무엇입니까?

데이터 웨어하우스는 특히 기록 데이터의 데이터 분석에 사용되는 관계형 환경입니다. 조직은 데이터 웨어하우스를 사용하여 시간이 지남에 따라 발전하는 데이터의 패턴과 관계를 발견합니다.

반대로 거래 환경은 지속적으로 거래를 처리하는 데 사용되며 일반적으로 주문 입력과 재무 및 소매 거래에 사용됩니다. 과거 데이터를 기반으로 하지 않습니다. 실제로 OLTP 환경에서는 성능 향상을 위해 기록 데이터가 보관되거나 단순히 삭제되는 경우가 많습니다.

데이터 웨어하우스와 OLTP 시스템은 크게 다릅니다.

데이터 웨어하우스 OLTP 시스템
워크로드 임시 쿼리 및 데이터 분석 수용 미리 정의된 작업만 지원
데이터 수정 정기적으로 자동 업데이트 최종 사용자가 개별 명세서를 발행한 업데이트
스키마 디자인 부분적으로 비정규화된 스키마를 사용하여 성능 최적화 완전히 정규화된 스키마를 사용하여 데이터 일관성 보장
데이터 스캐닝 수천에서 수백만 개의 행 포함 한 번에 소수의 레코드에만 액세스
기록 데이터 수개월 또는 수년간의 데이터 저장 몇 주 또는 몇 달 동안만 데이터 저장

제로 복잡성 배포: 자율 운영 데이터 웨어하우스

데이터 웨어하우스의 가장 최근 반복은 자율 운영 데이터 웨어하우스로, AI 및 머신 러닝에 의존하여 수동 작업을 제거하고 설정, 배포 및 데이터 관리를 단순화합니다. 클라우드의 서비스형(as-a-service) Autonomous Data Warehouse에서는 사람이 수행하는 데이터베이스 관리, 하드웨어 구성/관리 또는 소프트웨어 설치가 필요하지 않습니다.

데이터 웨어하우스 생성, 데이터베이스 백업, 패치 적용 및 업그레이드, 데이터베이스 확장 또는 축소가 모두 자동으로 수행되며—, 클라우드 플랫폼이 제공하는 것과 똑같은 유연성, 확장성, 민첩성 및 비용 절감이 가능합니다. 자율 운영 데이터 웨어하우스는 복잡성을 제거하고 배포 속도를 높이며 리소스를 확보하여 조직이 비즈니스에 가치를 더하는 활동에 집중할 수 있도록 합니다.

Oracle Autonomous Data Warehouse

Oracle Autonomous Data Warehouse는 탄력적으로 확장되고 빠른 쿼리 성능을 제공하며 데이터베이스 관리가 필요 없는 사용하기 쉬운 완전 자율 운영 데이터 웨어하우스입니다. Oracle Autonomous Data Warehouse 설정은 매우 간단하고 빠릅니다.

Oracle Autonomous Data Warehouse에 대해 자세히 알아보기 (PDF)