데이터 레이크

데이터 레이크는 모든 형식, 크기, 규모의 정형, 반정형, 비정형 데이터를 저장하고 간단하게 분석할 수 있는 저장소입니다. Oracle Cloud Infrastructure(OCI)를 통해 안전하고, 비용 효율적이고, 관리가 용이한 데이터 레이크를 구축할 수 있습니다. OCI에 구축된 데이터 레이크는 귀사가 선호하는 각종 데이터 웨어하우스 및 분석 서비스, 나아가 Data Catalog, Security, Observability 등의 다른 OCI 서비스들과의 긴밀한 통합을 지원합니다.

데이터 레이크란?(0:44)
모든 데이터, 모든 소스 지원

데이터 배치 또는 스트림 방식을 통해 귀사의 데이터를 OCI 데이터 레이크로 원활히 이전하고 분석합니다. OCI Data Integration, OCI GoldenGate, OCI Streaming 등을 활용하여 수집한 데이터를 OCI Object Storage에 저장할 수 있습니다.

데이터 사일로와 작별할 시간!

고객의 선호에 따라 OCI의 중앙 데이터 레이크에 Oracle Autonomous Data Warehouse 등 데이터베이스, MySQL HeatWave Oracle Analytics Cloud 등 분석 및 머신러닝(ML) 도구, Apache Spark 등 오픈 소스 프로젝트 도구를 통합할 수 있습니다.

AI 및 ML 활용

포괄적 AI 및 ML 서비스 세트를 활용하여 보유 중인 데이터로부터 새로운 인사이트륵 확보하고, 미래 예측을 수행하고, 운영상의 오버헤드를 낮추고, 고객 경험을 개선할 수 있습니다.

데이터 검색 및 보호

OCI Data Catalog를 통해 데이터를 카탈로그화하고, 데이터 레이크로부터 인사이트를 확보합니다. 객체 저장소에 저장된 데이터를 검색 및 쿼리할 수 있는 쿼리 도구 및 데이터베이스를 활용해 보세요.

OCI Data Lake 얼리 액세스

Oracle Cloud Infrastructure(OCI)는 올해 OCI Data Lake라는 완전 관리형 데이터 레이크 서비스를 출시할 예정입니다. 얼리 액세스를 신청하고 OCI Data Lake의 기능을 미리 체험해 보세요.

OCI에 데이터 레이크를 구축해야 하는 이유는 무엇일까요?


데이터 레이크 현대화

데이터 레이크를 통해 보다 많은 종류의 데이터를 활용할 수 있지만, 다양한 데이터를 관리하기 위해서는 추가적인 시간과 노력이 필요하기도 합니다. OCI는 완전 관리형 오픈 소스 데이터 레이크 서비스를 통해 비용 절감 및 관리 편의성을 함께 제공합니다. 따라서 사용자는 운영 비용 절감, 확장성 및 보안성 향상, 귀사의 모든 데이터를 한 곳에 통합할 수 있는 기능 등의 다양한 혜택을 누릴 수 있습니다.


데이터 웨어하우스 확장하기

데이터 웨어하우스 및 데이터 마트는 성공적인 비즈니스 운영을 위해 매우 중요한 서비스입니다. 나아가 데이터 레이크와의 통합으로 그 가치는 더욱 높아집니다. Oracle의 서비스들을 활용한 데이터베이스, 데이터 웨어하우스, 데이터 레이크 간의 통합은 단일 SQL 쿼리를 통해 다양한 위치의 데이터에 액세스할 수 있도록 만들어 줍니다. 관련 변경을 적용하거나 새로운 기술을 익힐 필요 없이, 사용 중이던 애플리케이션 및 도구를 통해 모든 데이터에 투명하게 접근 가능합니다.


Oracle 애플리케이션용 고급 분석 기능 활용

엔터프라이즈 애플리케이션이 생성한 데이터는 매우 유용하지만, 완전히 활용되는 경우는 많지 않습니다. OCI에 구축된 레이크하우스는 다양한 애플리케이션으로부터의 데이터 액세스를 단순화하고, 실적이 좋았던 분기와 나빴던 분기 사이의 평균을 구할 수 있는 정교한 분석 기능을 제공합니다.

OCI 데이터 레이크 통합 솔루션

내장된 OCI Data Integration 서비스를 통해 귀사의 데이터를 중앙화합니다.

데이터를 복제할 필요 없이 모든 소스로부터 데이터를 쿼리합니다.

사전 통합된 애플리케이션들을 통해 즉각적으로 가치를 실현합니다.

내장된 OCI Data Catalog 서비스를 통해 데이터를 카탈로그화 및 관리합니다.

세분화된 역할 기반 접근 관리 정책을 통해 데이터를 보호합니다.

Oracle 데이터 플랫폼으로 보유 중인 데이터의 잠재력을 최대한 활용

  • 트랜잭션 데이터와 분석 데이터를 결합하여 데이터 사일로화를 방지합니다.
  • Oracle IaaS 또는 Oracle SaaS를 활용하거나, 두 가지 서비스 유형을 혼합하여 귀사에 적합한 데이터 관리 체계를 구축할 수 있습니다.
  • 모든 종류의 데이터를 활용 가능한 플랫폼이 정형 데이터 및 비정형 데이터 간의 장벽을 없애 줍니다.
  • OCI 만의 장점, 그리고 다른 클라우드 서비스 업체들에 대한 개방성을 십분 활용해 보세요.
  • OCI는 열린 플랫폼입니다. 업계를 선도하는 Oracle Analytics Cloud의 보고 기능, 또는 원하는 모든 타사 분석 애플리케이션을 사용할 수 있습니다.
Oracle 데이터 플랫폼 개요 다이어그램, 하단 설명 본 다이어그램은 Oracle 데이터 플랫폼 및 데이터 소스, 통합 서비스 및 기타 데이터 이동 서비스, Oracle 모던 데이터 플랫폼의 핵심 요소, Oracle 플랫폼의 사용 효과 및 애플리케이션 개발 서비스 등을 담고 있습니다.

Autonomous Database 및 데이터 레이크 통합

Oracle Autonomous Database는 Oracle Cloud Infrastructure(OCI)뿐만 아니라 Amazon Web Services(AWS), Microsoft Azure, Google Cloud 등의 타사 인프라에 구축된 모든 데이터 레이크와의 통합을 지원합니다. 데이터를 데이터베이스로 불러오거나, 소스 객체 저장소에서 직접 데이터를 쿼리하는 두 가지 옵션을 선택 가능합니다. 양쪽 옵션 모두 동일한 도구 및 API를 통해 데이터에 액세스합니다.

해당 아키텍처는 레이크하우스 아키텍처로도 불립니다.



Autonomous Database 및 데이터 레이크 통합 다이어그램, 하단 설명 본 다이어그램은 Oracle Autonomous Database 및 다양한 데이터 소스, Oracle Autonomous Database를 함께 활용하는 아키텍처 및 그 사용 효과를 설명합니다.

MySQL HeatWave Lakehouse를 통한 전체 데이터 실시간 분석

트랜잭션, 데이터 웨어하우스 및 데이터 레이크 전반의 실시간 분석, 머신러닝을 위한 단일한 MySQL 클라우드 데이터베이스 서비스—ETL 중복의 복잡성, 대기 시간, 위험 및 비용 불필요.

* 퍼블릭 벤치마크는 여기에서 확인할 수 있습니다.



Autonomous Database 및 데이터 레이크 통합 다이어그램, 하단 설명 본 다이어그램은 Oracle MySQL HeatWave를 활용하는 데이터 플랫폼의 아키텍처, 다양한 데이터 소스, MySQL Heatwave, 그리고 예상되는 사용 효과 등을 보여줍니다.

Oracle의 관리형 오픈 소스 서비스로 데이터 레이크 구축하기

Hadoop 또는 Spark 기반 데이터 레이크를 신속하게 생성하여 귀사의 데이터 웨어하우스를 확장하고, 모든 데이터를 손쉽게 액세스 가능하면서도 비용 효율적으로 관리할 수 있습니다.



Autonomous Database 및 데이터 레이크 통합 다이어그램, 하단 설명 본 다이어그램은 Hadoop, Spark, OpenSearch 등의 Oracle 관리형 오픈 소스 서비스를 활용하는 데이터 플랫폼 아키텍처, 다양한 데이터 소스, Oracle 오픈 소스 서비스를 핵심으로 하는 구조, 기대되는 사용 효과 등을 보여줍니다.

Oracle의 데이터 레이크하우스 서비스

데이터 모션 및 통합

일관적인 실시간 트랜잭션 데이터, 효율적 배치 로드, 스트리밍 데이터를 사용하여 분석용 애플리케이션을 연결 및 확장합니다.

  • OCI Data Integration
    노코드 데이터 흐름 디자이너를 통해 복잡한 데이터 추출, 변환 및 로드 프로세스(ETL/E-LT)를 데이터 과학 및 분석용 데이터 레이크 및 웨어하우스로 단순화할 수 있습니다.
  • Oracle Data Integrator
    Data Integrator는 데이터 추출, 변환, 로드를 위한 고급 데이터 마이그레이션 도구입니다. Oracle Data Integrator는 Oracle 클라우드 데이터베이스 및 온프레미스 데이터베이스 양쪽 모두에 최적화되어 있습니다.
  • Oracle GoldenGate
    Oracle GoldenGate는 운영 및 분석 엔터프라이즈 시스템 간의 고가용성, 실시간 데이터 통합, 변경 데이터 수집, 데이터 복제, 변환 및 검증을 지원합니다.
  • OCI Streaming
    Streaming은 DevOps, 데이터베이스, 빅데이터, SaaS 애플리케이션 등으로 분류되는 수백 개의 서드파티 제품과의 즉각적인 통합을 제공합니다.

데이터 레이크

완전 관리형 데이터 서비스를 통해 보다 저렴하고 손쉽게 데이터 레이크를 구축 가능합니다.

  • OCI Data Lake
    Data Lake는 정형 및 비정형 데이터를 함께 저장할 수 있는 중앙화된 스토리지 및 메타데이터와 세밀한 통합 액세스 제어 기능을 제공합니다.
  • OCI Object Storage
    Object Storage를 통해 모든 유형의 고객 데이터를 네이티브 형식으로 저장할 수 있습니다. 확장성 및 유연성을 요하는 최신 애플리케이션 구축에 이상적인 방식입니다.
  • OCI Data Catalog
    Data Catalog는 조직 전반의 데이터 전문가들이 전사적 데이터 자산 인벤토리를 사용하여 데이터를 검색, 탐색, 관리하는 과정을 지원합니다.
  • OCI Data Flow
    Data Flow는 별도의 인프라를 배포 또는 관리하지 않고도 매우 큰 데이터 세트에 대한 처리 작업을 수행할 수 있는 완전 관리형 Apache Spark 서비스입니다. 이를 통해 개발자는 인프라 관리가 아닌 앱 개발에 집중할 수 있어 신속한 애플리케이션 제공이 가능합니다.
  • Oracle Big Data
    Big Data Service는 대량의 원시 고객 데이터를 저장 및 분석하는 데 사용되는 Hadoop 기반 데이터 레이크 서비스입니다. 관리형 서비스인 Oracle Big Data Service는 고객의 IT 운영을 단순화하는 오픈 소스 및 Oracle 부가 가치 도구를 포함하는 완전 통합형 스택과 함께 제공됩니다.

데이터 레이크하우스

OCI Integration 서비스를 통해 귀사의 데이터 레이크를 원하는 데이터 웨어하우스와 함께 활용하고, 새로운 인사이트를 확보할 수 있습니다.

  • MySQL Heatwave Lakehouse
    MySQL HeatWave Lakehouse는 데이터 레이크와의 투명한 연결성을 제공합니다. 이를 통해 사용자는 CSV, Parquet 및 Aurora/Redshift 백업 등을 포함한 다양한 파일 형식의 수백 테라바이트급 데이터를 객체 저장소 내에서 처리하고 쿼리할 수 있습니다.
  • Autonomous Database 레이크하우스 관련 기능들
    Autonomous Database는 사용자가 모든 객체 저장소(OCI, AWS, Azure, Google Cloud Platform 등)에 저장된 파일을 로드하거나 직접 쿼리할 수 있는 셀프 서비스 데이터 레이크하우스를 지원합니다. 내장된 머신 러닝, 공간, 텍스트, 그래프 분석 등의 기능을 활용하여 데이터를 별도의 장소로 이전하지 않고도 인사이트를 확보할 수 있습니다.

AI 및 머신러닝

사전 구축된 AI 모델을 통해 데이터에서 인사이트를 확보하고, 직접 AI 모델을 생성할 수도 있습니다.

  • OCI AI Services
    AI Services는 사전 구축된 머신러닝 모델을 갖춘 서비스 모음입니다. 개발자들이 애플리케이션 및 비즈니스 운영에 보다 쉽게 AI를 적용할 수 있도록 도와 줍니다. 맞춤형 AI 모델 트레이닝을 통해 보다 정확한 비즈니스적 결과를 얻을 수 있습니다.
  • OCI Data Science
    다양한 팀이 활용할 수 있도록 구축된 데이터 과학 서비스를 사용하여 머신러닝 모델을 신속하게 구축, 교육, 배포, 관리합니다.
  • Oracle Database의 머신러닝
    Oracle Database의 머신러닝은 데이터 탐색, 준비 및 대규모 머신러닝 모델링을 지원합니다.
  • MySQL HeatWave AutoML
    MySQL HeatWave AutoML에서는 사용자가 MySQL HeatWave에서 머신러닝 모델을 구축, 훈련, 배포 및 설명하는 데 필요한 모든 것이 무료로 제공됩니다.
금융 서비스
OCI 데이터 레이크하우스로 재무 포용성을 높인 Experian.
Mining
MineSense, OCI 레이크하우스를 통해 쿼리 속도 5배 가속화.
광고
Beso는 23개 온라인 소스 및 다양한 오프라인 소스의 데이터를 통합하여 100개 소스로 확장할 데이터 레이크를 구축했습니다.
스포츠 기술
Seattle Sounders는 Oracle 데이터 레이크하우스를 통해 100배 많은 데이터 관리, 10배 빠른 인사이트 생성, 데이터베이스 관리 작업 감소 등의 성과를 달성했습니다.

데이터 레이크하우스 파트너 생태계

Oracle 파트너 솔루션은 OCI 데이터 레이크하우스를 활용 및 보강합니다.

  • Accenture 로고
  • Capgemini 로고
  • Deloitte 로고
  • h2o.ai 로고
  • qubix 로고
  • Reply Technology 로고
  • Sesame Software 로고
  • wandisco 로고

Informatica는 데이터 웨어하우스 및 레이크하우스 솔루션용 데이터 통합 및 거버넌스 부문에서 가장 선호되는 파트너사입니다.

Oracle Cloud Infrastructure(OCI)에서 데이터 레이크 구축하기

모든 참조 아키텍처 보기
Oracle Playbook 시리즈

우리가 직접 편집한 Oracle의 직원, 프로세스, 시스템 전략의 비밀을 여러분과 공유하려고 합니다.

OCI 데이터 레이크하우스 시작하기

상시 무료 클라우드 서비스를 사용해보고 30일 평가판을 받으세요

Oracle은 Autonomous Data Warehouse, OCI Compute, Oracle Storage 제품군 등의 선별된 서비스들에 대한 상시 무료 체험 프로그램인 Free Tier, 또한 추가 클라우드 서비스들을 직접 선택하여 체험해볼 수 있는 미화 300 달러 상당의 무료 크레디트를 제공합니다. 자세한 내용을 확인하고 지금 바로 무료 계정에 가입해보세요.

  • Oracle Cloud 무료 체험에는 무엇이 포함되어 있나요?

    • 상시 무료
    • Autonomous Database 2개, 각 20GB
    • 컴퓨트 VM
    • 100GB 블록 볼륨
    • 10GB의 객체 스토리지

실습 랩으로 학습하기

직접 경험하는 것 만큼 좋은 학습 방법은 없습니다. 일반적 사용 시나리오를 시연하고, 유용한 데이터 레이크 구축 도구들을 소개해 주는 무료 데이터 레이크 워크샵을 체험해 보세요.

  • Autonomous Database 및 Data Catalog를 활용한 데이터 레이크 액세스

    본 워크샵에 포함된 다양한 랩에서는 Oracle Autonomous Database 및 OCI Data Catalog를 사용하여 Oracle Object Storage 버킷으로 생성된 데이터 레이크에 액세스하는 데 필요한 단계들을 안내합니다.

    데이터 레이크 액세스 랩 시작하기
  • Oracle Big Data Service 시작하기

    Big Data Service 및 OCI를 사용하여 고가용성 Hadoop 클러스터를 생성하고 모니터링하는 방법을 배워 보세요. Oracle Cloud SQL을 클러스터에 추가하고, 유틸리티 및 마스터 노드에 액세스하고, Cloudera Manager 및 Hue를 사용하여 웹 브라우저에서 클러스터에 직접 액세스하는 방법도 함께 배우실 수 있습니다.

    데이터 레이크 랩 시작하기
  • Red Bull Racing의 데이터 분석 및 머신 러닝 활용법 살펴보기

    데이터 분석 및 머신 러닝 기술을 활용하여 70년간 축적된 레이싱 데이터를 분석합니다. 어떤 레이스들은 한 치 앞을 알 수 없이 흥미진진하게 만들고, 다른 레이스들은 그와 달리 비교적 예측 가능하도록 만드는 요소는 과연 무엇인지 살펴보세요.

    데이터 분석 랩 시작하기
  • Oracle Cloud Infrastructure Anomaly Detection 시작하기

    OCI Anomaly Detection을 사용하여 맞춤형 머신 러닝 모델을 생성하는 방법을 설명합니다. 사용자가 업로드한 데이터를 가져오고, 특수 알고리즘을 사용하여 모델을 학습시키고, 클라우드 환경에 해당 모델을 배포하여 이상을 감지하는 과정을 실습하실 수 있습니다.

    이상 감지 랩 시작하기

영업 팀에 문의하기

데이터 레이크에 대해 더 자세히 알고 싶으신가요? Oracle의 전문가가 도와 드리겠습니다.

  • 다음과 같은 문의사항들에 답해드립니다.

    • Oracle 서비스를 활용하여 데이터 레이크를 구축하려면 어떻게 해야 하나요?
    • 데이터 웨어하우스로는 불가능하지만, 데이터 레이크로는 가능한 일들로는 무엇이 있나요?
    • 우리 회사의 비즈니스에 데이터 레이크를 적용함으로써 얻을 수 있는 이점으로는 어떤 것들이 있나요?