数据湖

数据湖是一个存储仓库,您可以存储任意格式和任意规模的结构化、半结构化和非结构化数据并轻松执行分析。借助 Oracle Cloud Infrastructure (OCI),您可以构建一个安全、经济高效且易于管理的数据湖,并将其与您的首选数据仓库和分析以及其他 OCI 服务(如数据目录、安全性和观测服务)紧密集成。

什么是数据湖?(0:44)
轻松分析任意来源的任意数据

将数据批量或以数据流的形式无缝迁移到 OCI 数据湖中,以便进行数据分析。利用 OCI Data IntegrationOCI GoldenGateOCI Streaming 摄取数据并将其存储在 OCI Object Storage 中。

打通长期存在的数据孤岛!

Oracle 可提供一个基于 OCI 运行的集中式数据湖,它集成了您所有的首选工具,包括 Oracle Autonomous Data WarehouseMySQL HeatWave 等数据库;Oracle Analytics Cloud 等分析和机器学习 (ML) 工具;以及 Apache Spark 等开源项目。

利用人工智能和机器学习技术

利用一整套全面的人工智能和机器学习服务从数据中获得新洞察、执行预测、降低运营开销和改善客户体验。

发现和保护数据

使用 OCI Data Catalog 对数据进行编目,整合数据湖洞察。通过查询工具和数据库来发现和查询对象存储中的数据。

抢先访问 OCI Data Lake

Oracle Cloud Infrastructure 今年发布了全面管理型数据湖服务 OCI Data Lake。立即注册,抢先访问 OCI Data Lake,在正式发布前体验 OCI Data Lake 的强大功能和特性。

为什么要使用基于 OCI 的数据湖?


打造现代化数据湖

数据湖虽然可以处理更多类型的数据,但管理起来非常麻烦,会占用大量时间。而 OCI 提供全托管的开源湖服务,既可以降低成本,又可以减少管理工作,将帮助您降低运营成本、提高可伸缩性和安全性,并集中整合所有现有数据。


扩展数据仓库

数据仓库和数据集市对于企业的成功至关重要。将这两者与数据湖集成可以进一步提高其价值。例如,您可以通过单个 SQL 查询从多个位置访问数据。现有应用和工具无需任何更改即可透明地访问所有数据,用户也无需学习新技能。


使用面向 Oracle 应用的高级分析

企业应用生成的数据极具价值,但这些数据很少能够得到充分利用。基于 OCI 的数据湖可以简化从多个应用访问数据的过程,并支持高级分析,从而帮助企业大幅改善业绩。

基于 OCI 的数据湖集成解决方案

使用嵌入式 OCI 数据集成集中管理数据

查询任意来源的任意数据,且不会出现重复。

预集成应用,实现即时价值。

使用嵌入式 OCI 数据目录对数据进行编目和治理

通过基于角色的细粒度访问策略保护数据安全

Oracle 数据平台充分释放数据潜能

  • 整合事务和分析数据 — 消除数据孤岛。
  • 利用 Oracle IaaS 和 Oracle SaaS(或介于这两者之间的解决方案),选择所需的控制力。
  • 将任何类型的数据导入平台 — 我们打破了结构化和非结构化数据之间的障碍。
  • 了解 OCI 的强大功能以及它对其他云技术服务提供商的开放性 — 我们随时准备好为您服务。
  • 使用 Oracle Analytics Cloud 报告或任何第三方分析应用 — OCI 具备开放性。
Oracle 数据平台概览图,说明如下 该图是 Oracle 数据平台概览图,分为数据源、数据迁移服务(如集成服务)、Oracle 现代数据平台(核心)以及结果(非必要)和应用开发服务几部分。

将 Oracle Autonomous Database 与数据湖集成

Oracle Autonomous Database 支持与数据湖集成 — 不仅可在 Oracle Cloud Infrastructure 上运行,还可在 Amazon Web Services (AWS)、Microsoft Azure、Google Cloud 等平台上运行。您可以选择将数据加载到数据库中,或者直接在源对象存储中查询数据。这两种方法都使用相同的工具和 API 访问数据。

这种架构有时也称为湖仓一体架构。



Oracle Autonomous Database 与数据湖集成图示,说明如下 该图是使用 Oracle Autonomous Database 的数据平台架构图,分为数据源、Oracle Autonomous Database 和结果三部分。

使用 MySQL HeatWave Lakehouse 实时分析所有数据

MySQL HeatWave Lakehouse 是一款 MySQL 云数据库服务,它支持事务处理、机器学习 (ML) 以及跨数据仓库和数据湖的实时数据分析,可消除提取、转换和加载 (ETL) 复制的复杂性、延迟、风险和成本。

* 点击 此处,查看公共基准。



Oracle Autonomous Database 与数据湖集成图示,说明如下 该图是使用 Oracle MySQL HeatWave 的数据平台架构图,分为数据源、MySQL Heatwave 和结果三部分。

使用 Oracle 托管的开源服务构建数据湖

快速创建基于 Hadoop 或 Spark 的数据湖,扩展数据仓库,确保轻松访问并经济高效地管理所有数据。



Oracle Autonomous Database 与数据湖集成图示,说明如下 该图是使用 Oracle 托管的开源服务(如 Hadoop、Spark 和 OpenSearch)的数据平台架构图,分为数据源、Oracle 开源服务(核心)和结果(非必要)三部分。

Oracle 数据湖服务

数据移动和集成

使用实时、一致的事务数据、高效的批量加载和流数据来连接和扩展分析应用。

  • OCI Data Integration
    使用无代码数据流设计器,简化复杂的数据提取、转换和加载流程 (ETL/E-LT),轻松地将数据“注入”数据湖和数据仓库,以供数据科学和分析使用。
  • Oracle Data Integrator
    Oracle Data Integrator 为提取、转换和加载提供高级数据迁移。Oracle Data Integrator 专门针对 Oracle 云数据库和本地部署数据库进行了优化。
  • Oracle GoldenGate
    Oracle GoldenGate 具有高可用性,支持实时数据集成、变更数据捕获、数据复制、转换,以及运营系统和分析系统间数据验证。
  • OCI Streaming
    OCI Streaming 为数百种跨类别的第三方产品提供开箱即用的集成功能,这些产品包括 DevOps、数据库、大数据和 SaaS 应用。

数据资源池

使用完全托管的数据服务,以较低的成本和较少的人力构建一个数据湖。

  • OCI Data Lake
    Data Lake 不仅能为结构化和非结构化数据提供集中式存储和元数据支持,还提供统一的细粒度访问控制特性。
  • OCI Object Storage
    OCI Object Storage 支持您以原生格式存储任意类型的数据,非常适合用于构建灵活、可扩展的现代应用。
  • OCI Data Catalog
    OCI Data Catalog 有助于企业的数据专业人员使用整个企业的数据资产清单来搜索、探究和治理数据。
  • OCI Data Flow
    OCI Data Flow 是一个全托管式 Apache Spark 服务,可高效处理超大型数据集,无需您部署或管理基础设施。这意味着开发人员不必管理基础设施,可以专注地开发进而快速交付应用。
  • Oracle Big Data
    Oracle Big Data Service 是一个基于 Hadoop 的数据湖,可用于存储和分析大量原始客户数据。作为一项托管服务,Oracle Big Data Service 随带一个全面集成的体系,其中的开源工具和 Oracle 增值工具可有效简化 IT 运营。

数据湖仓一体

利用 OCI 将数据湖与首选数据仓库集成,发现新洞察。

  • MySQL Heatwave 湖仓一体
    MySQL HeatWave 湖仓一体透明地连接至数据湖,支持用户处理和查询以各种文件格式(如 CSV、Parquet 和 Aurora/Redshift 备份)保存在对象存储中的数百 TB 数据。
  • Oracle Autonomous Database 湖仓一体功能
    Oracle Autonomous Database 提供自助数据湖仓,支持用户加载或直接查询所有对象存储(包括 OCI、AWS、Azure 和 Google Cloud Platform)中的文件。集成机器学习、空间、文本和图形分析,无需移动数据即可获得洞察。

人工智能和机器学习

利用预构建 AI 模型或者自行创建模型,从数据中获取洞察。

  • OCI AI Services
    OCI AI Services 是一组采用预构建机器学习模型的服务,可帮助开发人员更轻松地将 AI 应用到应用和业务运营中。您可以对这些模型进行自定义训练,以获得更准确的业务结果。
  • OCI Data Science
    利用专为团队构建的数据科学服务来快速构建、训练、部署和管理机器学习模型。
  • Machine Learning in Oracle Database
    Machine Learning in Oracle Database 支持规模化数据探索、准备和机器学习建模。
  • MySQL HeatWave AutoML
    MySQL HeatWave AutoML 免费为用户提供在 MySQL HeatWave 中构建、训练、部署和解释机器学习模型所需的一切资源。
金融服务
益博睿凭借 OCI 上的数据湖仓一体加快金融包容性。
挖掘
MineSense 利用基于 OCI 的湖仓一体将查询速度加快 5 倍。
广告
Beso 统一了来自 23 个线上来源和各种线下来源的数据以构建数据湖,在数据湖中将扩展至 100 个数据源。
体育科技
采用 Oracle 数据湖仓一体后,Seattle Sounders 可管理之前 100 倍的数据,洞察生成速度提高了 10 倍,数据库管理工作大幅减少。

数据湖仓一体合作伙伴生态系统

Oracle 合作伙伴解决方案利用并增强 OCI 上的数据湖仓一体。

  • 埃森哲徽标
  • Capgemini 徽标
  • Deloitte 徽标
  • h2o.ai 徽标
  • qubix 徽标
  • Reply Technology 徽标
  • Sesame Software 徽标
  • wandisco 徽标

Informatica 是数据仓库和湖仓一体解决方案的首选数据集成和治理合作伙伴。

在 Oracle Cloud Infrastructure 上采用数据湖

查看所有参考架构
Oracle Playbook 系列

我们将 Oracle 的人员、流程和系统策略的精华和秘诀编纂成册,与您共享。

开始使用基于 OCI 的数据湖

享用 Always Free 云技术服务,并试用 30 天的收费服务

Oracle 提供的免费套餐包含了 Autonomous Data Warehouse、OCI Compute 和 Oracle Storage 等服务,另外还有 300 美元的免费储值,让您可以试用更多云技术服务。立即获取详细信息并注册您的免费账户。

  • Oracle Cloud 免费套餐包含哪些内容?

    • 永久免费
    • 2 个 Autonomous Database,各 20 GB
    • 计算虚拟机
    • 100 GB 块存储卷
    • 10 GB 对象存储空间

通过动手实验室进行学习

只有亲自动手试一试,才能有效地学习。敬请参加免费数据湖研讨会。该研讨会将展示数据湖的典型应用场景,并重点介绍一些可用于构建数据湖的工具。

  • 使用 Oracle Autonomous Database 和 OCI Data Catalog 访问数据湖

    本研讨会中的动手实践将指导您使用 Oracle Autonomous Database 和 OCI Data Catalog 访问通过 Oracle Object Storage 桶创建的数据湖。

    开始数据湖访问动手实践
  • Oracle Big Data Service 快速入门

    了解如何使用 Oracle Big Data Service 和 OCI 来创建和监视高可用性 Hadoop 集群。您还将向集群中添加 Oracle Cloud SQL 并访问实用程序和主节点,了解如何使用 Cloudera Manager 和 Hue 直接在 Web 浏览器中访问集群。

    开始数据湖动手实践
  • 了解甲骨文红牛车队如何使用分析和机器学习

    甲骨文红牛车队使用分析和机器学习技术分析 70 年来的比赛数据,发现了赛车与其他更加可预测的比赛相比,让人充满兴奋感的背后原因。

    开始数据分析动手实践
  • Oracle Cloud Infrastructure Anomaly Detection 快速入门

    了解如何使用 OCI Anomaly Detection 创建自定义机器学习模型。您将获取用户上传的数据,使用专用算法来训练模型,并将模型部署到云环境中来检测异常。

    开始异常检测动手实践

联系销售

想详细了解数据湖?让我们的专家为您提供帮助。

  • 专家能为您解答以下问题:

    • 如何开始使用 Oracle 数据湖?
    • 数据湖能够提供哪些数据仓库无法提供的功能?
    • 企业能够使用数据湖获得哪些收益?

注:为免疑义,本网页所用以下术语专指以下含义:

  1. Oracle专指Oracle境外公司而非甲骨文中国。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。