数据湖是一个存储仓库,您可以存储任意格式和任意规模的结构化、半结构化和非结构化数据并轻松执行分析。借助 Oracle Cloud Infrastructure (OCI),您可以构建一个安全、经济高效且易于管理的数据湖,并将其与您的首选数据仓库和分析以及其他 OCI 服务(如数据目录、安全性和观测服务)紧密集成。
将数据批量或以数据流的形式无缝迁移到 OCI 数据湖中,以便进行数据分析。利用 OCI 数据集成、OCI GoldenGate 或 OCI 流处理摄取数据并将其存储在 OCI 对象存储中。
基于 OCI 的中央数据湖可与您的首选工具相集成,包括 Oracle ADW 业务数据平台等数据库、Oracle 分析云等分析和机器学习 (ML) 工具以及 Apache Spark 等开源项目。
Oracle Cloud Infrastructure 今年启动了称为 OCI 数据湖的全托管数据湖服务。您可以提前注册以浏览其特性和功能,然后再公开发布。
数据湖虽然可以处理更多类型的数据,但管理起来非常麻烦,会占用大量时间。而 OCI 提供全托管的开源湖服务,既可以降低成本,又可以减少管理工作,将帮助您降低运营成本、提高可伸缩性和安全性,并集中整合所有现有数据。
数据仓库和数据集市对于企业的成功至关重要。将这两者与数据湖集成可以进一步提高其价值。例如,您可以通过单个 SQL 查询从多个位置访问数据。现有应用和工具无需任何更改即可透明地访问所有数据,用户也无需学习新技能。
企业应用生成的数据极具价值,但这些数据很少能够得到充分利用。基于 OCI 的数据湖可以简化从多个应用访问数据的过程,并支持高级分析,从而帮助企业大幅改善业绩。
使用嵌入式 OCI 数据集成集中管理数据。
查询任意来源的任意数据,且不会出现重复。
预集成应用,实现即时价值。
使用嵌入式 OCI 数据目录对数据进行编目和治理。
通过基于角色的细粒度访问策略保护数据安全。
Oracle 自治数据库支持与数据湖集成 — 不仅可在 Oracle Cloud Infrastructure 上运行,还可在 Amazon Web Services (AWS)、Microsoft Azure、Google Cloud 等平台上运行。您可以选择将数据加载到数据库中,或者直接在源对象存储中查询数据。这两种方法都使用相同的工具和 API 访问数据。
这种架构有时也称为湖仓一体架构。
作为一个面向事务处理、分析和机器学习的 MySQL 数据库服务,MySQL HeatWave 数据库服务提供实时的安全分析,但不涉及提取、转换和加载 (ETL) 复制的复杂性、延迟和成本,可在 OCI、AWA 和 Azure 上使用。
* MySQL HeatWave 湖仓一体目前出于测试阶段。
** 点击 此处,查看公共基准。
快速创建基于 Hadoop 或 Spark 的数据湖,扩展数据仓库,确保轻松访问并经济高效地管理所有数据。
使用实时、一致的事务数据、高效的批量加载和流数据来连接和扩展分析应用。
使用全托管数据服务构建数据湖,以降低成本、减少工作量。
利用 OCI 将数据湖与首选数据仓库集成,发现新洞察。
利用预构建 AI 模型或者自行创建模型,从数据中获取洞察。
Oracle 合作伙伴解决方案利用并增强 OCI 上的数据湖仓一体。
Oracle 提供无限时长的云免费套餐,包括 ADW 业务数据平台、OCI 计算和 Oracle 存储等产品,同时还提供价值 300 美元的免费储值,支持您免费试用更多其他云服务。立即获取详细信息并注册您的免费帐户。
本研讨会中的动手实践将指导您使用 Oracle 自治数据库和 OCI 数据目录访问通过 Oracle 对象存储桶创建的数据湖。
开始数据湖访问动手实践了解如何使用大数据服务和 OCI 来创建和监视高可用性 Hadoop 集群。您还将向集群中添加 Oracle 云 SQL 并访问实用程序和主节点,了解如何使用 Cloudera Manager 和 Hue 直接在 Web 浏览器中访问集群。
开始数据湖动手实践甲骨文红牛车队使用分析和机器学习技术分析 70 年来的比赛数据,发现了赛车与其他更加可预测的比赛相比,让人充满兴奋感的背后原因。
开始数据分析动手实践了解如何使用 OCI 异常检测服务创建自定义机器学习模型。您将获取用户上传的数据,使用专用算法来训练模型,并将模型部署到云环境中来检测异常。
开始异常检测动手实践注:为免疑义,本网页所用以下术语专指以下含义: