数据湖是一个存储仓库,您可以存储任意格式和任意规模的结构化、半结构化和非结构化数据并轻松执行分析。借助 Oracle Cloud Infrastructure (OCI),您可以构建一个安全、经济高效且易于管理的数据湖,并将其与您的首选数据仓库和分析以及其他 OCI 服务(如数据目录、安全性和观测服务)紧密集成。
将数据批量或以数据流的形式无缝迁移到 OCI 数据湖中,以便进行数据分析。利用 OCI Data Integration、OCI GoldenGate 或 OCI Streaming 摄取数据并将其存储在 OCI Object Storage 中。
Oracle 可提供一个基于 OCI 运行的集中式数据湖,它集成了您所有的首选工具,包括 Oracle Autonomous Data Warehouse、MySQL HeatWave 等数据库;Oracle Analytics Cloud 等分析和机器学习 (ML) 工具;以及 Apache Spark 等开源项目。
Oracle Cloud Infrastructure 今年发布了全托管式数据湖服务 OCI Data Lake。立即注册,抢先访问 OCI Data Lake,在正式发布前体验 OCI Data Lake 的强大功能和特性。
数据湖虽然可以处理更多类型的数据,但管理起来非常麻烦,会占用大量时间。而 OCI 提供全托管的开源湖服务,既可以降低成本,又可以减少管理工作,将帮助您降低运营成本、提高可伸缩性和安全性,并集中整合所有现有数据。
数据仓库和数据集市对于企业的成功至关重要。将这两者与数据湖集成可以进一步提高其价值。例如,您可以通过单个 SQL 查询从多个位置访问数据。现有应用和工具无需任何更改即可透明地访问所有数据,用户也无需学习新技能。
企业应用生成的数据极具价值,但这些数据很少能够得到充分利用。基于 OCI 的数据湖可以简化从多个应用访问数据的过程,并支持高级分析,从而帮助企业大幅改善业绩。
使用嵌入式 OCI 数据集成集中管理数据。
查询任意来源的任意数据,且不会出现重复。
预集成应用,实现即时价值。
使用嵌入式 OCI 数据目录对数据进行编目和治理。
通过基于角色的细粒度访问策略保护数据安全。
Oracle Autonomous Database 支持与数据湖集成 — 不仅可在 Oracle Cloud Infrastructure 上运行,还可在 Amazon Web Services (AWS)、Microsoft Azure、Google Cloud 等平台上运行。您可以选择将数据加载到数据库中,或者直接在源对象存储中查询数据。这两种方法都使用相同的工具和 API 访问数据。
这种架构有时也称为湖仓一体架构。
MySQL HeatWave Lakehouse 是一款 MySQL 云数据库服务,它支持事务处理、机器学习 (ML) 以及跨数据仓库和数据湖的实时数据分析,可消除提取、转换和加载 (ETL) 复制的复杂性、延迟、风险和成本。
* 点击 此处,查看公共基准。
快速创建基于 Hadoop 或 Spark 的数据湖,扩展数据仓库,确保轻松访问并经济高效地管理所有数据。
使用实时、一致的事务数据、高效的批量加载和流数据来连接和扩展分析应用。
使用完全托管的数据服务,以较低的成本和较少的人力构建一个数据湖。
利用 OCI 将数据湖与首选数据仓库集成,发现新洞察。
利用预构建 AI 模型或者自行创建模型,从数据中获取洞察。
Oracle 合作伙伴解决方案利用并增强 OCI 上的数据湖仓一体。
Oracle Cloud Free Tier 无时间限制,包含了 Autonomous Database Warehouse、OCI Compute 和 Oracle Storage 等服务,另外还有 300 美元的免费储值,让您可以试用更多云技术服务。立即获取详细信息并注册您的免费账户。
本研讨会中的动手实践将指导您使用 Oracle Autonomous Database 和 OCI Data Catalog 访问通过 Oracle Object Storage 桶创建的数据湖。
开始数据湖访问动手实践了解如何使用 Oracle Big Data Service 和 OCI 来创建和监视高可用性 Hadoop 集群。您还将向集群中添加 Oracle Cloud SQL 并访问实用程序和主节点,了解如何使用 Cloudera Manager 和 Hue 直接在 Web 浏览器中访问集群。
开始数据湖动手实践甲骨文红牛车队使用分析和机器学习技术分析 70 年来的比赛数据,发现了赛车与其他更加可预测的比赛相比,让人充满兴奋感的背后原因。
开始数据分析动手实践了解如何使用 OCI Anomaly Detection 创建自定义机器学习模型。您将获取用户上传的数据,使用专用算法来训练模型,并将模型部署到云环境中来检测异常。
开始异常检测动手实践注:为免疑义,本网页所用以下术语专指以下含义: