資料湖是適用於結構化、半結構化和非結構資料的儲存區域,可儲存任意格式和大小的資料,且規模不受限制,方便您輕鬆進行分析。透過 Oracle Cloud Infrastructure (OCI),您可以建置安全、符合成本效益且易於管理的資料湖。OCI 上的資料湖可與您偏好的資料倉儲和分析以及其他 OCI 服務 (例如資料目錄、安全性和可觀察性服務) 緊密整合。
將您的資料分批移至或順暢地串流至 OCI 資料湖,以供分析。利用 OCI Data Integration、OCI GoldenGate 或 OCI Streaming 來擷取您的資料,並將其儲存在 OCI Object Storage 中。
OCI 上的中央資料湖可與您偏好的工具整合,包括 Oracle Autonomous Data Warehouse 、MySQL HeatWave 、分析和機器學習 (ML) 工具 (例如 Oracle Analytics Cloud),以及開源專案 (例如 Apache Spark)。
今年,Oracle Cloud Infrastructure 推出了名為 OCI Data Lake 的完全受管理資料湖服務。您可以先行註冊,在公開發佈之前搶先探索其功能。
資料湖可讓您處理更多類型的資料,但對於管理資料所需的時間和工作可能不利。透過提供完全受管理的開源資料湖服務,OCI 同時降低了成本並減少管理工作,讓您可預期有更低的營運成本、更高的可擴展性和安全性,並能夠將所有目前資料整合在一個地方。
資料倉儲和資料市集對於成功的企業來說至關重要。將這兩者與資料湖整合可進一步提升其價值。透過 Oracle 整合資料庫、資料倉儲和資料湖,意味著使用單一 SQL 查詢,就能從多個位置存取資料。目前的應用程式和工具可通透地存取所有資料,無需變更且無需學習新技能。
企業應用程式產生的資料極具價值,但很少充分利用。OCI 上的資料湖可簡化多個應用程式的資料存取,並啟用複雜的分析,意味著良好一季或壞一季之間的差異。
運用內嵌的 OCI Data Integration 體驗集中管理您的資料。
在不複製的情況下,從任何來源查詢任何資料。
預先整合的應用軟體可即時創造價值。
具備內嵌的 OCI Data Catalog 體驗的目錄和治理。
藉由微點、以角色為基礎的存取控制原則,保護資料。
Oracle Autonomous Database 支援與資料湖的整合,不僅在 Oracle Cloud Infrastructure 上,還支援在 Amazon Web Services (AWS)、Microsoft Azure、Google Cloud 等等。您可以選擇將資料載入資料庫,或直接在來源物件存放區查詢資料。這兩種方法都使用相同的工具和 API 來存取資料。
此架構有時稱為湖庫一體架構。
一個 MySQL 的雲端資料庫服務,可用於跨資料倉儲和資料湖的交易、即時分析,以及機器學習,無需 ETL 複製的複雜性、延遲、風險和成本。
* 公用基準可在此處取得。
快速建立以 Hadoop 為基礎的資料湖或以 Spark 為基礎的資料湖,以擴充您的資料倉儲,並以符合成本效益的方式輕鬆存取及管理所有資料。
連線分析應用程式,並利用即時一致的交易資料、有效率的批次載入及串流資料進行擴展。
利用完全受管理的資料服務,以更低的成本和更少的工作建置資料湖。
利用資料湖與偏好資料倉儲的 OCI 整合,並發現新的洞察分析。
透過預先建置的 AI 模型取得資料或建立自己的洞察力。
Oracle 對 Autonomous Data Warehouse、OCI 運算和 Oracle 儲存體產品等精選服務提供無時間限制的 Free Tier,以及 300 美元的免費額度,可試用其他雲端服務。取得詳細資料,並立即註冊您的免費帳戶。
此研討會中的實驗室將逐步介紹使用 Oracle Autonomous Database 和 OCI Data Catalog 存取使用 Oracle Object Storage 貯體建立的資料湖所需的步驟。
開始資料湖存取實驗室瞭解如何使用巨量資料服務和 OCI 建立及監控高可用性 Hadoop 叢集。您也將新增 Oracle Cloud SQL 至叢集並存取公用程式和主要節點,以及瞭解如何使用 Cloudera Manager 和 Hue 直接在 Web 瀏覽器中存取叢集。
開始資料湖庫實驗室使用分析和機器學習分析 70 年的賽車資料。瞭解為何某些賽事精彩到令人目不轉睛,而其他賽事卻不難預測結果。
啟動資料分析實驗室探索如何使用 OCI Anomaly Detection 建立自訂機器學習模型。您將採用使用者上傳的資料、使用特製演算法訓練模型,以及將模型部署到雲端環境以偵測異常。
立即啟動異常偵測實驗室