Data Lake

Ein Data Lake ist ein Repository für strukturierte, halbstrukturierte und unstrukturierte Daten in beliebigem Format, beliebiger Größe und beliebigem Umfang, die leicht analysiert werden können. Mit Oracle Cloud Infrastructure (OCI) können Sie einen sicheren, kostengünstigen und einfach zu verwaltenden Data Lake erstellen. Ein Data Lake auf OCI ist eng mit den von Ihnen bevorzugten Data Warehouses und Analysesystemen sowie mit anderen OCI-Services wie Datenkatalog-, Sicherheits- und Beobachtbarkeitsservices integriert.

Was ist ein Data Lake? (0:44)
Beliebige Daten, beliebige Quellen

Übertragen Sie Ihre Daten in Batches oder Streams nahtlos in einen OCI Data Lake, wo sie analysiert werden können. Nutzen Sie OCI Data Integration, OCI GoldenGate oder OCI Streaming, um Ihre Daten aufzunehmen und in OCI Object Storage zu speichern.

Auf Wiedersehen, Datensilos!

Ein zentraler Data Lake auf OCI lässt sich in Ihre bevorzugten Tools integrieren, darunter Datenbanken wie Oracle Autonomous Data Warehouse, MySQL HeatWave, Analyse- und ML-Tools wie Oracle Analytics Cloud und Open-Source-Projekte wie Apache Spark.

KI und ML nutzen

Ein umfassendes Angebot an KI- und ML-Services ermöglicht es Ihnen, neue Erkenntnisse aus Ihren Daten zu gewinnen, Vorhersagen zu treffen, Ihren betrieblichen Aufwand zu senken und das Kundenerlebnis zu verbessern.

Daten entdecken und sichern

Katalogisieren Sie Ihre Daten, und sammeln Sie mit OCI Data Catalog Einblicke in Ihren Data Lake. Aktivieren Sie Abfragetools und Datenbanken, um Ihre Daten im Objektspeicher zu finden und abzufragen.

Frühzeitigen Zugriff auf OCI Data Lake sichern

Oracle Cloud Infrastructure führt dieses Jahr einen vollständig verwalteten Data Lake-Service namens OCI Data Lake ein. Sie können sich für einen frühzeitigen Zugriff anmelden, um die Funktionen und Möglichkeiten zu erkunden, bevor es der Öffentlichkeit zugänglich gemacht wird.

Warum sollte ein Data Lake auf OCI verwendet werden?


Modernisieren Sie Ihren Data Lake

Ein Data Lake ermöglicht zwar die Arbeit mit mehreren Arten von Daten, doch der Zeit- und Arbeitsaufwand für die Verwaltung dieser Daten kann sich als nachteilig erweisen. Durch die Bereitstellung vollständig verwalteter Open-Source-Data-Lake-Services bietet OCI sowohl niedrigere Kosten als auch einen geringeren Verwaltungsaufwand. Sie können also mit geringeren Betriebskosten, verbesserter Skalierbarkeit und Sicherheit sowie der Möglichkeit rechnen, alle Ihre aktuellen Daten an einem Ort zu erfassen.


Erweiterung Ihres Data Warehouse

Data Warehouses und Data Marts sind für erfolgreiche Unternehmen von entscheidender Bedeutung. Durch die Integration in einen Data Lake werden sie noch wertvoller. Die Integration zwischen Datenbanken, Data Warehouses und einem Data Lake mit Oracle ermöglicht es, mit einer einzigen SQL-Abfrage von mehreren Standorten aus auf die Daten zuzugreifen. Aktuelle Anwendungen und Tools erhalten transparenten Zugriff auf alle Daten, ohne dass Änderungen vorgenommen werden müssen und ohne dass neue Kenntnisse erforderlich sind.


Nutzung von erweiterten Analysen für Oracle Anwendungen

Daten, die von Unternehmensanwendungen generiert werden, sind sehr wertvoll, werden aber selten vollständig genutzt. Ein Data Lake auf OCI vereinfacht den Zugriff auf Daten aus mehreren Anwendungen und ermöglicht ausgefeilte Analysen, die den Unterschied zwischen einem guten und einem schlechten Quartal ausmachen können.

Integrierte Data Lake-Lösung auf OCI

Zentralisierung Ihrer Daten mit dem eingebetteten OCI Data Integration.

Abfrage beliebiger Daten aus beliebigen Quellen ohne Replikation.

Vorintegrierte Anwendungen für eine sofortige Amortisierungszeit.

Katalogisierung und Verwaltung mit dem eingebetteten OCI Data Catalog.

Sichere Daten mit fein abgestimmten, rollenbasierten Zugriffskontrollrichtlinien.

Die Oracle Datenplattform erschließt das volle Potenzial Ihrer Daten

  • Kombinieren Sie transaktionale und analytische Daten und vermeiden Sie Silos.
  • Von Oracle IaaS bis Oracle SaaS oder irgendwas dazwischen – wählen Sie den gewünschten Kontrollumfang.
  • Bringen Sie beliebige Daten auf die Plattform – Wir durchbrechen die Grenze zwischen strukturierten und unstrukturierten Daten.
  • Entdecken Sie die Leistungsfähigkeit von OCI und seine Offenheit für andere Cloud-Serviceanbieter – Wir holen Sie dort ab, wo Sie sind.
  • Nutzen Sie das führende Oracle Analytics Cloud-Reporting oder jede beliebige Analyseanwendung eines Drittanbieters – OCI ist offen.
Übersichtsdiagramm der Oracle Datenplattform, Beschreibung unten Das Diagramm zeigt die Oracle Datenplattform mit Datenquellen, Datenübertragungsservices wie Integrationsservices, den Kern der modernen Oracle Datenplattform und möglichen Ergebnis- und Anwendungsentwicklungs-Services.

Autonomous Database mit Data Lakes integrieren

Oracle Autonomous Database unterstützt die Integration mit Data Lakes, und zwar nicht nur auf Oracle Cloud Infrastructure, sondern auch auf Amazon Web Services (AWS), Microsoft Azure, Google Cloud etc. Sie haben die Möglichkeit, Daten in die Datenbank zu laden oder die Daten direkt im Quellobjektspeicher abzufragen. Beide Ansätze nutzen dieselben Tools und APIs für den Zugriff auf die Daten.

Diese Architektur wird manchmal auch als Lakehouse-Architektur bezeichnet.



Autonomous Database mit Data Lakes-Diagramm, Beschreibung unten Das Diagramm zeigt eine Architektur einer Datenplattform, die Oracle Autonomous Database mit Datenquellen, Oracle Autonomous Database und Ergebnissen nutzt.

Echtzeitanalyse all Ihrer Daten mit MySQL HeatWave Lakehouse

Ein MySQL-Cloud-Datenbankservice für Transaktionen, Echtzeitanalysen über Data Warehouses und Data Lakes hinweg sowie maschinelles Lernen – ohne die Komplexität, Latenz, Risiken und Kosten einer ETL-Duplizierung.

* Öffentliche Benchmarks sind hier verfügbar.



Autonomous Database mit Data Lakes-Diagramm, Beschreibung unten Das Diagramm zeigt eine Architektur einer Datenplattform, die Oracle MySQL HeatWave mit Datenquellen, MySQL Heatwave und Ergebnissen nutzt.

Aufbau eines Data Lake mit von Oracle verwalteten Open-Source-Services

Erstellen Sie in kürzester Zeit Hadoop- oder Spark-basierte Data Lakes, um Ihre Data Warehouses zu erweitern und sicherzustellen, dass alle Daten leicht zugänglich sind und kostengünstig verwaltet werden.



Autonomous Database mit Data Lakes-Diagramm, Beschreibung unten Das Diagramm zeigt eine Architektur einer Datenplattform, die von Oracle verwaltete Open-Source-Services wie Hadoop, Spark und OpenSearch mit Datenquellen, Oracle Open-Source-Services im Mittelpunkt und möglichen Ergebnissen nutzt.

Data Lake-Services von Oracle

Datenbewegung und -integration

Verbinden und erweitern Sie analytische Anwendungen mit einheitlichen Echtzeit-Transaktionsdaten, effizienten Batch-Loads und Streaming-Daten.

  • OCI Data Integration
    Vereinfachen Sie Ihre komplexen Prozesse zum Extrahieren, Transformieren und Laden von Daten (ETL/E-LT) in Data Lakes und Warehouses für Data Science und Analysen mit einem Data Flow-Designer (ohne Programmieraufwand).
  • Oracle Data Integrator
    Data Integrator bietet eine erweiterte Datenmigration zum Extrahieren, Transformieren und Laden. Oracle Data Integrator ist sowohl für Cloud-Datenbanken von Oracle als auch für On-Premises-Datenbanken optimiert.
  • Oracle GoldenGate
    Oracle GoldenGate ermöglicht Hochverfügbarkeit, Datenintegration in Echtzeit, Änderung von Datenerfassung, Datenreplikation, Transformationen und Überprüfung zwischen betrieblichen und analytischen Unternehmenssystemen.
  • OCI Streaming
    Streaming bietet sofort einsatzbereite Integrationen für Hunderte von Produkten von Drittanbietern in verschiedenen Kategorien wie DevOps, Datenbanken, Big Data und SaaS-Anwendungen.

Data Lake

Erstellen Sie einen Data Lake mit vollständig verwalteten Datenservices zu geringeren Kosten und mit weniger Aufwand.

  • OCI Data Lake
    Data Lake bietet eine zentrale Speicherung und Metadaten für Ihre strukturierten und unstrukturierten Daten mit einer einheitlichen, differenzierten Zugriffskontrolle.
  • OCI Object Storage
    Mit dem Object Storage können Kunden alle Arten von Daten in ihrem nativen Format speichern. Dies ist ideal zum Erstellen moderner Anwendungen, die Skalierbarkeit und Flexibilität erfordern.
  • OCI Data Catalog
    Data Catalog unterstützt mithilfe eines Inventars an unternehmensweiten Datenbeständen Datenprofis im gesamten Unternehmen bei der Datensuche, -analyse und -verwaltung.
  • OCI Data Flow
    Data Flow ist ein vollständig verwalteter Service von Apache Spark, mit dem Verarbeitungsaufgaben für extrem große Datenmengen ausgeführt werden können, ohne dass eine Infrastruktur bereitgestellt oder verwaltet werden muss. Dies ermöglicht eine schnelle Anwendungsbereitstellung, da sich Entwickler auf die App-Entwicklung und nicht auf die Infrastrukturverwaltung konzentrieren können.
  • Oracle Big Data
    Beim Big Data Service handelt es sich um einen Hadoop-basierten Data Lake zum Speichern und Analysieren großer Mengen roher Kundendaten. Der Oracle Big Data Service ist ein verwalteter Dienst, der über einen vollständig integrierten Stack verfügt, der sowohl Open Source- als auch Oracle Tools zur Wertschöpfung enthält, um Ihren IT-Betrieb zu vereinfachen.

Data Lakehouse

Nutzen Sie die OCI-Integration Ihrer Data Lakes mit Ihren bevorzugten Data Warehouses, um neue Erkenntnisse zu gewinnen.

  • MySQL Heatwave Lakehouse
    MySQL HeatWave Lakehouse stellt eine transparente Verbindung zu Data Lakes her und ermöglicht den Benutzern die Verarbeitung und Abfrage von Hunderten von Terabytes an Daten im Objektspeicher in einer Vielzahl von Dateiformaten, einschließlich CSV, Parquet und Aurora/Redshift-Backups.
  • Autonomous Database-Lakehouse-Funktionen
    Autonomous Database ermöglicht ein Selfservice-Data-Lakehouse, mit dem Benutzer Dateien auf allen Objektspeichern (einschließlich OCI, AWS, Azure und Google Cloud Platform) laden oder direkt abfragen können. Integrierte Analysen in den Bereichen maschinelles Lernen, Raum-, Text- und Diagrammanalyse ermöglichen Einblicke, ohne dass Daten bewegt werden müssen.

KI und Machine Learning

Gewinnen Sie Erkenntnisse aus Daten mit vorgefertigten KI-Modellen, oder erstellen Sie Ihre eigenen.

  • OCI AI Services
    AI Services ist eine Sammlung von Services mit vordefinierten Modellen für maschinelles Lernen, die es Entwicklern erleichtern, KI auf Anwendungen und Geschäftsabläufe anzuwenden. Die Modelle können individuell trainiert werden, um genauere Geschäftsergebnisse zu erzielen.
  • OCI Data Science
    Erstellen, trainieren, implementieren und verwalten Sie schnell ML-Modelle mit einem für Teams entwickelten Data-Science-Service.
  • Machine Learning in Oracle Database
    Machine Learning in Oracle Database unterstützt Datenexploration, -aufbereitung und -modellierung für maschinelles Lernen in großem Maßstab.
  • MySQL HeatWave AutoML
    HeatWave AutoML enthält alles, was Benutzer zum Erstellen, Trainieren, Bereitstellen und Erläutern von ML-Modellen in MySQL HeatWave benötigen, und das ohne zusätzliche Kosten.
Financial Services
Experian beschleunigt finanzielle Inklusivität mit einem Data Lakehouse auf OCI.
Mining
MineSense erzielte mit einem Lakehouse auf OCI 5-mal schnellere Abfragen.
Advertising
Beso vereinte Daten aus 23 Online-Quellen mit einer Vielzahl von Offline-Quellen, um einen Data Lake aufzubauen, der auf 100 Quellen erweitert werden kann.
Sporttechnologie
Mit einem Data Lakehouse von Oracle verwalten die Seattle Sounders 100-mal mehr Daten, generieren Erkenntnisse 10-mal schneller und reduzierten das Datenbankmanagement.

Data Lakehouse-Partner-Ökosystem

Oracle Partnerlösungen nutzen und ergänzen Data Lakehouses auf OCI.

  • Accenture logo
  • Capgemini-Logo
  • Deloitte-Logo
  • h2o.ai-Logo
  • Qubix-Logo
  • Reply Technology-Logo
  • Sesame Software logo
  • Wandisco-Logo

Informatica ist der bevorzugte Partner für Datenintegration und Governance für Data Warehouse- und Lakehouse-Lösungen.

Data Lake-Einführung in Oracle Cloud Infrastructure

Alle Referenzarchitekturen anzeigen
Die Oracle Playbook-Reihe

Wir haben die Geheimnisse unserer Personal-, Prozess- und Systemstrategie zusammengefasst. Und wir möchten sie mit Ihnen teilen.

Erste Schritte mit einem Data Lake auf OCI

Probieren Sie Always Free-Cloud-Services aus und erhalten Sie eine 30-Tage-Testversion

Oracle bietet ein kostenloses Kontingent ohne zeitliche Begrenzung für eine Auswahl von Services an, einschließlich Autonomous Data Warehouse, OCI Compute und Oracle Storage-Produkten, sowie 300 USD in kostenlosem Guthaben, um zusätzliche Cloud-Services zu testen. Informieren Sie sich über die Einzelheiten und melden Sie sich noch heute für Ihr kostenloses Konto an.

  • Was ist im kostenlosen Oracle Cloud-Kontingent enthalten?

    • Immer kostenlos
    • 2 autonome Datenbanken mit jeweils 20 GB
    • Compute VMs
    • 100 GB Block-Volume
    • 10 GB Objektspeicher

Mit einer praktischen Übung lernen

Man lernt am besten, wenn man es selbst ausprobiert. Probieren Sie diesen kostenlosen Data Lake-Workshop aus, der ein typisches Nutzungsszenario demonstriert und einige der Tools hervorhebt, die Sie zum Erstellen eines Data Lake verwenden können.

  • Mit Autonomous Database und Data Catalog auf den Data Lake zugreifen

    In den Übungen dieses Workshops werden die Schritte erläutert, die Sie für den Zugriff auf einen Data Lake benötigen, der mit Oracle Object Storage-Buckets mit Oracle Autonomous Database und OCI Data Catalog erstellt wurde.

    Übung für den Data Lake-Zugriff starten
  • Erste Schritte mit Oracle Big Data Service

    Erfahren Sie, wie Sie mit Big Data Service und OCI einen hochverfügbaren Hadoop-Cluster erstellen und überwachen. Darüber hinaus fügen Sie dem Cluster Oracle Cloud SQL hinzu und greifen auf das Dienstprogramm und den Master-Knoten zu. Außerdem erfahren Sie, wie Sie Cloudera Manager und Hue verwenden, um direkt in einem Webbrowser auf den Cluster zuzugreifen.

    Data Lake-Übung starten
  • Analytics und maschinelles Lernen mit Red Bull Racing entdecken

    Nutzen Sie Analysen und maschinelles Lernen, um die Renndaten der letzten 70 Jahre zu analysieren. Finden Sie heraus, was manche Rennen so spannend macht, dass man nicht wegsehen kann, während andere eher vorhersehbar sind.

    Übung zur Datenanalyse starten
  • Erste Schritte mit Oracle Cloud Infrastructure Anomaly Detection

    Erfahren Sie, wie Sie mit der Anomalieerkennung von OCI benutzerdefinierte ML-Modelle erstellen können. Sie verwenden von Benutzern hochgeladene Daten, einen speziellen Algorithmus, um ein Modell zu trainieren, und stellen das Modell in der Cloud-Umgebung bereit, um Anomalien zu erkennen.

    Übung zur Anomalieerkennung jetzt starten

Vertrieb kontaktieren

Möchten Sie mehr über ein Data Lake erfahren? Einer unserer Experten wird Ihnen gerne helfen.

  • Sie können Fragen beantworten, z. B.

    • Wie sehen die ersten Schritte mit einem Oracle Data Lake aus?
    • Was kann ich mit einem Data Lake machen, was mit einem Data Warehouse nicht möglich ist?
    • Wie kann mein Unternehmen von einem Data Lake profitieren?