Keine Ergebnisse gefunden

Suche ergab keine Treffer

Beachten Sie die folgenden Tipps, um das Gesuchte zu finden:

  • Prüfen Sie die Schreibweise des Suchbegriffs.
  • Verwenden Sie Synonyme für das eingegebene Stichwort, z. B. “Anwendung” statt “Software.”
  • Testen Sie eine der unten gezeigten beliebten Suchen.
  • Beginnen Sie eine neue Suche.

 

Aktuelle Fragen

Was ist ein Data Warehouse?

Ein Data Warehouse ist eine Art Datenmanagementsystem, mit dem BI-Aktivitäten (Business Intelligence), insbesondere Analysen, aktiviert und unterstützt werden. Data Warehouses dienen ausschließlich zur Durchführung von Abfragen und Analysen und enthalten häufig große Mengen an Verlaufsdaten. Die Daten in einem Data Warehouse stammen üblicherweise aus einer Vielzahl von Quellen, z. B. aus Anwendungsprotokolldateien und Transaktionsanwendungen.

Ein Data Warehouse zentralisiert und konsolidiert große Datenmengen aus mehreren Quellen. Die Analysefunktionen ermöglichen es Unternehmen, wertvolle Geschäftsinformationen aus ihren Daten abzuleiten, um die Entscheidungsfindung zu verbessern. Im Laufe der Zeit wird ein Verlaufsdatensatz erstellt, der für Daten- und Geschäftsanalysten von unschätzbarem Wert sein kann. Aufgrund dieser Funktionen kann ein Data Warehouse als die „einzige Quelle wahrer Daten“ eines Unternehmens betrachtet werden.

Ein typisches Data Warehouse umfasst häufig die folgenden Elemente:

  • Eine relationale Datenbank zum Speichern und Verwalten von Daten
  • Eine ETL-Lösung (Extract, Transform, Load; Extraktion, Transformation, Laden) zur Aufbereitung der Daten für die Analyse
  • Statistische Analyse-, Berichts- und Data-Mining-Funktionen
  • Kundenanalyse-Tools zur Visualisierung und Präsentation von Daten für Geschäftsanwender
  • Andere, komplexere analytische Anwendungen, die verwertbare
  •  Informationen durch Anwendung von Algorithmen für Machine Learning und künstliche Intelligenz (KI) generieren

Warum führen Sie nicht Analysen für Ihre OLTP-Umgebung aus?

Data Warehouses sind relationale Umgebungen, die zur Datenanalyse, insbesondere von Verlaufsdaten, verwendet werden. Unternehmen nutzen Data Warehouses, um Muster und Beziehungen, die sich im Laufe der Zeit entwickeln, in ihren Daten zu erkennen.

Im Gegensatz dazu werden Transaktionsumgebungen genutzt, um Transaktionen fortlaufend zu verarbeiten. Sie werden häufig für die Auftragserfassung sowie für Finanz- und Einzelhandelstransaktionen verwendet. Sie bauen nicht auf Verlaufsdaten auf. In OLTP-Umgebungen werden Verlaufsdaten häufig archiviert oder einfach gelöscht, um die Performance zu verbessern.

Data Warehouses und OLTP-Systeme unterscheiden sich erheblich.

Data Warehouse OLTP-System
Workload Verarbeitet Ad-hoc-Anfragen und Datenanalysen Unterstützt nur vordefinierte Operationen
Datenänderungen Wird regelmäßig automatisch aktualisiert Aktualisierungen durch Endnutzer, die einzelne Anweisungen ausgeben
Schemadesign Verwendet teilweise denormalisierte Schemata, um die Performance zu optimieren Verwendet vollständig normalisierte Schemata, um Datenkonsistenz sicherzustellen
Datenerfassung Umfasst Tausende bis Millionen von Zeilen Greift auf jeweils nur eine Handvoll Datensätze zu
Verlaufsdaten Speichert Daten von vielen Monaten oder Jahren Speichert Daten nur für Wochen oder Monate

Data Warehouses, Data Marts und Operation Data Stores

Obwohl sie ähnliche Funktionen haben, unterscheiden sich Data Warehouses von Data Marts und Operation Data Stores (ODS). Ein Data Mart hat die gleichen Funktionen wie ein Data Warehouse, aber in einem sehr viel begrenzteren Anwendungsbereich – üblicherweise einer einzelnen Abteilung oder Branche. Daher sind Data Marts einfacher einzurichten als Data Warehouses. Sie führen jedoch tendenziell zu Inkonsistenzen, da es schwierig sein kann, Daten über zahlreiche Data Marts hinweg einheitlich zu verwalten und zu kontrollieren.

ODS unterstützen nur tägliche Vorgänge, sodass die Anzeige von Verlaufsdaten sehr eingeschränkt ist. Obwohl sie sich als Quellen für aktuelle Daten sehr gut eignen und häufig von Data Warehouses als solche verwendet werden, unterstützen sie keine historisch bedeutenden Abfragen.

Benötige ich einen Data Lake?

Unternehmen verwenden sowohl Data Lakes als auch Data Warehouses für große Datenmengen aus verschiedenen Quellen. Die Entscheidung für die jeweilige Verwendung hängt davon ab, was das Unternehmen mit den Daten vorhat. Im Folgenden wird der jeweils beste Verwendungszweck beschrieben:

  • Data Lakes speichern eine Fülle an unterschiedlichen, ungefilterten Daten, die später für einen bestimmten Zweck verwendet werden sollen. In einem Data Lake werden Daten aus Unternehmensanwendungen, mobilen Apps, Social Media, IoT-Geräten usw. als Rohdaten erfasst. Die Struktur, Integrität, Auswahl und das Format der verschiedenen Datasets werden zum Zeitpunkt der Analyse von der Person, die die Analyse durchführt, abgeleitet. Wenn Unternehmen kostengünstigen Speicher für unformatierte, unstrukturierte Daten aus mehreren Quellen benötigen, die sie in Zukunft für einen bestimmten Zweck verwenden möchten, ist ein Data Lake möglicherweise die richtige Wahl.
  • Data Warehouses sind speziell für die Analyse von Daten vorgesehen. Die analytische Verarbeitung innerhalb eines Data Warehouse wird für Daten durchgeführt, die für die Analyse vorbereitet wurden, also erfasst, kontextualisiert und transformiert wurden, um analysebasierte Daten zu generieren. Data Warehouses können auch große Datenmengen aus verschiedenen Quellen verarbeiten. Wenn Unternehmen erweiterte Datenanalysen benötigen oder Analysen, die sich auf Verlaufsdaten aus mehreren Quellen im Unternehmen stützen, ist ein Data Warehouse wahrscheinlich die richtige Wahl.

Vorteile eines Data Warehouse

Data Warehouses bieten den übergreifenden und einzigartigen Vorteil, dass Unternehmen große Mengen verschiedener Daten analysieren und daraus einen signifikanten Wert ziehen sowie Verlaufsdaten aufzeichnen können.

Vier einzigartige Merkmale (beschrieben von dem Informatiker William Inmon, der als der Begründer der Data Warehouse gilt) ermöglichen es Data Warehouses, diesen übergreifenden Vorteil zu erzielen. Nach dieser Definition sind Data Warehouses

  • Subjektorientiert. Sie können Daten zu einem bestimmten Thema oder Funktionsbereich (z. B. Verkauf) analysieren.
  • Integriert. Data Warehouses sorgen für Konsistenz verschiedener Datentypen aus unterschiedlichen Quellen.
  • Permanent. Sobald sich die Daten in einem Data Warehouse befinden, sind sie stabil und ändern sich nicht mehr.
  • Zeitvariant. Bei der Data Warehouse-Analyse wird die Veränderung im Laufe der Zeit untersucht.

Ein gut konzipiertes Data Warehouse führt Abfragen sehr schnell durch, liefert einen hohen Datendurchsatz und bietet den Endnutzern genügend Flexibilität, Daten in kleinere Teile zu zerlegen und aus verschiedenen Blickwinkeln genauer zu untersuchen (slice and dice), um eine Vielzahl von Anforderungen zu erfüllen – entweder auf einer übergeordneten oder einer sehr fein gegliederten Ebene. Das Data Warehouse dient als funktionale Grundlage für Middleware-BI-Umgebungen, die Endnutzern Berichte, Dashboards und andere Schnittstellen bereitstellen.

Data Warehouse-Architektur

Die Architektur eines Data Warehouse wird durch die spezifischen Anforderungen des Unternehmens bestimmt. Gängige Architekturen sind

  • Einfach. Alle Data Warehouses teilen sich ein grundlegendes Design, in dem Metadaten, Zusammenfassungsdaten und Rohdaten im zentralen Repository des Warehouse gespeichert werden. Das Repository wird an einem Ende von Datenquellen gespeist und Endnutzer greifen am anderen Ende zur Analyse, Berichterstellung und zum Data Mining darauf zu.
  • Einfach durch einem Staging-Bereich. Betriebsdaten müssen vor dem Ablegen im Data Warehouse bereinigt und verarbeitet werden. Obwohl dies programmgesteuert erfolgen kann, verfügen viele Data Warehouses zur Vereinfachung der Datenvorbereitung zusätzlich über einen Staging-Bereich für Daten, bevor diese in das Warehouse gelangen.
  • Hub-and-Spoke-Systeme. Durch das Hinzufügen von Data Marts zwischen dem zentralen Repository und den Endnutzern kann ein Unternehmen sein Data Warehouse anpassen, um verschiedene Geschäftsbereiche zu bedienen. Wenn die Daten bereit zur Nutzung sind, werden sie in den entsprechenden Data Mart verschoben.
  • Sandboxes. Sandboxes sind private, sichere Bereiche, in denen Unternehmen schnell und informell nach neuen Datasets oder Möglichkeiten zur Datenanalyse suchen können, ohne die formalen Regeln und Protokolle des Data Warehouse einhalten zu müssen.

Die Entwicklung von Data Warehouses – von der Datenanalyse zur KI und zum Machine Learning

Als Ende der 1980er Jahre Data Warehouses auf den Markt kamen, sollten sie den Datenfluss von Betriebssystemen in Decision-Support-Systeme (DSS) unterstützen. Diese frühen Data Warehouses erforderten eine enorme Redundanz. Die meisten Unternehmen verfügten über mehrere DSS-Umgebungen, die ihren verschiedenen Nutzern zur Verfügung standen. Obwohl die DSS-Umgebungen überwiegend die gleichen Daten verwendeten, wurden das Sammeln, Bereinigen und Integrieren der Daten häufig für jede Umgebung repliziert.

Als Data Warehouses effizienter wurden, entwickelten sie sich von Informationsspeichern, die traditionelle BI-Plattformen unterstützten, zu umfassenden Analyseinfrastrukturen, die eine Vielzahl von Anwendungen unterstützen, wie z. B. operative Analysen und Leistungsmanagement.

Data Warehouse-Iterationen wurden im Laufe der Zeit weiterentwickelt, um dem Unternehmen schrittweise einen zusätzlichen Mehrwert zu bieten.

Schritt Funktion Geschäftlicher Nutzen
1 Transaktionsberichte Enthalten relationale Informationen zum Erstellen von Snapshots der Unternehmensleistung
2 Slice and Dice, Ad-hoc-Abfrage, BI-Tools Erweitern die Funktionen für aussagekräftigere Daten und robustere Analysen
3 Vorhersage der zukünftigen Performance (Data Mining) Entwickeln Visualisierungen und zukunftsweisende Business Intelligence
4 Taktische Analyse (räumlich, statistisch) Bietet „Was-wäre-wenn“-Szenarien zur Information über praktische Entscheidungen auf der Grundlage einer umfassenderen Analyse
5 Speichert Daten von vielen Monaten oder Jahren Speichert Daten nur für Wochen oder Monate

Um jeden dieser fünf Schritte zu unterstützen, waren immer mehr Datasets erforderlich. Insbesondere die letzten drei Schritte schaffen die Voraussetzung für ein noch breiteres Spektrum an Daten- und Analysefunktionen.

Heute verändern KI und Machine Learning nahezu alle Branchen, Dienstleistungen und Unternehmensressourcen – und Data Warehouses sind da keine Ausnahme. Die Ausweitung von Big Data und die Anwendung neuer digitaler Technologien führen zu Veränderungen bei den Anforderungen und Fähigkeiten im Data Warehouse.

Das autonome Data Warehouse ist der letzte Schritt in dieser Entwicklung, der es Unternehmen ermöglicht, noch mehr Wert aus ihren Daten zu ziehen und gleichzeitig die Kosten zu senken sowie die Zuverlässigkeit und Performance des Data Warehouse zu verbessern.

Erfahren Sie mehr über autonome Data Warehouses und beginnen Sie mit Ihrem eigenen autonomen Data Warehouse.

Entwerfen eines Data Warehouse

Wenn ein Unternehmen ein Data Warehouse entwerfen möchte, muss es zunächst seine spezifischen Geschäftsanforderungen definieren, den Umfang vereinbaren und ein Konzept entwerfen. Das Unternehmen kann dann sowohl den logischen als auch den physischen Entwurf für das Data Warehouse erstellen. Zum logischen Entwurf gehören die Beziehungen zwischen den Objekten und der physische Entwurf umfasst die beste Methode zum Speichern und Abrufen der Objekte. Der physische Entwurf beinhaltet auch Transport-, Sicherungs- und Wiederherstellungsprozesse.

Bei jedem Data Warehouse-Entwurf muss Folgendes berücksichtigt werden:

  • Spezifischer Dateninhalt
  • Beziehungen innerhalb und zwischen Datengruppen
  • Die Systemumgebung, die das Data Warehouse unterstützt
  • Die erforderlichen Arten der Datentransformationen
  • Die Frequenz der Datenaktualisierung

Ein Hauptfaktor beim Entwurf sind die Anforderungen der Endnutzer. Die meisten Endnutzer sind daran interessiert, Analysen durchzuführen und Daten in ihrer Gesamtheit, anstatt als einzelne Transaktionen zu betrachten. Häufig wissen Endnutzer jedoch erst bei einem spezifischer Bedarf wirklich, was sie wollen. Daher sollte der Planungsprozess genügend Exploration umfassen, um den Bedarf zu antizipieren. Schließlich sollte der Entwurf des Data Warehouse Raum für Erweiterung und Weiterentwicklung bieten, um mit den sich wandelnden Anforderungen der Endnutzer Schritt zu halten.

Die Cloud und das Data Warehouse

Data Warehouses in der Cloud haben dieselben Eigenschaften und Vorteile wie On-Premises-Data Warehouses, bieten aber die zusätzlichen Vorteile von Cloud-Computing. Dazu gehören Flexibilität, Skalierbarkeit, Agilität, Sicherheit und geringere Kosten. Mithilfe von Cloud-Data-Warehouses können sich Unternehmen ausschließlich darauf konzentrieren, Daten effektiv zu analysieren, anstatt die Hardware- und Software-Infrastruktur zur Unterstützung von Data Warehouse aufbauen und verwalten zu müssen.

Mehr erfahren über die Oracle Cloud und Data Warehouses (PDF)

Bereitstellung ohne Komplexität: Das Autonomous Data Warehouse

Die letzte Iteration des Data Warehouse ist das autonome Data Warehouse, das sich auf KI und Machine Learning stützt, um manuelle Aufgaben zu eliminieren und die Einrichtung, Bereitstellung und das Datenmanagement zu vereinfachen. Ein autonomes Data Warehouse-as-a-Service in der Cloud erfordert keine von Menschen durchgeführte Datenbankverwaltung, Hardwarekonfiguration bzw. -verwaltung oder Softwareinstallation.

Das Erstellen des Data Warehouse, das Sichern, Patchen und Aktualisieren sowie das Erweitern oder Reduzieren der Datenbank werden automatisch ausgeführt – mit der gleichen Flexibilität, Skalierbarkeit, Flexibilität und Kostensenkung, die Cloud-Plattformen bieten. Das autonome Data Warehouse verringert die Komplexität, beschleunigt die Bereitstellung und setzt Ressourcen frei, sodass sich Unternehmen auf Aktivitäten konzentrieren können, die einen Mehrwert für das Unternehmen bieten.

Oracle Autonomous Data Warehouse

Oracle Autonomous Data Warehouse bietet ein benutzerfreundliches, vollständig autonomes Data Warehouse, das sich elastisch skalieren lässt, schnelle Abfrageperformance liefert und keine Datenbankadministration erfordert. Das Setup für Oracle Autonomous Data Warehouse erfolgt sehr einfach und schnell.

Mehr erfahren über Oracle Autonomous Data Warehouse (PDF)