Big Dataund die Cloud
Data in the Cloud
Big Data und die Cloud: Das Dream Team bei der Digitalisierung im großen Stil

Paul Sonderegger,
Big Data Strategist, Oracle @PaulSonderegger


Cloudlösungen und Big Data waren in den letzten Jahren zwei der markantesten technologischen Entwicklungen – vereint sind sie unschlagbar.

Intel

Langsam aber sicher dämmert es großen Konzernen, welches Potenzial in ihren Datenbeständen schlummert. Das sind nicht einfach Aufzeichnungen darüber, was alles passiert ist – es ist der Rohstoff, aus dem sich neue digitale Produkte und Services entwickeln lassen!

Das heißt: Ein Wettlauf hat eingesetzt, in dem es für Unternehmen darauf ankommt, einzigartige Assets mit ihren Datenbeständen zu entwickeln – durch neue Mobile Apps, Wearables und andere smarte und vernetzte Geräte.

Denn genau darum geht es bei Big Data: Die Sammlung und Verwendung von mehr Daten aus mehr täglichen Abläufen mit dem Ziel, Wettbewerbsvorteile zu erringen. Um dabei ganz vorne mitzuspielen, brauchen die Teilnehmer an diesem Rennen eine neue Art der Datenverarbeitung. Und dabei spielt die Cloud eine Schlüsselrolle.

Paul Sonderegger

Paul Sonderegger, Big Data Strategist

Big Data und Cloudlösungen müssen naht- und reibungslos funktionieren

Eins gilt in diesem Zusammenhang speziell für große Unternehmen: Wenn Big Data und Cloudlösungen aufeinandertreffen, dann muss das naht- und reibungslos funktionieren. Das gleiche gilt für die Integration mit vorhandener Technik. Denn Big Data und die Cloud haben zwar das Zeug, ein Traumpaar zu werden, aber der Teufel steckt im Detail.

Zunächst gilt es, die erforderliche Technologie für den Umgang mit Big Data ins Blickfeld zu rücken. Denn die komplett neue Art von Daten zu erfassen und zu speichern, die von Smart Clothing, Mobile Geocaching-Apps oder vernetzten Drohnen kommen – das erfordert ein ganzes Set von Techniken für das Data Management.

 Betriebe versuchen außerdem, dahinter zu kommen, wie sie mit diesem Schatz an Daten etwas Einzigartiges herstellen können, seien es innovative digitale Produkte und Services oder mehr Effizienz – jedenfalls ein Alleinstellungsmerkmal gegenüber der Konkurrenz. 

Beispiel: NoSQL-Datenbanken können sehr gut Sensordaten in Echtzeit erfassen. Hadoop Cluster zeichnen sich besonders durch ihre enorme Kapazität zur preisgünstigen Speicherung unterschiedlicher Daten und Dokumente aus. Relationale Datenbanken sind unerschütterlich zuverlässig, wenn es um Transaktionsdaten geht, bei denen ja Genauigkeit und richtige Zuordnungen absolute Priorität haben.

Mit der Erfassung und Speicherung von Daten in ihrem ursprünglichen Format – was wir Data Equality nennen – fängt die Sache aber erst an. Was Unternehmen zusätzlich benötigen, ist Data Liquidity, d. h. die jeweils erforderlichen Daten passend aufbereitet verfügbar zu haben, und zwar in kürzester Zeit, zu möglichst niedrigen Kosten und ohne Risiken. Dazu braucht man eine Reihe spezieller Analytics für Big Data.

Für Data Scientists etwa sind Entwicklungsumgebungen für den Einsatz ihrer bevorzugten Tools wichtig, z. B. Python, SQL oder das Open-Source Package „R“, damit sie neue Kombinationen von Daten zusammenbasteln können. Manager brauchen wieder etwas anderes: Benutzeroberflächen zum Anzeigen und Klicken, mithilfe derer sie den ganzen Datensalat so erschließen können, dass sie auf neue Frage kommen und neue Einsichten gewinnen. Schließlich: überall verfügbare Dashboards, die Analysen auf Basis von Daten aus Hadoop und NoSQL ebenso wie aus dem Speicher liefern können.

Big Data und die Cloud haben zwar das Zeug, ein Traumpaar zu werden, aber der Teufel steckt im Detail.

Wie kommt da jetzt die Cloud ins Spiel? – Bei Anwendungen zum Beispiel kann die Cloud eine komfortable Methode sein, um Ressourcen, die für das Business erforderlich sind, ohne Einschaltung der IT heranzuschaffen. Das ist besonders etwas für Big Data Pilots und „inoffizielle“ Projekte (so genannte Skunkworks): Einfach ein Hadoop Cluster in die Cloud eines anderen Anbieters hochladen, ein paar Daten dazumixen und herumprobieren.

Die Frage ist jetzt: Wie bricht man diese Ressourcen der Cloud für Big Data auf die Produktionsebene herunter? Die Herausforderung besteht ja darin, genau diese Ressourcen in die Gesamtarchitektur des Unternehmens einzufügen.

Beispiel 1: Ein Flugzeughersteller will anbieten, dass die Aufzeichnungen der Sensordaten mechanischer Systeme während des Flugs in einem cloudbasierten NoSQL-Dienst gespeichert werden können, damit dieses dann das System an Tagen mit vielen Flügen herauf- und später dann wieder herunterskaliert. 

Beispiel 2: Ein Kreditinstitut, das über einen Algorithmus zur Betrugserkennung verfügt, will diese Ressource mithilfe der Cloud auf saisonale Nachfragespitzen übertragen. 

Beispiel 3: Ein Einzelhändler arbeitet mit Human Resources SaaS und Gehaltslisten-Apps. Jetzt möchte er gerne auch außerhalb der Cloud auf seine Personal-Analysen zugreifen. 

Die Antwort auf diese Bedarfe ist regelmäßig eine Big-Data-Architektur mit Hybrid-Cloudlösung. Denn der Flugzeughersteller, die Bank und der Einzelhändler verfügen ja alle bereits über innerbetriebliche Anwendungen bzw. Analysestrukturen. 

Bei Oracle ist dabei der Zugang, eine betriebliche Cloudtechnik mit derselben Architektur wie Oracle Public Cloud einzurichten. Damit können die Unternehmen dann Big Data Management, Integrationen und Analytics jederzeit zwischen beiden Strukturen hin und her bewegen.

Ein Beispiel ist das Big Data Management System bei Oracle: Die wesentlichen Komponenten sind Cloudera Hadoop, das auf einer Oracle Big Data Appliance läuft, und Oracle Database 12c auf einer Oracle Exadata Database Machine. Beides hängt über ein superschnelles Infiniband-Netzwerk mit Oracle Big Data Connectors und Big Data SQL zusammen. So kann man Daten zwischen Hadoop und dem Speicher beliebig verschieben oder Abfragen in beiden Teilen durchführen, als ob sie eins wären, ohne einen Gedanken daran zu verschwenden, wo die Daten jetzt eigentlich liegen. Dasselbe Spektrum an Ressourcen mit derselben Architektur gibt es genauso von Oracle Public Cloud. Wohlgemerkt, das ist die einzige Hybrid-Cloud Big Data Architektur, in der sich Big-Data-Vorgänge zwischen der Cloud und der betrieblichen Architektur nach Bedarf hin und herschieben lassen

Big Data und Cloudlösungen sind zwei der disruptivsten Technologien für den Datenbereich in Unternehmen seit Einführung des Internets. In Kombination miteinander haben sie das Potenzial, den Wettbewerb zwischen Unternehmen ebenso von Grund auf zu verändern wie überhaupt die Zukunft des betrieblichen Umgangs mit Daten. 


This Big Data article is brought to you by Oracle and Intel®

Intel® and the Intel logo are trademarks of Intel Corporation in the U.S. and/or other countries.


Mehr erfahren

Wir helfen Ihnen gerne

Sprechen Sie mit einem Oracle-Experten

  • +49 6103 397 002

Sprechen Sie mit dem Oracle Support