Ihre Suche ergab keine Treffer.
Beachten Sie die folgenden Tipps, um das Gesuchte zu finden:
Hier ist eine einfache Definition von Data Science:
Data Science kombiniert mehrere Bereiche, einschließlich Statistik, wissenschaftliche Methoden und Datenanalyse, um Wert aus Daten zu extrahieren.
Diejenigen, die im Bereich Data Science tätig sind, werden als Data Scientists bezeichnen. Sie kombinieren unterschiedliche Kompetenzen, um Daten zu analysieren, die aus dem Internet, von Smartphones, Kunden, Sensoren und anderen Quellen stammen.
Data Science ist heute eines der spannendsten Gebiete überhaupt. Doch warum ist sie so wichtig?
Weil Unternehmen auf einem Datenschatz sitzen. Da moderne Technologien die Erstellung und Speicherung von immer größeren Datenmengen ermöglichen, haben Datenvolumen sprunghaft zugenommen. Etwa 90 Prozent der Daten weltweit wurden in den letzten zwei Jahren erstellt. Facebook-Nutzer laden beispielsweise jede Stunde 10 Millionen Fotos hoch.
Diese Daten befinden sich jedoch häufig nur in Datenbanken und Data Lakes, die größtenteils unberührt bleiben.
Die Fülle der Daten, die von diesen Technologien erfasst und gespeichert werden, kann Unternehmen und Gesellschaften rund um den Globus transformative Vorteile einbringen – aber nur, wenn wir diese Daten auch interpretieren können. Hier kommt Data Science ins Spiel.
Data Science zeigt Trends auf und erzeugt Daten, mit denen Unternehmen bessere Entscheidungen treffen und innovativere Produkte und Services anbieten können. Am wichtigsten ist vielleicht, dass Machine-Learning-Modelle (ML) aus den riesigen Datenmengen, die eingespeist werden, lernen können, anstatt sich hauptsächlich auf Business Analysts zu verlassen und festzustellen, was diese aus den Daten ableiten können.
Daten sind das Fundament der Innovation, aber ihr Wert ergibt sich aus den Informationen, die Data Scientists aus ihnen gewinnen und auf die sie reagieren können.
Zum besseren Verständnis der Data Science – und wie man sie nutzen kann – ist es wichtig, andere Begriffe zu kennen, die sich auf das Gebiet beziehen, wie künstliche Intelligenz (KI) und Machine Learning. Diese Begriffe werden häufig synonym verwendet, unterscheiden sich aber in Nuancen.
Hier ist eine einfache Aufschlüsselung:
Als Zugabe folgt noch eine weitere Definition:
Unternehmen setzen Data Science ein, um Produkte und Services zu optimieren und so Daten als Wettbewerbsvorteile zu nutzen. Zu den Anwendungsfällen für Data Science und Machine Learning gehören:
Viele Unternehmen haben Data Science hohe Priorität eingeräumt und tätigen erhebliche Investitionen in diesen Bereich. In einer aktuellen Befragung von Gartner unter mehr als 3.000 CIOs wurden Analysen und Business Intelligence als die Technologien genannt, die die größten Wettbewerbsvorteile für ihre Unternehmen ermöglichen. Die befragten CIOs betrachten diese Technologien als die strategischsten für ihre Unternehmen und investieren entsprechend.
Das Verfahren, um Daten zu analysieren und auf die Ergebnisse zu reagieren, ist eher iterativ denn linear. Es lässt sich dennoch ein typischer Data Science-Ablauf für ein Datenmodellierungsprojekt aufzeigen:
Das Erstellen, Bewerten, Bereitstellen und Überwachen von Machine-Learning-Modellen kann ein komplexer Prozess sein. Aus diesem Grund hat die Anzahl der Data Science-Tools zugenommen. Data Scientists verwenden die unterschiedlichsten Tools. Zu den häufigsten gehören Open-Source-Notebooks – Webanwendungen für das Schreiben und Ausführen von Code, das Visualisieren von Daten und Anzeigen der Ergebnisse in einer einzigen Umgebung.
Zu den beliebtesten Notebooks gehören Jupyter, RStudio und Zeppelin. Notebooks sind sehr nützlich, um Analysen durchzuführen. Sie stoßen allerdings an ihre Grenzen, wenn Data Scientists im Team zusammenarbeiten müssen. Um dieses Problem zu beheben, wurden Datenanalyse-Plattformen entwickelt.
Um festzustellen, welches Data Science-Tool für Sie geeignet ist, müssen Sie die folgenden Fragen stellen: Welche Sprachen verwenden Ihre Data Scientists? Welche Arbeitsmethoden bevorzugen sie? Welche Art von Datenquellen verwenden sie?
Einige Nutzer bevorzugen beispielsweise einen datenquellenunabhängigen Dienst, der Open-Source-Bibliotheken nutzt. Andere bevorzugen datenbankinterne Machine-Learning-Algorithmen aufgrund ihrer Geschwindigkeit.
In den meisten Unternehmen werden Data Science-Projekte in der Regel von drei Arten von Managern überwacht:
Der wichtigste Akteur in diesem Prozess ist jedoch der Data Scientist.
Data Science ist ein ziemlich neues Fachgebiet. Sie entwickelte sich aus den Bereichen der statistischen Analyse und des Data Mining. Das Data Science Journal erschien erstmals im Jahr 2002, veröffentlicht vom Committee on Data for Science and Technology des Internationalen Wissenschaftsrats. 2008 hatte sich der Titel Data Scientist etabliert, das Fachgebiet entwickelte sich rasant weiter. Seitdem mangelt es an Data Scientists, obwohl immer mehr Hochschulen und Universitäten entsprechende Studiengänge anbieten.
Die Aufgaben eines Data Scientists umfassen z. B. die Entwicklung von Strategien für die Datenanalyse, die Vorbereitung von Daten für die Analyse, die Untersuchung, Analyse und visuelle Aufbereitung von Daten, der Aufbau von Modellen mit Daten unter Verwendung von Programmiersprachen wie Python und R oder die Implementierung von Modellen in Anwendungen.
Data Scientists arbeiten nicht allein. Tatsächlich werden die Aufgaben von Datenanalysten am effektivsten in Teamarbeit erledigt. Dieses Team kann neben dem Data Scientist beispielsweise folgende Rollen umfassen: einen Geschäftsanalysten, der das Problem definiert, einen Dateningenieur, der die Daten und den Zugriff auf sie vorbereitet, einen IT-Architekt, der für die zugrunde liegenden Prozesse und Infrastruktur verantwortlich ist, und einen Anwendungsentwickler, der die Modelle oder Ergebnisse der Analyse in Anwendungen und Produkte implementiert.
Trotz der Vorteile von Data Science und umfangreicher Investitionen in Data Science-Teams schöpfen viele Unternehmen nicht das volle Potenzial ihrer Daten aus. Bei ihren intensiven Bemühungen um qualifizierte Mitarbeiter und den Aufbau von Data Science-Programmen haben einige Unternehmen ineffiziente Arbeitsabläufe bemerkt, bei denen verschiedene Teammitglieder unterschiedliche Tools und Verfahren verwendeten, die nicht gut zusammen funktionierten. Ohne eine disziplinierte, zentrale Verwaltung können Führungskräfte ggf. nicht die bestmögliche Rendite erzielen.
Diese chaotische Umgebung hält viele Herausforderungen bereit.
Datenanalysten können nicht effizient arbeiten. Da der Zugriff auf Daten von einem IT-Administrator gewährt werden muss, warten Datenwissenschaftler oft lange auf die Daten und die Ressourcen, die sie für ihre Analyse benötigen. Sobald sie Zugriff haben, kann das Data Science-Team die Daten mit verschiedenen – und möglicherweise inkompatiblen – Tools analysieren. Ein Wissenschaftler kann beispielsweise ein Modell mit der Programmiersprache R entwickeln, aber die Anwendung, in der das Modell verwendet werden soll, ist in einer anderen Sprache programmiert. Aus diesem Grund kann es Wochen – oder sogar Monate – dauern, bis die Modelle in sinnvolle Anwendungen implementiert werden.
Anwendungsentwicklern fehlt der Zugang zu nutzbarem Machine Learning. Manchmal sind die Machine-Learning-Modelle, die Entwickler erhalten, nicht für die Implementierung in Anwendungen bereit. Da Zugriffspunkte unflexibel sein können, lassen sich Modelle nicht in allen Szenarien bereitstellen, und die Skalierbarkeit bleibt dem Anwendungsentwickler überlassen.
IT-Administratoren verbringen zu viel Zeit mit Support. Aufgrund der zunehmenden Verbreitung von Open-Source-Tools muss die IT-Abteilung immer mehr Tools unterstützen. So verwendet möglicherweise ein Data Scientist im Marketing andere Tools als ein Data Scientist im Finanzwesen. Auch die Arbeitsabläufe der einzelnen Teams können sich unterscheiden. Die IT-Abteilung muss Umgebungen daher regelmäßig neu erstellen und aktualisieren.
Business-Manager bleiben im Hinblick auf Data Science oft außen vor. Die Arbeitsabläufe der Datenanalysen sind nicht immer in die Verfahren zur geschäftlichen Entscheidungsfindung integriert. Dann wird es für Business-Manager schwierig, kompetent mit Datenanalysten zusammenzuarbeiten. Ohne eine bessere Integration lässt sich für Business-Manager nicht leicht nachvollziehen, warum zwischen der Prototyperstellung und der Produktion so viel Zeit verstreicht – und sie sind weniger gewillt, in Projekte zu investieren, die sie als zu langsam erachten.
Viele Unternehmen erkannten, dass Data Science-Projekte ohne eine integrierte Plattform ineffizient, unsicher und nur schwer skalierbar waren. Diese Erkenntnis führte zur Entwicklung von Data Science-Plattformen. Bei diesen Plattformen handelt es sich um Software-Hubs, die das Zentrum der Data Science-Projekte darstellen. Eine gute Plattform bewältigt viele der Herausforderungen bei der Implementierung von Data Science und hilft Unternehmen dabei, schneller und effizienter Erkenntnisse aus ihren Daten zu gewinnen.
Mit einer zentralen Machine-Learning-Plattform können Data Scientists in einer auf die Zusammenarbeit ausgelegten Umgebung mit ihren bevorzugten Open-Source-Tools arbeiten. Ihre Arbeit wird dabei durch ein Versionskontrollsystem synchronisiert.
Eine Data Science-Plattform verringert die Redundanz und fördert die Innovation, da sie Teams ermöglicht, Programmcode, Ergebnisse und Berichte gemeinsam zu nutzen. Durch die Vereinfachung der Verwaltung und die Einbeziehung von Best Practices werden Engpässe im Arbeitsfluss beseitigt.
Im Allgemeinen zielen die besten Data Science-Plattformen auf Folgendes ab:
Data Science-Plattformen wurden für die Zusammenarbeit einer Reihe von Nutzern entwickelt, darunter Data Science-Experten, Citizen Data Scientists, Dateningenieure und Machine-Learning-Ingenieure oder -Spezialisten. Mit einer Data Science-Plattform können Data Scientists beispielsweise Modelle als APIs bereitstellen, was die Integration in verschiedene Anwendungen vereinfacht. Datenanalysten können unabhängig vom IT-Team auf Tools, Daten und die Infrastruktur zugreifen.
Die Nachfrage nach Datenanalyse-Plattformen auf dem Markt ist explodiert. Tatsächlich dürfte das Wachstum des Plattform-Marktes in den nächsten Jahren bei einer durchschnittlichen jährlichen Rate von mehr als 39 Prozent liegen. Bis 2025 soll Prognosen zufolge ein Wert von 385 Mrd. US-Dollar erreicht werden.
Wenn Sie bereit sind, die Funktionen von Data Science-Plattformen zu erkunden, berücksichtigen Sie die folgenden zentralen Funktionen:
Ihr Unternehmen könnte für eine Data Science-Plattform bereit sein, wenn Sie Folgendes bemerkt haben:
Eine Data Science-Plattform kann Ihrem Unternehmen einen echten Mehrwert bieten. Die Data Science-Plattform von Oracle umfasst eine breite Palette von Diensten, die eine umfassende End-to-End-Erfahrung bieten, um die Modellbereitstellung zu beschleunigen und die Data Science-Ergebnisse zu verbessern.