Geen resultaten gevonden

Uw zoekopdracht heeft geen resultaten opgeleverd

Wat is data science?

Data science is een interdisciplinair vakgebied waarin wetenschappelijke methoden, processen, algoritmen en systemen worden gebruikt om waarde te genereren uit data. Datawetenschappers zetten hun kennis op uiteenlopende vlakken, zoals statistiek, informatica en bedrijfskunde, in om data te analyseren die zijn vergaard via internet, smartphones, klanten, sensoren en andere bronnen.

Data science legt trends bloot en biedt inzichten die bedrijven kunnen gebruiken om betere beslissingen te nemen en meer innovatieve producten en services te ontwikkelen. Hoewel data het fundament vormen van innovatie, is de werkelijke waarde ervan afhankelijk van welke informatie datawetenschappers eruit weten te destilleren en hoe zij erop voortborduren.

 

Tools voor datawetenschappers

Datawetenschappers gebruiken vele soorten tools, maar een van de meest voorkomende zijn open source-notebooks. Dit zijn webapplicaties waarop in één enkele omgeving codetaal kan worden geschreven, uitgevoerd en in beeld gebracht, en de resultaten te zien zijn. Enkele van de meest populaire notebooks zijn Jupyter, RStudio en Zepplin. Notebooks zijn erg handig voor het uitvoeren van analyses, maar hebben hun beperkingen wanneer meerdere datawetenschappers in een team moeten samenwerken. Om dit probleem op te lossen werden data science-platforms geïntroduceerd.

Data science en de toename in data

Data science en de toename in data

Nu de moderne technologie het mogelijk maakt om steeds grotere hoeveelheden informatie aan te maken en op te slaan, is er een ware overvloed aan data. Naar schatting is 90 procent van alle data op aarde in de afgelopen twee jaar aangemaakt. Facebook-gebruikers zijn bijvoorbeeld verantwoordelijk voor het uploaden van 10 miljoen foto's per uur. Het aantal wereldwijd verbonden apparaten (het Internet of Things, IoT) zal naar verwachting in 2025 tot boven de 75 miljard zijn gestegen.

De overvloed aan data die met deze technologieën wordt verzameld en opgeslagen, kan organisaties en leefgemeenschappen over de hele wereld de nodige voordelen opleveren, maar alleen als we die data kunnen interpreteren. En dat is waar data science om de hoek komt kijken.

Bekijk deze infographic voor meer informatie over data en data science.

De intrede van de datawetenschapper

De intrede van de datawetenschapper

Als specialisme staat data science nog in de kinderschoenen. Het stamt af van de vakgebieden statistische analyse en datamining. De Data Science Journal werd voor het eerst in 2002 uitgebracht door het International Council for Science: Committee on Data for Science and Technology. De functie van datawetenschapper werd in 2008 geïntroduceerd en steeg daarna snel in populariteit. Sindsdien is er een tekort aan datawetenschappers, ook al zijn er steeds meer hogescholen en universiteiten die opleidingen in data science aanbieden.

De taken van een datawetenschapper kunnen bestaan uit het ontwikkelen van strategieën voor het analyseren van data; het voorbereiden van data voor analyse; het bestuderen, analyseren en visualiseren van data; het ontwikkelen van datamodellen met behulp van programmeertaal zoals Python en R; en het implementeren van modellen in applicaties.

De datawetenschapper zal niet snel in zijn eentje werken. Data science is namelijk het meest doeltreffend als er in teams wordt gewerkt. In een dergelijk team kan behalve een datawetenschapper ook een bedrijfsanalist zitten die het probleem definieert, een data-engineer die de data en de toegang ervan voorbereidt en beheert, een IT-architect die de onderliggende processen en infrastructuur overziet, en een applicatieontwikkelaar die de analysemodellen of -resultaten verwerkt in applicaties en producten.

Hoe data science bedrijven transformeert

Organisaties gebruiken data science-teams om data te veranderen in een concurrentievoordeel door producten en services te verfijnen. Bedrijven analyseren bijvoorbeeld data die zijn verzameld van callcenters om klanten te identificeren die op het punt staan om over te stappen, zodat marketing actie kan ondernemen om ze te behouden. Logistiekbedrijven analyseren verkeerspatronen, weersomstandigheden en andere factoren om de bezorging sneller te maken en de kosten te verlagen. Gezondheidszorgbedrijven analyseren medische testdata en gerapporteerde symptomen om artsen te helpen ziekten sneller te diagnosticeren en effectiever te behandelen.

De meeste bedrijven geven data science nu prioriteit en stoppen er veel geld in. In een recente enquête van Gartner onder ruim 3000 CIO's gaven respondenten aan analytics en business intelligence als de meest onderscheidende technologieën voor hun organisatie te beschouwen. De ondervraagde CIO's zien deze technologieën als de meest strategische keuze voor hun bedrijf, wat ook de reden is waarom het zo aantrekkelijk is hierin te investeren.

Hoe data science wordt toegepast

Hoe data science wordt toegepast

Hoewel het proces van het analyseren en interpreteren van data eerder een iteratief dan een lineair verloop heeft, is er een aantal taken dat typerend is voor een data modeling-project:

  • Plannen: een project met de potentiële outputs definiëren
  • Voorbereiden: de werkomgeving opzetten en er daarbij voor zorgen dat datawetenschappers over de juiste tools en toegangsrechten beschikken voor de juiste data en bronnen, zoals voldoende computingvermogen
  • Invoeren: de data invoeren in de werkomgeving
  • Bestuderen: de data analyseren, bestuderen en visualiseren
  • Modelleren: modellen zo ontwikkelen, aanleren en valideren dat ze het beoogde effect hebben
  • Implementeren: modellen implementeren in productieprocessen

Wie houdt toezicht op het data science-proces?

Wie houdt toezicht op het data science-proces?

Het data science-proces wordt meestal beheerd door drie soorten managers:

  • Bedrijfsmanagers: Deze managers werken samen met het data science-team om het probleem te definiëren en een strategie voor analyse te ontwikkelen. Zij kunnen het hoofd zijn van een afdeling, zoals marketing, finance of sales, en hebben een data science-team dat aan hen rapporteert. Deze managers werken nauw samen met de data science- en IT-manager om ervoor te zorgen dat projecten worden opgeleverd.
  • IT-managers: Senior IT-managers zijn verantwoordelijk voor de infrastructuurplanning en -architectuur die de data science-activiteiten ondersteunen. Zij houden continu toezicht op de werkzaamheden en het verbruik van middelen om ervoor te zorgen dat de data science-teams efficiënt en veilig werken. Mogelijk hebben zij ook de taak om omgevingen te ontwikkelen en up-to-date te houden voor data science-teams.
  • Data science-managers: Deze managers houden toezicht op het data science-team en hun dagelijkse werk. Het zijn teambuilders die het team zo aansturen dat er een goede balans ontstaat met de projectplanning en -monitoring.

Uitdagingen bij het toepassen van data science

Ondanks de hoge verwachtingen van data science en de enorme investeringen die er in data science-teams worden gedaan, lukt het veel bedrijven nog niet hun data ten volste te benutten. In hun haast om talenten aan te nemen en data science-programma's op te stellen, kregen sommige bedrijven te maken met inefficiënte teamworkflows waarbij verschillende mensen allerlei tools en processen gebruikten die uiteindelijk niet goed met elkaar bleken te werken. Zonder een meer gedisciplineerd en gecentreerd management zien leidinggevenden een optimaal resultaat van hun investeringen mogelijk aan hun neus voorbij gaan. Een chaotische omgeving zorgt voor veel problemen.

Datawetenschappers kunnen niet efficiënt werken. Omdat een IT-beheerder toestemming moet geven om toegang te krijgen tot data, moeten datawetenschappers vaak lang wachten op de data en de middelen die ze nodig hebben om de data te analyseren. Als ze eenmaal toegang hebben, gebruikt het data science-team mogelijk meerdere analysetools, die soms ook nog incompatibel zijn. Een datawetenschapper kan bijvoorbeeld een model ontwikkelen met het programma 'R', terwijl de applicatie waarin het model zal worden gebruikt met een ander programma is geschreven. En dat is ook de reden waarom het weken, of zelfs maanden, kan duren voordat de modellen in bruikbare applicaties in gebruik zijn genomen.

Applicatieontwikkelaars hebben geen toegang tot bruikbare machine learning. Soms moeten de machine learning-modellen die ontwikkelaars ontvangen opnieuw worden gecodeerd of zijn ze nog niet klaar om in applicaties te worden gebruikt. En aangezien toegangspunten niet altijd even flexibel zijn, kunnen modellen niet in alle scenario's worden gebruikt en wordt de schaalbaarheid overgelaten aan de ontwikkelaar van de applicatie.

IT-beheerders besteden te veel tijd aan ondersteuning. Doordat het aantal open source-tools sterk toeneemt, wordt de lijst met tools waarvoor IT ondersteuning moet bieden steeds langer. Een datawetenschapper bij Marketing kan bijvoorbeeld andere tools gebruiken dan een data-wetenschapper bij Finance. Teams kunnen ook verschillende workflows hebben, wat voor IT betekent dat ze voortdurend omgevingen moeten ombouwen en updaten.

Bedrijfsmanagers staan te ver af van data science. Data science-workflows worden niet altijd geïntegreerd in de besluitvormingsprocessen en -systemen van een bedrijf, waardoor het voor bedrijfsmanagers moeilijk wordt om kennis te delen met datawetenschappers. Zonder die integratie is het voor managers moeilijk te begrijpen waarom het proces van prototype naar productie zo lang moet duren. Bovendien zullen zij niet snel achter investeringen staan in projecten die zij te traag vinden gaan.

De opmars van het data science-platform

De opmars van het data science-platform

Bij bedrijven is het besef gekomen dat data science-activiteiten inefficiënt, onveilig en lastig te schalen zijn zonder geïntegreerd platform. Dit besef heeft tot de opkomst van de data science-platforms geleid. Dit soort platforms zijn in feite softwarehubs die de basis vormen van alle data science-werkzaamheden. Een goed platform neemt veel van de uitdagingen bij de implementatie van met data science weg en zorgt ervoor dat bedrijven hun data sneller en efficiënter in inzichten kunnen omzetten.

Een gecentraliseerd platform biedt datawetenschappers een op samenwerking gerichte omgeving waarin zij hun favoriete open source-tools kunnen gebruiken, terwijl al het werk automatisch wordt gesynchroniseerd via een versiebeheersysteem.

Maak het verschil met een zelfvoorzienend data science-platform.

De voordelen van een data science-platform

De voordelen van een data science-platform

Een data science-platform biedt teams de mogelijkheid om codes, resultaten en rapporten uit te wisselen, zodat de hoeveelheid overbodig werk kan worden teruggedrongen en innovatie wordt gestimuleerd. Daarbij worden knelpunten in de workflow weggenomen door middel van een vereenvoudigd beheer en het gebruik van open source-tools, -frameworks en -infrastructuur.

Zo kunnen datawetenschappers met behulp van een data science-platform bijvoorbeeld modellen als API's implementeren, waardoor het eenvoudig is om ze in verschillende applicaties te integreren. Datewetenschappers hebben toegang tot tools, data en infrastructuur zonder hiervoor op IT te hoeven wachten.

De vraag op de markt naar data science-platforms is explosief gestegen. Zelfs zoveel dat de jaarlijkse samengestelde groei van de platformmarkt naar verwachting de komende jaren met meer dan 39 procent zal toenemen tot een geschatte 385 miljard dollar in 2025.

Als u eenmaal hebt besloten de mogelijkheden van data science-platforms verder te verkennen, zijn er enkele zaken om rekening mee te houden:

  • Kies een op uw project gebaseerde gebruikersinterface die samenwerking stimuleert. . Het platform moet mensen in staat stellen om samen aan een model te werken, van idee tot en met ontwikkeling. Elk teamlid moet hierop zelf aan de benodigde data en middelen kunnen komen.
  • Geef prioriteit aan integratie en flexibiliteit. Zorg ervoor dat het platform ondersteuning biedt voor de nieuwste open source-tools, gangbare versiebeheerproviders zoals GitHub, GitLab en Bitbucket en een strak afgestemde integratie met andere bronnen.
  • Neem er functionaliteit van ondernemingsniveau in op. Zorg ervoor dat het platform kan meegroeien met uw team én uw bedrijf. Het platform moet een hoge beschikbaarheidsgraad bieden, een robuust beveiligingssysteem hebben en gelijktijdig gebruik door een groot aantal mensen ondersteunen.
  • Maak data science meer zelfvoorzienend. Zoek naar een platform dat de druk van IT en engineering kan wegnemen en het voor datawetenschappers gemakkelijk maakt om in een handomdraai omgevingen in werking te stellen, al hun werk bij te houden en modellen eenvoudig toe te passen op de productie.

Bedrijven hebben moeite om data science-talenten te vinden

Het vinden en werven van talent vormt het grootste obstakel voor bedrijven wanneer ze met behulp van data science proberen om de concurrentie voor te blijven. In een recente enquête van McKinsey & Company gaf de helft van de leidinggevenden uit verschillende regio's en sectoren aan meer moeite te hebben om mensen te werven die uitblinken op analytisch vlak dan op welk ander vlak dan ook. Daarnaast beschouwt 40 procent van de ondervraagden retentie als een probleem.

Behalve aan datawetenschappers is er volgens McKinsey ook een gebrek aan talent in andere analyticsgebieden. Er is vooral een tekort aan geschoolde krachten die problemen binnen een bedrijf aan het juiste toepassingsgebied van data science kunnen koppelen en aan personeel dat goed is in het visualiseren van data.

Ook Indeed.com, Glassdoor en Bloomberg tonen aan dat er een grote vraag is naar data science-talent:

  • Volgens Bloomberg steeg het aantal vacatures voor datawetenschappers op Indeed.com met 75 procent tussen januari 2015 en januari 2018. Het aantal zoekopdrachten voor data science-functies nam met 65 procent toe.
  • Glassdoor heeft berekend dat de vraag naar datawetenschappers in 2018 het aanbod met 50 procent heeft overschreden.
  • Volgens Glassdoor staat datawetenschapper voor het derde jaar op rij bovenaan de lijst van functies in Amerika.

Artificial Intelligence Learning-bibliotheek

Wat is kunstmatige intelligentie?
Meer informatie over kunstmatige intelligentie

Kunstmatige intelligentie (Artificial Intelligence, AI) maakt het mogelijk om data zo door technologie en machines te laten verwerken dat deze ervan leren, zich ontwikkelen en taken van mensen kunnen overnemen.

Meer informatie over machine learning
Meer informatie over machine learning

Machine learning is een vorm van kunstmatige intelligentie (AI) die is gericht op het bouwen van systemen die leren door middel van data, met als doel de besluitvorming te automatiseren en verkorten, en sneller waarde te creëren.

Nieuws en opinie
Nieuws en opinie

Machine learning, kunstmatige intelligentie en data science veranderen de manier waarop bedrijven complexe problemen benaderen. Daardoor verandert ook het traject van hun branche. Lees de nieuwste artikelen om te begrijpen hoe de branche en uw collega-bedrijven omgaan met deze technologieën.