Geen resultaten gevonden

Uw zoekopdracht heeft geen resultaten opgeleverd.

We raden u aan het volgende te proberen om te vinden wat u zoekt:

  • Controleer de spelling van het trefwoord in uw zoekopdracht.
  • Gebruik synoniemen voor het trefwoord dat u hebt getypt. Probeer bijvoorbeeld “applicatie” in plaats van “software”.
  • Probeer een van de onderstaande populaire zoekopdrachten.
  • Start een nieuwe zoekopdracht.
Populaire vragen

Datawetenschap

Dit is een eenvoudige definitie van datawetenschap:

Datawetenschap combineert meerdere gebieden, waaronder statistiek, wetenschappelijke methoden en data-analyse om waarde te extraheren uit data.

De mensen die datawetenschap beoefenen, worden datawetenschappers genoemd en combineren diverse vaardigheden om data te analyseren die is vergaard via internet, smartphones, klanten, sensoren en andere bronnen.

Data: een onbenutte bron voor machine learning

Datawetenschap is een van de meest opwindende gebieden van deze tijd. Maar waarom is het zo belangrijk?

Omdat bedrijven op een ware schat aan data zitten. Nu de moderne technologie het mogelijk maakt om steeds grotere hoeveelheden informatie aan te maken en op te slaan, is er een ware overvloed aan data. Naar schatting is 90 procent van alle data op aarde in de afgelopen twee jaar aangemaakt. Facebook-gebruikers zijn bijvoorbeeld verantwoordelijk voor het uploaden van 10 miljoen foto's per uur.

Maar deze data zit vaak nog gewoon in databases en data lakes, meestal onaangeroerd.

De overvloed aan data die met deze technologieën wordt verzameld en opgeslagen, kan organisaties en leefgemeenschappen over de hele wereld de nodige voordelen opleveren, maar alleen als we die data kunnen interpreteren. En dat is waar datawetenschap om de hoek komt kijken.

Datawetenschap legt trends bloot en biedt inzichten die bedrijven kunnen gebruiken om betere beslissingen te nemen en meer innovatieve producten en services te ontwikkelen. Het belangrijkste is misschien wel dat het machine learning-modellen (ML) in staat stelt om te leren van de enorme hoeveelheden data die in die modellen worden ingevoerd, in plaats van te vertrouwen op bedrijfsanalisten om te zien wat ze in de data kunnen ontdekken.

Hoewel data de basis vormt voor innovatie, is de werkelijke waarde ervan afhankelijk van welke informatie datawetenschappers eruit weten te destilleren en hoe ze er vervolgens naar handelen.

Wat is het verschil tussen datawetenschap, kunstmatige intelligentie en machine learning?

Wat is het verschil tussen datawetenschap, kunstmatige intelligentie en machine learning?

Om beter te begrijpen wat datawetenschap inhoudt - en hoe u het kunt gebruiken - is het even belangrijk om andere termen te kennen die verband houden met het vakgebied, zoals kunstmatige intelligentie (AI) en machine learning. U zult vaak zien dat deze termen door elkaar worden gebruikt, maar er zijn nuanceverschillen.

Hier is een eenvoudig overzicht:

  • AI houdt in dat je een computer op een bepaalde manier menselijk gedrag kunt laten nabootsen.
  • Datawetenschap is een subgroep van AI en verwijst meer naar de overlappende gebieden van statistiek, wetenschappelijke methoden en data-analyse, die allemaal worden gebruikt om betekenis en inzichten aan data te ontlenen.
  • Machine learning is weer een andere subgroep van AI en bestaat uit de technieken waarmee computers dingen uit de data kunnen achterhalen en AI-toepassingen kunnen leveren.

Voor de volledigheid voegen we nog een andere definitie toe:

  • Deep learning, wat een subgroep van machine learning is, waarmee computers complexere problemen kunnen oplossen.

Hoe datawetenschap bedrijven transformeert

Datawetenschap en de toename in data

Organisaties gebruiken datawetenschapsteams om data te veranderen in een concurrentievoordeel door producten en services te verfijnen. Gebruiksscenario's voor datawetenschap en machine learning zijn onder meer:

  • Bepalen van het klantverloop door in callcenters verzamelde data te analyseren, zodat marketing actie kan ondernemen om deze klanten te behouden
  • Verbeteren van de efficiëntie door het analyseren van verkeerspatronen, weersomstandigheden en andere factoren, zodat logistieke bedrijven de bezorging sneller kunnen maken en de kosten kunnen verlagen
  • Het verbeteren van diagnoses van patiënten door medische testdata en gemelde symptomen te analyseren, zodat artsen ziekten eerder kunnen diagnosticeren en effectiever kunnen behandelen
  • Optimaliseren van de supply chain door te voorspellen wanneer apparatuur het begeeft
  • Detecteren van fraude bij financiële diensten door verdacht gedrag en abnormale acties te herkennen
  • Verbeteren van de verkooporganisatie door aanbevelingen voor klanten te maken op basis van eerdere aankopen

Veel bedrijven geven datawetenschap nu prioriteit en stoppen er veel geld in. In een recente enquête van Gartner onder ruim 3000 CIO's gaven respondenten aan analytics en business intelligence als de meest onderscheidende technologieën voor hun organisatie te beschouwen. De ondervraagde CIO's beschouwen deze technologieën als de meest strategische voor hun bedrijven en investeren dienovereenkomstig.

Hoe datawetenschap wordt toegepast

Hoe datawetenschap wordt toegepast

Hoewel het proces van analyseren en interpreteren van data eerder een iteratief dan een lineair verloop heeft, is er een duidelijke flow in de datawetenschappelijke levenscyclus voor een datamodelleringsproject:

  • Planning: het definiëren van een project en de potentiële output.
  • Een datamodel bouwen: datawetenschappers gebruiken vaak verschillende open source-bibliotheken of in-database-tools om machine learning-modellen te bouwen. Gebruikers willen vaak API's ter ondersteuning van data-invoer, dataprofilering en visualisatie of functie-engineering. Ze hebben de juiste tools nodig, maar ook toegang tot de juiste data en andere bronnen, zoals rekenkracht.
  • Een model evalueren: datawetenschappers moeten een hoog nauwkeurigheidspercentage realiseren voor hun modellen voordat ze er zeker van kunnen zijn dat ze het kunnen implementeren. Bij modelevaluatie wordt doorgaans een uitgebreide reeks evaluatiedata en visualisaties gegenereerd om de modelprestaties te meten ten opzichte van nieuwe data, en ze ook in de loop der tijd te rangschikken om optimaal gedrag in productie mogelijk te maken. Modelevaluatie gaat verder dan de ruwe prestaties om rekening te houden met het verwachte basisgedrag.
  • Modellen verklaren: het is niet altijd mogelijk geweest om de interne mechanismen van de resultaten van machine learning-modellen in menselijke termen uit te leggen. Dit wordt echter wel steeds belangrijker. Datawetenschappers willen geautomatiseerde verklaringen van de relatieve weging en het belang van factoren die een rol spelen bij het genereren van een voorspelling en modelspecifieke verklarende details over modelvoorspellingen.
  • Een model implementeren: het is vaak een moeilijk en arbeidsintensief proces om een getraind machine learning-model in de juiste systemen te implementeren. Dit kan gemakkelijker worden gemaakt door modellen te operationaliseren als schaalbare en veilige API's of door in-database machine learning-modellen te gebruiken.
  • Modellen bewaken: helaas is het na het implementeren van een model niet klaar. Modellen moeten na implementatie altijd worden gecontroleerd om er zeker van te zijn dat ze correct werken. De data waarop het model is getraind, is na verloop van tijd mogelijk niet langer relevant voor toekomstige voorspellingen. Bij fraudedetectie vinden criminelen bijvoorbeeld altijd nieuwe manieren om accounts te hacken.

Tools voor datawetenschap

Tools voor datawetenschap

Het bouwen, evalueren, implementeren en bewaken van machine learning-modellen kan een complex proces zijn. Daarom is er een toename van het aantal datawetenschappelijke tools. Datawetenschappers gebruiken vele soorten tools, maar een van de meest voorkomende zijn open source-notebooks. Dit zijn webapplicaties waarop in één enkele omgeving codetaal kan worden geschreven, uitgevoerd en in beeld gebracht, en de resultaten te zien zijn.

Enkele van de meest populaire notebooks zijn Jupyter, RStudio en Zeppelin. Notebooks zijn erg handig voor het uitvoeren van analyses, maar hebben hun beperkingen wanneer meerdere datawetenschappers in een team moeten samenwerken. Om dit probleem op te lossen werden datawetenschapsplatforms gebouwd.

Om te bepalen welke datawetenschapstool voor u geschikt is, is het belangrijk om de volgende vragen te stellen: Welke talen gebruiken uw datawetenschappers? Wat voor soort werkmethoden hebben ze het liefst? Wat voor soort databronnen gebruiken ze?

Sommige gebruikers geven bijvoorbeeld de voorkeur aan een datasource-agnostische service die gebruikmaakt van open source-bibliotheken. Anderen geven de voorkeur aan de snelheid van in-database, machine learning-algoritmen.

Wie houdt toezicht op het datawetenschappelijk proces?

Wie houdt toezicht op het datawetenschappelijk proces?

Bij de meeste organisaties worden datawetenschapsprojecten doorgaans beheerd door drie soorten managers:

  • Bedrijfsmanagers: Deze managers werken samen met het datawetenschapsteam om het probleem te definiëren en een strategie voor analyse te ontwikkelen. Zij kunnen het hoofd zijn van een afdeling, zoals marketing, finance of verkooporganisatie, en hebben een datawetenschapsteam onder zich. Deze managers werken nauw samen met de datawetenschaps- en IT-manager om ervoor te zorgen dat projecten worden opgeleverd.
  • IT-managers: Senior IT-managers zijn verantwoordelijk voor de infrastructuurplanning en -architectuur die de datawetenschapsactiviteiten ondersteunen. Zij houden continu toezicht op de werkzaamheden en het verbruik van middelen om ervoor te zorgen dat de datawetenschapsteams efficiënt en veilig werken. Mogelijk hebben zij ook de taak om IT-omgevingen te ontwikkelen en up-to-date te houden voor datawetenschapsteams.
  • Datawetenschapsmanagers: Deze managers houden toezicht op het datawetenschapsteam en hun dagelijkse werk. Het zijn teambuilders die het team zo aansturen dat er een goede balans ontstaat met de projectplanning en -monitoring.

Maar de belangrijkste speler in dit proces is de datawetenschapper.

Wat is een datawetenschapper?

Wat is een datawetenschapper?

Als specialisme staat datawetenschap nog in de kinderschoenen. Het stamt af van de vakgebieden statistische analyse en datamining. De Data Science Journal werd voor het eerst in 2002 uitgebracht door het International Council for Science: Committee on Data for Science and Technology. De functie van datawetenschapper werd in 2008 geïntroduceerd en steeg daarna snel in populariteit. Sindsdien is er een tekort aan datawetenschappers, ook al zijn er steeds meer hogescholen en universiteiten die opleidingen in datawetenschap aanbieden.

De taken van een datawetenschapper kunnen bestaan uit het ontwikkelen van strategieën voor het analyseren van data, het voorbereiden van data voor analyse, het bestuderen, analyseren en visualiseren van data, het ontwikkelen van datamodellen met behulp van programmeertaal zoals Python en R en het implementeren van modellen in applicaties.

De datawetenschapper zal niet snel in zijn eentje werken. Datawetenschap is namelijk het meest doeltreffend als er in teams wordt gewerkt. In een dergelijk team kan behalve een datawetenschapper ook een bedrijfsanalist zitten die het probleem definieert, een data-engineer die de data en de toegang ervan voorbereidt en beheert, een IT-architect die de onderliggende processen en infrastructuur overziet en een applicatieontwikkelaar die de analysemodellen of -resultaten verwerkt in applicaties en producten.

Uitdagingen bij het implementeren van datawetenschapsprojecten

Wat is een datawetenschapper?

Ondanks de hoge verwachtingen van datawetenschap en de enorme investeringen die er in datawetenschapsteams worden gedaan, lukt het veel bedrijven nog niet hun data ten volste te benutten. In hun haast om talenten aan te nemen en datawetenschapsprogramma's op te stellen, kregen sommige bedrijven te maken met inefficiënte teamworkflows waarbij verschillende mensen allerlei tools en processen gebruikten die uiteindelijk niet goed met elkaar bleken te werken. Zonder een meer gedisciplineerd en gecentraliseerd management zien leidinggevenden een optimaal resultaat van hun investeringen mogelijk aan hun neus voorbij gaan.

Een chaotische omgeving zorgt voor veel problemen.

Datawetenschappers kunnen niet efficiënt werken. Omdat een IT-beheerder toestemming moet geven om toegang te krijgen tot data, moeten datawetenschappers vaak lang wachten op de data en de middelen die ze nodig hebben om de data te analyseren. Als ze eenmaal toegang hebben, kan het datawetenschapsteam verschillende - en mogelijk incompatibele - tools gebruiken voor analyse. Een datawetenschapper kan bijvoorbeeld een model ontwikkelen met het programma 'R', terwijl de applicatie waarin het model zal worden gebruikt met een ander programma is geschreven. En dat is ook de reden waarom het weken, of zelfs maanden, kan duren voordat de modellen in bruikbare applicaties in gebruik zijn genomen.

Applicatieontwikkelaars hebben geen toegang tot bruikbare machine learning. Soms zijn de machine learning-modellen die ontwikkelaars ontvangen nog niet klaar om in applicaties te worden gebruikt. En aangezien toegangspunten niet altijd even flexibel zijn, kunnen modellen niet in alle scenario's worden gebruikt en wordt de schaalbaarheid overgelaten aan de ontwikkelaar van de applicatie.

IT-beheerders besteden te veel tijd aan ondersteuning. Doordat het aantal open source-tools sterk toeneemt, wordt de lijst met tools waarvoor IT ondersteuning moet bieden steeds langer. Een datawetenschapper bij Marketing kan bijvoorbeeld andere tools gebruiken dan een datawetenschapper bij Finance. Teams kunnen ook verschillende workflows hebben, wat voor IT betekent dat ze voortdurend omgevingen moeten ombouwen en updaten.

Bedrijfsmanagers staan te ver van datawetenschap af. Datawetenschapsworkflows worden niet altijd geïntegreerd in de besluitvormingsprocessen en -systemen van een bedrijf, waardoor het voor bedrijfsmanagers moeilijk wordt om kennis te delen met datawetenschappers. Zonder die integratie is het voor managers moeilijk te begrijpen waarom het proces van prototype naar productie zo lang moet duren. Bovendien zullen zij niet snel achter investeringen staan in projecten die zij te traag vinden gaan.

Het datawetenschapsplatform biedt nieuwe mogelijkheden

De opmars van het datawetenschapsplatform

Veel bedrijven zijn tot het besef gekomen dat datawetenschapsactiviteiten inefficiënt, onveilig en lastig te schalen zijn zonder geïntegreerd platform. Dit besef heeft tot de opkomst van datawetenschapsplatforms geleid. Dit soort platforms zijn in feite softwarehubs die de basis vormen van alle datawetenschappelijke werkzaamheden. Een goed platform neemt veel van de uitdagingen bij de implementatie van datawetenschap weg en zorgt ervoor dat bedrijven hun data sneller en efficiënter in inzichten kunnen omzetten.

Een gecentraliseerd machine learning-platform biedt datawetenschappers een op samenwerking gerichte omgeving waarin zij hun favoriete open source-tools kunnen gebruiken, terwijl al het werk automatisch wordt gesynchroniseerd via een versiebeheersysteem.

De voordelen van een datawetenschapsplatform

De voordelen van een datawetenschapsplatform

Een datawetenschapsplatform biedt teams de mogelijkheid om codes, resultaten en rapporten uit te wisselen, zodat de hoeveelheid overbodig werk kan worden teruggedrongen en innovatie wordt gestimuleerd. Het verwijdert knelpunten in de werkstroom door het beheer te vereenvoudigen en best practices op te nemen.

Over het algemeen zijn de beste datawetenschapsplatforms gericht op:

  • Zorgen dat datawetenschappers productiever worden door hen te helpen versnellen en modellen sneller en met minder fouten te leveren
  • Zorgen dat het voor datawetenschappers gemakkelijker wordt om te werken met grote volumes en uiteenlopende data
  • Leveren van vertrouwde kunstmatige intelligentie op bedrijfsniveau die onbevooroordeeld, controleerbaar en reproduceerbaar is

Datawetenschapsplatforms zijn gebouwd voor samenwerking door een reeks gebruikers, waaronder deskundige datawetenschappers, citizen-datawetenschappers, data-ingenieurs en machine learning-ingenieurs of specialisten. Zo kunnen datawetenschappers met behulp van een datawetenschapsplatform bijvoorbeeld modellen als API's implementeren, waardoor het eenvoudig is om ze in verschillende applicaties te integreren. Datewetenschappers hebben toegang tot tools, data en infrastructuur zonder hiervoor op IT te hoeven wachten.

De vraag op de markt naar datawetenschapsplatforms is explosief gestegen. Zelfs zoveel dat de jaarlijkse samengestelde groei van de platformmarkt naar verwachting de komende jaren met meer dan 39 procent zal toenemen tot een geschatte 385 miljard dollar in 2025.

De eisen die een datawetenschapper stelt aan een platform

De eisen die een datawetenschapper stelt aan een platform

Als u eenmaal hebt besloten de mogelijkheden van datawetenschapsplatforms verder te verkennen, zijn er enkele zaken om rekening mee te houden:

  • Kies een op uw project gebaseerde gebruikersinterface die samenwerking stimuleert. Het platform moet mensen in staat stellen om samen aan een model te werken, van idee tot en met ontwikkeling. Elk teamlid moet hierop zelf aan de benodigde data en middelen kunnen komen.
  • Geef prioriteit aan integratie en flexibiliteit. Zorg ervoor dat het platform ondersteuning biedt voor de nieuwste open source-tools, gangbare versiebeheerproviders (zoals GitHub, GitLab en Bitbucket) en een strak afgestemde integratie met andere bronnen.
  • Neem er functionaliteit van ondernemingsniveau in op. Zorg ervoor dat het platform kan meegroeien met uw team én uw bedrijf. Het platform moet een hoge beschikbaarheidsgraad bieden, een robuust beveiligingssysteem hebben en gelijktijdig gebruik door een groot aantal mensen ondersteunen.
  • Maak datawetenschap meer zelfvoorzienend. Zoek naar een platform dat de druk van IT en engineering kan wegnemen en het voor datawetenschappers gemakkelijk maakt om in een handomdraai omgevingen in werking te stellen, al hun werk bij te houden en modellen eenvoudig toe te passen op de productie.
  • Zorg voor een eenvoudigere modelimplementatie. Modelimplementatie en operationalisering is een van de belangrijkste stappen in de levenscyclus van machine learning, maar wordt vaak genegeerd. Zorg ervoor dat de service die u kiest het eenvoudiger maakt om modellen te operationaliseren, of het nu gaat om het leveren van API's of om ervoor te zorgen dat gebruikers modellen bouwen op een manier die eenvoudige integratie mogelijk maakt.

Wanneer een datawetenschapsplatform de juiste zet is

Uw organisatie is mogelijk klaar voor een datawetenschapsplatform, als u hebt gemerkt dat:

  • Productiviteit en samenwerking onder druk lijken te staan
  • Machine learning-modellen niet kunnen worden gecontroleerd of gereproduceerd
  • Modellen nooit in productie worden gezet.

Een datawetenschapsplatform kan echte meerwaarde voor uw bedrijf opleveren. Het datawetenschapsplatform van Oracle omvat een breed scala aan services die een uitgebreide, end-to-end-ervaring bieden, die is ontworpen om de implementatie van modellen te versnellen en de wetenschappelijke resultaten van data te verbeteren.

Data Science Learning-bibliotheek

Wat is kunstmatige intelligentie?
Meer informatie over kunstmatige intelligentie

Kunstmatige intelligentie (Artificial Intelligence, AI) maakt het mogelijk om data zo door technologie en machines te laten verwerken dat deze ervan leren, zich ontwikkelen en taken van mensen kunnen overnemen.

Meer informatie over machine learning
Meer informatie over machine learning

Machine learning is een vorm van kunstmatige intelligentie (AI) die is gericht op het bouwen van systemen die leren door middel van data, met als doel de besluitvorming te automatiseren en verkorten, en sneller waarde te creëren.

Nieuws en opinie
Nieuws en opinie

Machine learning, kunstmatige intelligentie en datawetenschap veranderen de manier waarop bedrijven complexe problemen benaderen. Daardoor verandert ook het traject van hun branche. Lees de nieuwste artikelen om te begrijpen hoe de branche en uw collega-bedrijven met deze technologieën omgaan.