Databeheer omvat het op een veilige, efficiënte en kosteneffectieve wijze verzamelen, bewaren en gebruiken van data. Het doel van databeheer is mensen, organisaties en aanverwante zaken te helpen het gebruik van data te optimaliseren binnen de grenzen van beleid en regelgeving, zodat ze beslissingen kunnen nemen en acties kunnen ondernemen die het voordeel voor de organisatie maximaliseren. Een robuuste datamanagementstrategie wordt belangrijker dan ooit, omdat organisaties in toenemende mate afhankelijk zijn van immateriële bedrijfsmiddelen om toegevoegde waarde te creëren.
Het beheren van digitale data binnen een organisatie omvat een breed scala aan taken, beleid, procedures en werkwijzen. Databeheer heeft een breed bereik, waarbij allerlei factoren meespelen, zoals:
Een formele databeheerstrategie richt zich op de activiteit van gebruikers en beheerders, de mogelijkheden van databeheertechnologieën, de eisen van reglementaire vereisten en de behoeften van de organisatie om waarde uit data te halen.
In de moderne digitale economie is data een soort kapitaal, een economische factor in de productie van digitale goederen en diensten. Net zoals een autofabrikant geen nieuw model kan maken als hij niet over het benodigde financiële kapitaal beschikt, kan hij zijn auto's ook niet autonoom maken als het hem ontbreekt aan de data om de onboard-algoritmen te voeden. Deze nieuwe rol voor data heeft zowel gevolgen voor de concurrentiestrategie als voor de toekomst van computing.
Gezien deze centrale en cruciale rol van data, zijn krachtige beheerprocessen en een robuust beheersysteem essentieel voor elke organisatie, ongeacht grootte of type.
Moderne organisaties hebben een databeheeroplossing nodig die een efficiënte manier biedt om data te beheren in een diverse maar geïntegreerde data tier. Databeheersystemen worden gebouwd op databeheerplatforms en kunnen databases, data lakes en datawarehouses, big data-beheersystemen, gegevensanalyses en meer omvatten.
Al deze componenten werken samen als een 'datahulpprogramma' om de databeheerfuncties te leveren die een organisatie nodig heeft voor zijn apps en de analytics en algoritmen die de data voortgebracht uit die apps gebruiken. Hoewel huidige tools databasebeheerders (DBA's) helpen veel van de traditionele beheertaken te automatiseren, is handmatige tussenkomst vaak nog nodig vanwege de omvang en complexiteit van de meeste database-implementaties. Wanneer handmatige tussenkomst nodig is, neemt de kans op fouten toe. Het beperken van de noodzaak van handmatig databeheer is een hoofddoel van een nieuwe databeheertechnologie, de autonome database.
De meest kritieke stap voor continue levering van software is continue integratie (CI). CI is een ontwikkelingspraktijk waarbij ontwikkelaars hun codewijzigingen (meestal klein en incrementeel) doorvoeren in een centrale bronrepository, waarmee een set geautomatiseerde builds en tests wordt gestart. Met deze repository kunnen ontwikkelaars de bugs vroegtijdig en automatisch vastleggen voordat ze aan productie worden doorgegeven. Een pijplijn voor continue integratie omvat meestal een reeks stappen, van het begin tot het uitvoeren van een codevastlegging tot het uitvoeren van een eenvoudige geautomatiseerde koppeling/statische analyse, het vastleggen van afhankelijkheden, en het uiteindelijk bouwen van de software en het uitvoeren van enkele basistests voordat u een buildartefact maakt. Broncodebeheersystemen zoals Github, Gitlab, enz. bieden webhooks-integratie waarop CI-hulpprogramma's zoals Jenkins zich kunnen abonneren om na het inchecken van code geautomatiseerde builds en tests te kunnen uitvoeren.
Een databeheerplatform is het fundamentele systeem voor het verzamelen en analyseren van grote volumes data binnen een organisatie. Commerciële dataplatforms bevatten meestal softwaretools voor beheer, ontwikkeld door de databaseleverancier of door externe leveranciers. Deze databeheeroplossingen helpen IT-teams en DBA's bij het uitvoeren van specifieke taken, zoals:
Dankzij de steeds populairdere clouddatabaseplatforms kunnen bedrijven snel en kosteneffectief opschalen of afschalen. Sommige zijn beschikbaar als service, waardoor organisaties nog meer kunnen besparen.
Een autonome database in de cloud maakt gebruik van kunstmatige intelligentie (AI) en machine learning voor het automatiseren van vele databeheertaken die worden uitgevoerd door DBA's. Voorbeelden hiervan zijn het beheren van databaseback-ups, beveiliging en afstemming van prestaties.
Een autonome database, ook wel een zelfsturende database genoemd, biedt aanzienlijke voordelen voor databeheer, waaronder:
De steeds populairdere clouddataplatforms stellen bedrijven in staat om snel en kosteneffectief op of af te schalen. Sommige zijn beschikbaar als service, waardoor organisaties nog meer kunnen besparen.
In sommige opzichten is big data precies wat het woord doet vermoeden: een grote hoeveelheid data. Maar big data kent een grotere verscheidenheid aan vormen dan traditionele data en wordt met een hogere snelheid verzameld. Denk aan alle data die elke dag of elke minuut binnenkomt uit een sociale media-bron zoals Facebook. De hoeveelheid, verscheidenheid en snelheid van die data maken het zo waardevol voor bedrijven. Tegelijkertijd is het beheren van die data uiterst complex.
Nu er steeds meer data wordt verzameld uit bronnen die zo uiteenlopend zijn als videocamera's, sociale media, audio-opnamen en Internet of Things (IoT) -apparaten, zijn er big-databeheersystemen ontstaan. Deze systemen zijn gespecialiseerd in drie algemene gebieden.
Bedrijven gebruiken big data om productontwikkeling, voorspellend onderhoud, de klantervaring, beveiliging, operationele efficiëntie en nog veel meer te verbeteren en te versnellen. Hoe groter big data wordt, hoe groter ook de kansen worden.
De meeste uitdagingen in databeheer zijn tegenwoordig het gevolg van het hogere tempo in het bedrijfsleven en de toenemende verspreiding van data. De steeds groter wordende variëteit, snelheid en volume van data beschikbaar voor organisaties dwingen hen om effectievere beheertools te zoeken om het te kunnen bijbenen. Enkele van de grootste uitdagingen voor organisaties zijn:
Gebrek aan inzicht in gegevens |
Data uit een toenemend aantal en verscheidenheid aan bronnen, zoals sensoren, slimme apparaten, sociale media en videocamera's wordt verzameld en opgeslagen. Maar geen van die data is bruikbaar als de organisatie niet weet over welke data ze beschikken, waar deze te vinden is en hoe ze deze kunnen gebruiken. Oplossingen voor databeheer hebben schaalbaarheid en prestaties nodig om tijdig zinvolle inzichten te kunnen leveren. |
Moeilijkheden bij het beheren van prestatieniveaus voor databeheer |
Organisaties leggen steeds meer data vast, slaan steeds meer op en gebruiken steeds meer data. Om de maximale responstijden op dit groeiende niveau te behouden, moeten organisaties het type vragen dat de database beantwoordt voortdurend monitoren en de indexen wijzigen naarmate de vragen veranderen - zonder dat dit van invloed mag zijn op de prestaties. |
Uitdagingen die voldoen aan veranderende gegevensvereisten |
Nalevingsvoorschriften zijn complex, multi-jurisdictioneel en veranderen voortdurend. Organisaties moeten in staat zijn om hun data gemakkelijk te beoordelen en alles te identificeren wat onder nieuwe of gewijzigde vereisten valt. Persoonlijke identificatiegegevens (PII) moeten vooral worden gedetecteerd, gevolgd en gemonitord op naleving met steeds striktere wereldwijde privacyregels. |
Gegevens moeten eenvoudig worden verwerkt en geconverteerd |
Het verzamelen en identificeren van de data zelf biedt geen enkele waarde, de organisatie moet de data verwerken. Als het veel tijd en moeite kost om data om te zetten in wat ze nodig hebben voor analyse, zal die analyse niet plaatsvinden. Als gevolg hiervan gaat de potentiële waarde van die data verloren. |
Constante behoefte om gegevens effectief op te slaan |
In de nieuwe wereld van databeheer slaan organisaties data op in meerdere systemen, waaronder datawarehouses en ongestructureerde data lakes, waarin alle data in elke indeling in één enkele opslagplaats wordt opgeslagen. De datawetenschappers van een organisatie hebben een snelle en makkelijke manier nodig om data om te zetten van de oorspronkelijke indeling in de vorm, indeling of het model dat ze nodig hebben om een breed scala aan analyses te kunnen uitvoeren. |
Eis om continu de flexibiliteit en kosten van IT te optimaliseren |
Met de beschikbaarheid van clouddatabeheersystemen kunnen organisaties nu kiezen of ze data in on-premises omgevingen, in de cloud of in een hybride combinatie van beide willen bewaren en analyseren. IT-organisaties moeten het niveau van gelijkheid tussen on-premises en cloudomgevingen evalueren om maximale IT-flexibiliteit en lagere kosten te behouden. |
De algemene verordening gegevensbescherming (GDPR), uitgevaardigd door de Europese Unie en geïmplementeerd in mei 2018, omvat zeven belangrijke principes voor het beheer en de verwerking van persoonsgegevens. Deze principes omvatten wettigheid, eerlijkheid en transparantie; doelbeperking; nauwkeurigheid; opslagbeperking; integriteit en vertrouwelijkheid, en meer.
De GDPR en andere wetten die in de voetsporen ervan treden, zoals de California Consumer Privacy Act (CCPA), zorgen voor een radicale verandering in databeheer. Deze vereisten bieden gestandaardiseerde wetgeving op het gebied van gegevensbescherming, die individuen controle geven over hun persoonsgegevens en hoe deze worden gebruikt. In feite worden consumenten hierdoor data-stakeholders met echte rechtsmiddelen voor verhaal wanneer organisaties geen geïnformeerde toestemming krijgen voor gegevensvastlegging, slechte controle uitoefenen over datagebruik of lokaliteit, of niet voldoen aan vereisten voor het verwijderen van of de overdraagbaarheid van gegevens.
Voor het aanpakken van uitdagingen op het gebied van databeheer is een uitgebreide, goed doordachte set best practices nodig. Hoewel specifieke best practices variëren afhankelijk van het type data en de branche, zijn de volgende best practices gericht op de belangrijkste uitdagingen in databeheer waarmee organisaties tegenwoordig worden geconfronteerd:
Maak een detectielaag om uw data te identificeren |
Een detectielaag boven op de data tier van uw organisatie stelt analisten en datawetenschappers in staat om te zoeken naar datasets om uw data bruikbaar te maken. |
Ontwikkel een datawetenschapsomgeving om uw data efficiënt opnieuw te gebruiken |
Een datawetenschapsomgeving automatiseert zoveel mogelijk van het datatransformatiewerk, waardoor het maken en evalueren van datamodellen wordt gestroomlijnd. Een set tools die de handmatige transformatie van data overbodig maakt, kan het hypotheses stellen en testen van nieuwe modellen versnellen. |
Gebruik autonome technologie om prestatieniveaus te behouden in uw groeiende data tier |
Autonome datafuncties gebruiken AI en machine learning om databasequery's continu te monitoren en indexen te optimaliseren terwijl de query's veranderen. Hierdoor kan de database snelle responstijden handhaven en worden DBA's en datawetenschappers verlost van tijdrovende handmatige taken. |
Gebruik detectie om aan nalevingvereisten te blijven voldoen |
Nieuwe tools gebruiken datadetectie om data te controleren en de verbindingsketens te identificeren die moeten worden gedetecteerd, gevolgd en gemonitord op multi-jurisdictionele naleving. Omdat de nalevingseisen wereldwijd toenemen, zal deze functie steeds belangrijker worden voor risicobeheerders en beveiligingsmedewerkers. |
Zorg ervoor dat u een geconvergeerde database gebruikt |
Een geconvergeerde database is een database die native ondersteuning biedt voor alle moderne gegevenssoorten en de nieuwste ontwikkelingsmodellen die in één product zijn ingebouwd. De beste geconvergeerde databases kunnen allerlei soorten workloads uitvoeren, zoals grafiek, IoT, blockchain en machine learning. |
Zorg ervoor dat uw databaseplatform beschikt over de prestaties, schaalbaarheid en beschikbaarheid ter ondersteuning van uw bedrijf |
Het doel van het samenvoegen van data is om deze te kunnen analyseren om betere, sneller beslissingen te nemen. Een schaalbaar databaseplatform met hoge prestaties stelt ondernemingen in staat snel data uit meerdere bronnen te analyseren met behulp van geavanceerde analyses en machine learning, zodat zij betere zakelijke beslissingen kunnen nemen. |
Gebruik een gemeenschappelijke querylaag voor het beheren van meerdere en diverse vormen van dataopslag |
Met nieuwe technologieën kunnen opslaglocaties voor databeheer samenwerken, waardoor de verschillen daartussen verdwijnen. Met een gemeenschappelijke querylaag die een brug slaat tussen de vele soorten dataopslag kunnen datawetenschappers, analisten en applicaties data gebruiken zonder te weten waar deze is opgeslagen en zonder de data handmatig in een bruikbare indeling te hoeven omzetten. |
Datawetenschap is een interdisciplinair vakgebied waarin wetenschappelijke methoden, processen, algoritmen en systemen worden gebruikt om waarde te genereren uit data. Datawetenschappers zetten hun kennis op uiteenlopende vlakken, zoals statistiek, informatica en bedrijfskunde, in om data te analyseren die zijn vergaard via internet, smartphones, klanten, sensoren en andere bronnen.
Met de nieuwe rol van data als bedrijfskapitaal ontdekken organisaties wat digitale start-ups en disruptors al weten: data is een waardevol hulpmiddel voor het identificeren van trends, het nemen van beslissingen en het ondernemen van snellere actie dan de concurrenten. De nieuwe positie van data binnen de waardeketen zorgt ervoor dat organisaties actief op zoek gaan naar betere manieren om waarde te ontlenen aan dit nieuwe kapitaal.
Lees meer over wat het beste databeheer voor u kan betekenen, inclusief de voordelen van een autonome strategie in de cloud (pdf) en schaalbare databasecloudfuncties met hoge prestaties.