Aucun résultat trouvé

Votre recherche n’a donné aucun résultat.

Qu’est-ce que la gestion de données ?

La gestion de données consiste à collecter, conserver et utiliser des données de manière sécurisée, efficace et rentable. L’objectif de la gestion des données est d’aider les utilisateurs, les organisations et les objets connectés à optimiser leur utilisation des données dans les limites des politiques et des réglementations afin qu’ils puissent prendre des décisions et des mesures qui optimisent les avantages pour l’organisation. Avoir une solide stratégie de gestion des données devient plus important que jamais, car les organisations s’appuient de plus en plus sur des actifs incorporels pour créer de la valeur.

Le capital données est un capital d’entreprise

Dans notre économie digitale, les données constituent un type de capital, un facteur économique de production pour les biens et services digitaux. Tout comme un constructeur automobile ne peut fabriquer un nouveau modèle s’il lui manque le capital financier nécessaire, il ne peut pas rendre ses véhicules autonomes s’il lui manque les données pour alimenter les algorithmes embarqués. Ce nouveau rôle joué par les données a des répercussions sur la stratégie concurrentielle, ainsi que sur l’avenir de l’informatique.

Compte tenu de ce rôle central et stratégique des données, de bonnes pratiques de gestion et un solide système de gestion sont essentiels pour chaque organisation, indépendamment de sa taille ou de son type.

En savoir plus sur L’essor du capital données (PDF)

La gestion des données digitales dans une organisation nécessite un large éventail de tâches, de stratégies, de procédures et de pratiques. C’est une tâche à champ d’application élargi, couvrant des facteurs tels que les processus suivants :

  • Créer, accéder et mettre à jour les données dans l’ensemble d’un niveau de données diversifié
  • Stocker les données dans plusieurs Clouds et sur site
  • Fournir une haute disponibilité et une récupération après sinistre
  • Utiliser des données dans un nombre croissant d’applications, de fonctions analytiques et d’algorithmes
  • Assurer la confidentialité et la sécurité des données
  • Archiver et détruire les données conformément aux plannings de conservation et aux obligations de conformité

Une stratégie formelle de gestion des données couvre l’activité des utilisateurs et des administrateurs, les fonctionnalités des technologies de gestion des données, les exigences des obligations réglementaires et la nécessité de l’organisation de dégager de la valeur de ses données.

Les systèmes de gestion de données aujourd’hui

Aujourd’hui, les organisations ont besoin d’une solution de gestion des données offrant un moyen efficace de gérer les données dans un niveau de données diversifié mais unifié. Les systèmes de gestion de données reposent sur des plateformes de gestion de données et peuvent inclure des bases de données, des lacs de données, des data warehouses, des systèmes de gestion du Big Data, des fonctions d’analytique des données, et plus encore.

Tous ces composants fonctionnent ensemble comme un « utilitaire de gestion des données » pour fournir les fonctionnalités de gestion de données dont une organisation a besoin pour ses applications, ainsi que l’analytique et les algorithmes qui utilisent les données générées par ces applications. Bien que les outils actuels aident les administrateurs de base de données à automatiser de nombreuses tâches de gestion traditionnelles, souvent, une intervention manuelle est toujours nécessaire en raison de la taille et de la complexité de la plupart des déploiements de base de données. Chaque fois qu’une intervention manuelle est requise, le risque d’erreur augmente. Réduire le besoin de gestion manuelle des données est l’un des objectifs clés d’une nouvelle technologie de gestion des données, appelée base de données autonome.

Une plateforme de gestion des données constitue le système de base pour la collecte et l’analyse de grands volumes de données dans une organisation. Les plateformes de données commerciales incluent généralement des outils logiciels de gestion, développés par le fournisseur de la base de données ou par des fournisseurs tiers. Ces solutions de gestion des données aident les équipes informatiques et les administrateurs de base de données à effectuer des tâches classiques, comme les suivantes :

  • Identifier, signaler, diagnostiquer et résoudre les dysfonctionnements du système de base de données ou de l’infrastructure sous-jacente
  • Allouer de la mémoire de base de données et des ressources de stockage
  • Apporter des modifications au design de la base de données
  • Optimiser les réponses aux requêtes de base de données pour des applications plus rapides

Les plateformes de données Cloud en plein essor permettent aux entreprises de voir leurs besoins à la hausse ou à la baisse rapidement et à moindre coût. Certains sont disponibles en tant que service, ce qui permet aux organisations d’économiser encore plus.

Basée dans le Cloud, une base de données autonome utilise l’intelligence artificielle (IA) et le Machine Learning pour automatiser de nombreuses tâches de gestion des données effectuées par des administrateurs de base de données, notamment la gestion des sauvegardes, la sécurité et le réglage des performances des base de données.

Également appelée base de données à pilotage automatique, une base de données autonome offre des avantages importants pour la gestion des données, notamment :

  • Une complexité réduite
  • Une diminution du risque d’erreur humaine
  • Un niveau supérieur de fiabilité et de sécurité des bases de données
    • Une amélioration de l’efficacité opérationnelle
  • Des coûts réduits

Les plateformes de données Cloud en plein essor permettent aux entreprises de voir leurs besoins à la hausse ou à la baisse rapidement et à moindre coût. Certains sont disponibles en tant que service, ce qui permet aux organisations d’économiser encore plus.


Systèmes de gestion du Big Data

À certains égards, le Big Data correspond juste à ce qu’il désigne : un grand volume de données. Mais le Big Data se présente également sous une plus grande variété de formes que les données traditionnelles et sa collecte s’effectue à une vitesse élevée. Pensez à toutes les données qui arrivent chaque jour ou chaque minute d’une source de média social telle que Facebook. Le volume, la variété et la rapidité de ces données sont ce qui les rend si précieuses pour les entreprises, mais elles rendent également la gestion très complexe.

Alors que de plus en plus de données sont collectées à partir de sources aussi disparates que les caméras vidéo, les médias sociaux, les enregistrements audio et les appareils Internet of Things (IoT), les systèmes de gestion du Big Data ont fait leur apparition. Ces systèmes sont spécialisés dans trois domaines généraux.

  • L’intégration du Big Data intègre différents types de données, qu’il s’agisse de traitement par lot ou de transmission en continu, et les transforme afin qu’ils puissent être utilisés.
  • La gestion du Big Data stocke et traite les données dans un lac de données ou un data warehouse de façon efficace, sûre et fiable, généralement en utilisant le stockage objet.
  • L’analyse du Big Data révèle de nouvelles informations exploitables grâce à l’analytique, et utilise la visualisation avec le Machine Learning et l’intelligence artificielle (IA) pour créer des modèles.

Les entreprises utilisent le Big Data pour améliorer et accélérer le développement des produits, la maintenance prédictive, l’expérience client, la sécurité, l’efficacité opérationnelle et bien plus encore. Avec l’essor du Big Data, les opportunités ne pourront que se multiplier.

 

Les défis de la gestion des données

Principes de gestion des données et confidentialité des données

Le règlement général sur la protection des données (RGPD) promulgué par l’Union européenne et mis en œuvre en mai 2018 comprend sept principes clés concernant la gestion et le traitement des données à caractère personnel. Ces principes incluent entre autres la légalité, l’équité et transparence ; la limitation à une finalité ; la précision ; la limitation de stockage ; l’intégrité et la confidentialité.

Le RGPD et les autres lois qui s’en sont suivies, comme le California Consumer Privacy Act (CCPA) de Californie, viennent bouleverser les pratiques de gestion des données. Ces obligations fournissent des lois sur la protection des données standardisées qui permettent aux individus de contrôler leurs données personnelles et leur utilisation. En effet, le RGPD transforme les consommateurs en acteurs de la gestion des données avec un véritable recours juridique si les organisations ne parviennent pas à obtenir un consentement éclairé lors de la saisie des données, contrôlent mal l’utilisation ou la localité des données ou ne respectent pas les obligations liées au droit à l’effacement ou à la portabilité des données.

En savoir plus sur le RGPD et la gestion des données

La plupart des défis liés aujourd’hui à la gestion des données résultent de l’accélération du rythme de l’activité et de la prolifération croissante des données. En croissance permanente, la variété, la vélocité et le volume de données à la disposition des organisations poussent celles-ci à rechercher des outils de gestion plus efficaces. Les principaux défis auxquels les organisations sont confrontées sont les suivants :

  • Elles ne savent pas de quelles données elles disposent. Des données provenant d’un nombre et d’une variété croissants de sources telles que les capteurs, les appareils connectés, les médias sociaux et les caméras vidéo sont collectées et stockées. Mais ces données sont inutiles si l’organisation n’a pas connaissance des données dont elle dispose, ne sait pas où elles se trouvent ni comment les utiliser.
  • Elles doivent maintenir leurs niveaux de performance alors que la couche de données se développe. Les organisations capturent, stockent et utilisent toujours plus de données. Pour maintenir les temps de réponse pendant les heures de pointe pour ce niveau de données croissant, les organisations doivent surveiller en permanence le type de questions auxquelles la base de données répond et modifier les index à mesure que les requêtes changent, le tout sans affecter les performances.
  • Elles doivent répondre à des obligations de conformité qui évoluent sans cesse. Les réglementations de conformité sont complexes et multi-juridictionnelles. De plus, elles changent constamment. Les organisations doivent pouvoir examiner facilement leurs données et identifier tout ce qui relève des obligations nouvelles ou modifiées. En particulier, les données à caractère personnel doivent être détectées, suivies et contrôlées pour assurer la conformité aux réglementations internationales de plus en plus strictes en matière de confidentialité.
  • Elles ne savent pas véritablement comment réutiliser les données à d’autres fins. En elles-mêmes, la collecte et l’identification des données n’apportent aucune valeur ajoutée : les entreprises doivent les transformer. S’il faut beaucoup de temps et d’efforts pour convertir les données au format dont elles ont besoin pour l’analyse, aucune analyse n’est possible. Par conséquent, la valeur potentielle de ces données est perdue.
  • Elles doivent suivre les changements survenus dans le stockage de données. Dans le nouveau monde de la gestion des données, les organisations stockent les données dans plusieurs systèmes, y compris des data warehouses et des lacs de données non structurés qui stockent les données, quel que soit leur format, dans un seul référentiel. Les data scientists d’une organisation ont besoin de pouvoir transformer rapidement et facilement les données de leur format d’origine en une organisation, un format ou un modèle dont ils ont besoin pour réaliser une large gamme d’analyses.

Meilleures pratiques en matière de gestion des données

Relever les défis de la gestion des données nécessite un ensemble complet et bien conçu de meilleures pratiques. Bien que les meilleures pratiques spécifiques varient en fonction du type de données concerné et du secteur d’activité, les meilleures pratiques suivantes répondent aux principaux problèmes de gestion des données auxquels les organisations sont aujourd’hui confrontées :

La valeur ajoutée d’un environnement de data science

La data science est un domaine interdisciplinaire qui utilise des méthodes scientifiques, des processus, des algorithmes et des systèmes pour exploiter les données. Les data scientists associent diverses compétences (connaissances en statistiques, informatique et métier) pour analyser les données collectées à partir du Web, des smartphones, des capteurs, auprès des clients et d’autres sources.

Un environnement de data science peut aider une organisation à connaître les données dont elle dispose, puis à les rendre utilisables. Cet environnement permet aux data scientists de créer, de tester et d’évaluer automatiquement des modèles qui sont utilisés pour rechercher des données, puis les transformer pour qu’elles soient utilisables et utiles pour l’organisation. Avec une plateforme centralisée, les data scientists peuvent travailler dans un environnement collaboratif en utilisant leurs outils open source préférés, car leur travail est synchronisé par un système de contrôle de version.

En savoir plus sur la data science Apprenez à avoir un impact plus important avec une plateforme de data science
  • Créez une couche de découverte pour identifier vos données. Superposer une couche de découverte au niveau de données de votre organisation permet aux analystes et aux data scientists de rechercher et de parcourir des ensembles de données afin de rendre vos données utilisables.
  • Développez un environnement de data science permettant de réutiliser efficacement vos données. Un environnement de data science automatise le plus possible le travail de transformation des données, en simplifiant la création et l’évaluation des modèles de données. Disposer d’un ensemble d’outils qui rend inutile toute transformation manuelle des données peut accélérer la formulation d’hypothèses et le test de nouveaux modèles.
  • Utilisez une technologie autonome pour maintenir les performances dans l’ensemble de votre couche de données en expansion. Les fonctionnalités de données autonomes utilisent l’intelligence artificielle et le Machine Learning pour surveiller en permanence les requêtes de base de données et optimiser les index à mesure que les requêtes changent. Cela permet à la base de données de conserver des temps de réponse rapides et libère les administrateurs de base de données et les data scientists des tâches manuelles fastidieuses.
  • Utilisez la découverte pour respecter en permanence les obligations de conformité. De nouveaux outils utilisent la découverte de données pour examiner les données et identifier les chaînes de connexion qui doivent être détectées, suivies et surveillées pour assurer une conformité multijuridictionnelle. À mesure que les obligations de conformité deviennent plus strictes à l’échelle mondiale, cette capacité revêtira une importance croissante pour les responsables de la gestion des risques et de la sécurité.
  • Utilisez une couche de requête commune pour gérer plusieurs formes de stockage de données. Les nouvelles technologies permettent aux référentiels de gestion de données de fonctionner ensemble, en faisant disparaître leurs différences. Une couche de requête commune couvrant les différents types de stockage de données permet aux data scientists, aux analystes et aux applications d’accéder aux données sans avoir besoin de savoir où elles sont stockées ni de les transformer manuellement en un format utilisable.

La gestion des données évolue

Compte tenu du nouveau rôle du capital données pour l’entreprise, les organisations apprennent ce que les start-ups digitales et les experts du secteur savent déjà : les données sont un atout précieux pour identifier les tendances, prendre des décisions et agir avant les concurrents. La nouvelle position des données dans la chaîne de valeur amène les organisations à rechercher activement de meilleurs moyens d’exploiter ce nouveau capital.

Au sein des entreprises, les responsabilités de gestion des données de l’administrateur de base de données évoluent également, avec un nombre de tâches quotidiennes, de sorte que les administrateurs de bases de données puissent se concentrer sur des questions plus stratégiques et fournir un support stratégique en matière de gestion des données dans les environnements Cloud, notamment les initiatives clés telles que la modélisation des données et la sécurité des données.