Aucun résultat trouvé

Votre recherche n'a donné aucun résultat.

Qu’est-ce que la gestion des données?

La gestion des données est la pratique de la collecte, de la conservation et de l’utilisation des données de façon sécuritaire, efficace et rentable. L’objectif de la gestion des données est d’aider les personnes, les organisations et les objets connectés à optimiser l’utilisation des données dans les limites des politiques et des réglementations afin de prendre des décisions et des mesures qui maximisent les avantages pour l’organisation. Une stratégie de gestion de données robuste est de plus en plus importante, car les entreprises comptent de plus en plus sur les actifs incorporels pour créer de la valeur.

Les données deviennent du capital d’affaires

Dans l’économie numérique d’aujourd’hui, les données deviennent une ressource, c’est-à-dire un facteur économique de production pour les biens et services numériques. Tout comme un constructeur automobile ne peut fabriquer un nouveau modèle s’il ne dispose pas des capitaux financiers nécessaires, il ne peut pas rendre ses voitures autonomes s’il ne dispose pas de données pour alimenter les algorithmes intégrés. Ce nouveau rôle pour les données a des implications pour la stratégie concurrentielle ainsi que pour l’avenir de l’informatique.

Compte tenu du rôle central des fonctions des données pour la mission, de solides pratiques de gestion et un système de gestion robuste sont essentiels à toute organisation, peu importe la taille ou le type.

En savoir plus sur la montée en importance des données (PDF)

La gestion des données numériques dans une organisation porte sur un large éventail de tâches, de politiques, de procédures et de pratiques. Le travail de gestion de données a une portée étendue, couvrant ce qui suit :

  • Créer, consulter et mettre à jour des données dans un niveau de données diversifié
  • Stocker les données sur des nuages multiples et sur les lieux
  • Fournir une haute disponibilité et une reprise après sinistre
  • Utiliser les données dans une variété grandissante d’applications, d’analyses et d’algorithmes
  • Assurer la sécurité et la confidentialité des données
  • Archiver et détruire les données conformément aux calendriers de conservation et aux exigences de conformité

Une stratégie de gestion des données formelle tient compte des activités des utilisateurs et des administrateurs, des technologies pour les capacités de gestion de données, des exigences réglementaires et des besoins de l’organisation pour obtenir de valeur de ses données.

Systèmes de gestion de données modernes

Les organisations modernes ont besoin d’une solution de gestion de données qui fournit un moyen efficace de gérer les données diversifiées, mais unifiées au sein du niveau de données. Les systèmes de gestion de données reposent sur des plateformes de gestion et peuvent inclure des bases de données, des lacs et entrepôts de données, des systèmes de gestion de données massives et plus encore.

Tous ces composants travaillent ensemble en tant qu’« utilitaire de données » afin d’offrir les capacités de gestion des données provenant des applications dont une organisation a besoin pour ses applications, ses analyses et ses algorithmes. Bien que les outils actuels puissent aider les administrateurs de base de données à automatiser de nombreuses tâches de gestion traditionnelles, une intervention manuelle est souvent encore requise en raison de la taille et de la complexité de la plupart des déploiements de base de données. Chaque fois qu’une intervention manuelle est requise, le risque d’erreurs augmente. La réduction de la gestion des données est un objectif clé de la nouvelle technologie de gestion des données, les bases de données autonomes.

Une plateforme de gestion des données est le système de base pour la collecte et l’analyse de volumes importants de données dans une entreprise. Les plateformes de données commerciales comprennent normalement des outils logiciels pour la gestion. Ceux-ci sont développés par le fournisseur ou par des fournisseurs tiers. Les solutions de gestion de données aident les équipes informatiques et les administrateurs de base de données à effectuer les tâches typiques, comme

  • Identifier, alerter, diagnostiquer et résoudre les problèmes dans le système de base de données ou l’infrastructure sous-jacente
  • Affecter la mémoire des bases de données et les ressources de stockage
  • Apporter des changements à la conception de la base de données
  • Optimiser la base de données pour des réponses plus rapides et un meilleur rendement des applications

De plus en plus populaires, les plateformes de données en nuage permettent aux entreprises de réduire ou d’augmenter les activités rapidement et de façon rentable. Certaines sont offertes à titre de service, ce qui permet aux organisations d’économiser encore plus.

Située dans le nuage, une base de données autonomes utilise l’intelligence artificielle (IA) et l’apprentissage automatique pour automatiser les nombreuses tâches de l’administrateur de base de données, y compris les sauvegardes, la sécurité et le réglage de performance.

Également appelée base de données à gestion automatisée, une base de données autonome offre des avantages considérables pour la gestion des données, y compris ce qui suit :

  • Simplicité accrue
  • Réduction potentielle du risque d’erreur humaine
  • Meilleure fiabilité et sécurité de la base de données
    • Amélioration de l’efficacité des opérations
  • Réduction des coûts

De plus en plus populaires, les plateformes de données en nuage permettent aux entreprises de réduire ou d’augmenter les activités rapidement et de façon rentable. Certaines sont offertes à titre de service, ce qui permet aux organisations d’économiser encore plus.


Système de gestion de données massives

À certains égards, les données massives sont simplement ce qu’elles indiquent, c’est-à-dire vraiment beaucoup de données. Mais les données massives se présentent également dans un vaste choix de formes de données traditionnelles. De plus, elles sont recueillies à une vitesse très élevée. Pensez à toutes les données qui sont générées chaque jour, ou chaque minute, à partir d’une source de médias sociaux comme Facebook. La quantité, la variété et la vitesse de ces données sont ce qui rend la technologie si précieuse au sein des entreprises, mais elle s’avère aussi très complexe à gérer.

De plus en plus de données disparates sont recueillies auprès de sources comme les caméras vidéo, les médias sociaux, les enregistrements audio et l’Internet des objets (IdO), d’où l’émergence du concept de gestion des données massives. Ces systèmes se spécialisent dans trois domaines.

  • L’intégration des données massives rassemble différents types de données d’un lot pour la diffusion et les transforme afin qu’elles puissent être consommées.
  • La gestion des données massives stocke et traite efficacement les données dans un entrepôt de données ou un lac de données, de façon sécuritaire et fiable, souvent en utilisant un espace de stockage d’objet.
  • L’analyse des données massives permet la découverte de nouvelles informations grâce à des analyses. Elle a recours à l’apprentissage automatique et à l’IA pour établir des modèles.

Les entreprises utilisent les données massives afin d’améliorer et d’accélérer le développement de produits, la maintenance prévisionnelle, l’expérience client, la sécurité, l’efficacité opérationnelle, et bien plus encore. Comme les données massives gagnent en volume, il en va de même des possibilités.

 

Défis de gestion de données

Principes de gestion des données et confidentialité des données

Le Règlement général sur la protection des données (RGPD) imposées par l’Union européenne et mis en œuvre en mai 2018 comprend sept principes clés pour la prise en charge et le traitement des données personnelles. Ces principes incluent le caractère licite, l’équité et la transparence; les limites d’utilisation; l’exactitude; les limites de stockage; l’intégrité et la confidentialité; et plus encore.

Le RGPD et d’autres lois qui ont suivi ses traces, comme la California Consumer Privacy Act (CCPA), sont en train de changer tout ce qui a trait à la gestion de données. Ces exigences constituent une forme de protection des données normalisées pour les personnes concernant le contrôle de leurs données personnelles, ainsi que la façon dont ces dernières sont utilisées. En effet, cela transforme les consommateurs en intervenants, avec de vrais recours légaux lorsque les entreprises ne parviennent pas à obtenir le consentement éclairé lors de la saisie de données, contrôlent mal l’utilisation des données ou ne respectent pas les exigences de suppression ou de portabilité des données.

En savoir plus sur le RGPD et la gestion des données

La plupart des défis actuels en gestion de données découlent d’un rythme soutenu des activités et de l’augmentation de la prolifération des données. La variété grandissante, la vélocité et le volume de données disponibles aux organisations les poussent à chercher d’autres outils de gestion rentable pour garder le rythme. Certains des principaux défis auxquels font face les organisations sont les suivants :

  • Ils ne connaissent pas les données qu’ils ont en leur possession. Les données d’un nombre grandissant et sources variées, comme les capteurs, les appareils intelligents, les médias sociaux et les caméras vidéo, sont recueillies et stockées. Mais aucune de ces données n’est utile si l’organisation ne dispose pas des connaissances à propos des données dont elle dispose, ou de comment les utiliser.
  • Les entreprises doivent maintenir les niveaux de rendement au fur et à mesure de l’expansion des données. Elles recueillent, entreposent et utilisent plus de données à tout moment. Pour maintenir un temps de réponse commensurable à cette expansion, les entreprises doivent surveiller continuellement le type de question posée à la base de données et modifier les index au fur et à mesure que les requêtes évoluent, sans affecter le rendement.
  • Elles doivent respecter les exigences de conformité en constante évolution. Les règlements de conformité sont complexes et portent sur plusieurs juridictions. De plus, ils changent constamment. Les organisations doivent être en mesure de facilement passer en revue leurs données et de déterminer tout ce qui concerne les nouvelles exigences ou les exigences modifiées. En particulier, les renseignements permettant d’identifier une personne doivent être détectés, suivis et contrôlés afin d’assurer la conformité des réglementations de plus en plus strictes en matière de confidentialité mondiale.
  • Les entreprises ne savent pas comment récupérer les données pour mener à de nouvelles utilisations. La collecte de données et la détermination des données en tant que telles n’offrent pas de valeur pour l’organisation qui souhaite les traiter. Il faut beaucoup de temps et d’efforts pour convertir les données sous une forme utile pour l’analyse. Par conséquent, la valeur potentielle de ces données risque d’être perdue.
  • Les entreprises doivent rester à l’affût des changements par rapport au stockage des données. Dans le nouveau monde de gestion de données, les organisations stockent des données dans de multiples systèmes, y compris les entrepôts de données et les lacs de données non structurés. Dans de tels cas, les données sont stockées, peu importe le format, dans un référentiel unique. Les spécialistes des données de l’organisation doivent disposer d’un moyen rapide et facile pour transformer les données du format d’origine vers la forme, le format ou le modèle nécessaire pour l’application d’une vaste gamme d’analyses.

Meilleures pratiques en matière de gestion des données

Une gestion de données efficace exige un ensemble complet et bien pensé de meilleures pratiques. Bien que les meilleures pratiques varient selon le type de données et l’industrie, celles qui suivent traitent les principaux défis de gestion de données auxquelles les organisations d’aujourd’hui sont confrontées :

La valeur d’un environnement de science des données

La science des données est un domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes spécialisés pour extraire la valeur des données. Les spécialistes des données combinent un éventail de compétences (statistiques, science informatique, connaissance des affaires) pour analyser des données provenant du Web, de téléphones intelligents, de clients, de capteurs ou d’autres sources.

Un environnement de science de données peut aider une organisation à savoir quelles données elle possède afin de les rendre utilisables. Cet environnement permet aux spécialistes des données de créer automatiquement, de tester et d’évaluer les modèles utilisés pour repérer des données. Par la suite, les spécialistes seront en mesure de les transformer afin qu’elles soient utilisables et qu’elles apportent de la valeur pour l’entreprise. Une plateforme centralisée permet aux spécialistes des données de travailler dans un environnement collaboratif en utilisant leurs outils en accès libre préférés, avec tous leurs travaux synchronisés par un système de contrôle de version.

En savoir plus sur la science des données En savoir plus sur comment exploiter de façon efficace une plateforme de sciences de données
  • Créer une couche de découverte pour identifier vos données. Une couche de découverte au-dessus des données de votre organisation permet aux analystes et aux spécialistes des données de rechercher et de parcourir les jeux de données afin de les rendre utilisables.
  • Élaborer un environnement de science de données afin de transformer efficacement vos données. Un environnement de science de données automatise autant que possible le travail de transformation des données afin de simplifier la création et l’évaluation des modèles de données. Un ensemble d’outils qui élimine le recours à une transformation des données peut accélérer la génération d’hypothèses et les essais des nouveaux modèles.
  • Utiliser la technologie d’autonomie pour maintenir les niveaux de performance au fur et à mesure que les données grandissent. Les capacités autonomes pour les données exploitent l’IA et l’apprentissage automatique afin de surveiller en continu les interrogations et optimiser les index, et ce, au fur et à mesure que les requêtes évoluent. Cela permet de maintenir une réponse rapide de la base de données, tout en libérant les administrateurs et les spécialistes des données des tâches manuelles chronophages.
  • Exploiter le principe de découverte pour toujours assurer la conformité aux exigences. Les nouveaux outils utilisent la découverte pour examiner les données et identifier les chaînes de connexions qui doivent être détectées, suivies et contrôlées pour la conformité des différentes juridictions. Au fur et à mesure que les demandes de conformité augmentent à l’échelle mondiale, cette capacité sera de plus en plus importante pour les agents de sécurité et du risque.
  • Utiliser une couche d’interrogation commune pour gérer les multiples et diverses formes de stockage de données. De nouvelles technologies permettent aux référentiels de gestion de données de travailler ensemble, ce qui tend à effacer les différences qui les séparent. Une couche d’interrogation commune qui porte sur plusieurs types de stockage de données permet aux spécialistes des données, aux analystes et aux applications d’accéder aux données sans devoir savoir où elles se trouvent et sans avoir besoin de les transformer manuellement en un format utilisable.

Évolution de la gestion des données

Avec le nouveau rôle d’affaires des données, les organisations découvrent ce que les nouvelles entreprises et les perturbateurs connaissent déjà : Les données sont un atout précieux pour identifier les tendances, prendre des décisions et agir avant la concurrence. La nouvelle position des données dans la chaîne de valeur pousse les organisations à rechercher de meilleurs moyens de tirer avantage de ce nouveau type de capital.

Dans les entreprises, les responsabilités de gestion de données sont également en évolution, réduisant ainsi le nombre de tâches mondaines. De la sorte, les gestionnaires de base de données peuvent se concentrer sur des problèmes plus stratégiques et fournir une aide en gestion des données critiques dans des environnements en nuage. Cela mène à des initiatives clés, comme la modélisation de données et sécurité des données.