Data steward : définition et responsabilités

Les données sont partout. Les entreprises qui les utilisent doivent s’entourer de professionnels qui savent les gérer en respectant la loi. C’est l’un des rôles du data steward, ou gestionnaire de données. En quoi consiste son travail ?

Téléchargez le Livre Blanc : Oracle Autonomous Database pour les nuls

17 au 19 Septembre : Webinar Oracle Technology Data Week

Qu'est-ce qu'un Data Steward ?

Temps de lecture : 3 mn

Le gestionnaire de données : quels sont ses rôles et responsabilités

L’une des définitions les plus simples de l’intendance des données provient du problème posé par les auteurs Tom Devanport et Jill Dyché dans leur étude de 2013 « Big data in Big Companies » .

« Plusieurs entreprises ont mentionné la nécessité de combiner les compétences des scientifiques en matière de données avec les avantages habituels de la gestion de données. Une solide connaissance des architectures de données, des métadonnées, des processus de qualité et de correction des données de l’intendance et de l’administration des données, de centres de gestion des données de référence, des algorithmes de correspondance et d’une foule d’autres sujets spécifiques aux données est importante pour les entreprises qui cherchent à faire des données un élément de différenciation stratégique à long terme ».

Un data steward est responsable de la gestion et de la qualité des données stockées dans une entreprise.

Les grandes compagnies attendent des data stewards qu’ils gèrent de manière experte tout ce qui concerne le traitement des données, les politiques et directives en matière de données et qu’ils administrent les informations de l’entreprise conformément aux obligations politiques et réglementaires.

Quel est le rôle d’un data Steward ?

Le Data Steward sait comment les données sont collectées, conservées et interprétées à l’intérieur et à l’extérieur de l’entreprise.

Son travail s’articule autour des questions suivantes :

  • Pourquoi ces données précises sont importantes pour l’entreprise.
  • Pendant combien de temps les données de particuliers doivent-elles être stockées ou conservées ?

Mesures visant à améliorer la qualité de l’analyse

Dans des environnements chaotiques avec des systèmes et des projets décentralisés, un data steward devient un point de contact central pour gérer des volumes de données de plus en plus complexes et croissants.

Dans les entreprises où les rôles sont flous, il attribue des droits de décisions concernant ces dernières, c’est-à-dire qu’il fait respecter la procédure.

Quelles sont les responsabilités d’un Data Steward ?

Les responsabilités des gestionnaires de données peuvent être regroupées dans les quatre domaines principaux suivants.

Supervision opérationnelle

L’une des principales fonctions d’un data steward est de superviser le cycle de vie d’un ensemble particulier de données.

Plus précisément, les gestionnaires de données dont chargés de définir et de mettre en œuvre des politiques et procédures pour la gestion opérationnelle et administrative des systèmes et des données, y compris la réception, le stockage, le traitement et la transmission des données aux systèmes internes et externes.

Dans le cadre de la surveillance des données institutionnelles, le gestionnaire des données doit être responsable de la définition et de la documentation des données et de la terminologie dans un glossaire pertinent. Il doit notamment s’assurer que chaque document essentiel est clairement défini et qu’il est toujours utilisé.

Qualité des données

Les Data Steward sont responsables en dernier ressort de l’établissement des mesures et des exigences en matière de qualité des données, y compris la définition des valeurs, des intervalles et paramètres pour chaque élément de données.

Il travaille également avec l’équipe pour établir des procédures de détection et de correction des problèmes de qualité des données et établit des politiques et contrôles internes concernant leur qualité.

En outre, les gestionnaires de données participent à l’évaluation continue et détaillée de la valeur des données, à l’identification des anomalies et des divergences, et à l’apport d’expertise pour comprendre la cause et mettre en œuvre des mesures correctives.

Protection de la vie privée, sécurité et gestion des risques

La protection des données est l’un des éléments les plus difficiles pour un data steward. Il doit établir les lignes directrices et des protocoles qui régissent la diffusion des données afin de s’assurer que les contrôles de la vie privée sont appliqués.

Pour être efficace, le responsable de la gestion des données doit établir des mesures en matière de conservation, d’archivage et d’élimination des données et veiller au respect de la politique et de la réglementation institutionnelle.

En conséquence, le data steward établira et mettra en œuvre des pratiques de conservation des données pour s’assurer que la durée de vie de celles-ci est conforme aux conditions.

Il doit protéger les données tout en trouvant un équilibre entre la transparence et la protection de la vie privée.

Politiques et procédures

Le data steward définit les politiques et procédures d’accès aux données, y compris les critères d’autorisation en fonction du rôle et/ou de l’individu. Travaillant en étroite collaboration avec les conservateurs de données pour établir des contrôles, il évalue toute violation ou vulnérabilité suspectée ou réelle en matière de confidentialité, d’intégrité ou de disponibilité et signale à la direction ou au personnel chargé des informations.

Comment devenir un délégué de gestion de données

Ayant un rôle crucial mais discret à jouer dans l’entreprise, un data steward doit avoir les compétences suivantes :

  • Expertise en programmation.
  • Modélisation des données.
  • Notions de stockage de données.
  • Rédaction technique.
  • Enseignement technique formel.
  • Sens des affaires.
  • Savoir faire des prévisions.
Comment la gestion autonome des bases de données aide les entreprises à être plus efficace et plus innovantes ?

Ce guide complet donne un aperçu détaillé sur la façon dont Oracle Autonomous Database permet aux entreprises d’optimiser la gestion de leur base de données. Ce guide décrit également comment Autonomous Database permet de capitaliser sur les technologies émergentes (machine learning et IA) pour créer de nouvelles applications et exploiter la valeur de leurs données.