Machine learning dans le management IT

Oracle Cybersécurité

Comment anonymiser des données ?

Les dirigeants d’entreprises et responsables SI souhaitent se mettre en conformité avec le RGPD et anonymise les données. Prenez connaissance des moyens d’anonymiser une base de données, des données Big Data et des données Cloud. En retard ? Découvrez comment accélérer votre mise en conformité RGPD en téléchargeant notre livre blanc :


Comment anonymiser des données ?

Temps de lecture : 2 mn

Qu’est-ce que la data anonymization ? L’anonymisation des données est sur toutes les lèvres depuis l’entrée en vigueur du RGPD (GDPR), le Règlement Général sur la Protection des Données. De nombreuses données sortent chaque jour des environnements de production sans être protégées. Or chaque dirigeant d’entreprise et responsable doit anonymiser certaines données de manière à ce qu’elles soient utilisées à des fins justifiées et limitées.

1. Comment anonymiser des bases de données ?

Lorsqu'il s'agit des données elles-mêmes, l'approche la plus courante consiste peut-être à simplement retirer les champs de données qui contiennent des renseignements personnels - des numéros de sécurité sociale aux adresses IP. Mais cela peut souvent supprimer des données qui sont très utiles à avoir - des identifiants géographiques par exemple. Et l'information n'est jamais personnelle ou non personnelle. L'information est plutôt sur un spectre allant d'une information non reliée (comme la météo) à une information très personnelle (comme votre nom). Il n'y a pas de limite claire.

Parfois, les entreprises remplacent les zones de données plus personnelles par des valeurs qui sont créées par une méthode différente afin de séparer davantage les données. Mais le problème se pose lorsque les gens sont capables de combiner différentes bases de données pour "ré-identifier" les gens. Et les efforts de chiffrement des données ont également échoué.

Un exemple célèbre est celui des numéros de taxi cryptés publiés par la ville de New York qui ont été craqués, puis, en examinant des photos de célébrités montant ou descendant des taxis, les chercheurs et les journalistes ont pu localiser les déplacements des gens dans la Grosse Pomme.

2. Comment anonymiser des données Big Data ?

Anonymiser des données Big Data peut se faire en deux étapes : la pseudonymisation et la dé-identification. L'idée est de prendre des données sensibles comme par exemple, les données de téléphone portable et les données médicales et de supprimer toute information qui peut les relier à un individu. La vie privée des gens n’est alors pas mise en danger, même lorsque des recherches sont publiées.

Oracle est leader de la sécurité des bases de données !

La plupart des techniques d'anonymisation des données reposent sur deux types d'identificateurs : directs et indirects. Le processus de suppression des identificateurs directs comme les noms, adresses, numéros de téléphone -- tout élément d'information qui permet de remonter directement à une certaine personne -- s'appelle la pseudonymisation. La pseudonymisation des données est obtenue soit en supprimant les identificateurs, soit en les remplaçant par une identification aléatoire ou en les hachant.

3. Comment anonymiser des données Cloud ?

Anonymiser les données dans le Cloud peut se faire grâce au concept de l’éclatement de la donnée où seul un algorithme peut reconstituer l’information. Ainsi, si une base de données est compromise, on a besoin de cet algorithme pour reconstituer la donnée. Cette démarche s’appelle de l’anonymisation statique (masking), par opposition à l’anonymisation dynamique. Le masking anonymise de manière à ce que la donnée d’origine est perdue. Ce type d’anonymisation est utilisé dans le cas du droit à l’oubli, pour le service en hors production. L’utilisateur final n’est pas connu mais la production a des données anonymes. Dans le récital 36 du GDPR, une anonymisation statique permet de ne plus être soumis au RGPD pour ces données anonymisées, ce qui est très intéressant pour les entreprises.