Nous contacter.
02 52 35 24 54

Anonymisation des données : qu’est-ce que c’est ?

Publié le 17 janvier 2022



A l’heure où la collecte et le traitement des données font partie intégrante de la vie d’une entreprise, les manipulations de données à caractère personnel sont nombreuses, les obligeant à assurer leur sécurité et confidentialité.

Le principe d’anonymisation est un processus qui rend impossible l’identification d’une personne de manière irréversible, limitant les risques de réidentification en cas de fuite de données.



Anonymisation des données : définition

Anonymisation des données : qu’est-ce que c’est ?

L’anonymisation des données est un traitement qui consiste à rendre impossible l’identification d’une personne à partir d’un jeu de données, tout en leur permettant de rester exploitables pour l’entreprise.

Attention, l’anonymisation est un processus irréversible, c’est-à-dire qu’il ne doit plus permettre une réidentification. Elle marque donc la perte du caractère identifiable d’un individu, de manière directe ou indirecte.

Elle ne doit pas être confondu avec le pseudonymisation, qui est un principe réversible.





L’enjeu de l’anonymisation des données :

Le RGPD a marqué un tournant dans le traitement des données à caractère personnel. S’il n’impose aucune obligation d’anonymisation, il en recommande toutefois fortement sa mise en place.

Il faut dire que les données personnelles sont devenues une nouvelle mine d’or numérique pour les entreprises. Toutefois leurs volumes, parfois très conséquents, rendent de plus en plus complexe leur traitement. Ils accroissent le risque de dérives pouvant porter atteinte à la vie privée des personnes.

Parallèlement, les données sont devenues une cible de premier choix pour des attaques informatiques.

Les enjeux de l’anonymisation des données résident ainsi, pour les entreprises, dans l’objectif de traiter et d’exploiter des données personnelles :

  • en toute légalité
  • en préservant les droits et libertés des individus
  • en réduisant les risques d’attaques et en renforçant la sécurité des informations
  • en s’affranchissant du RGPD car les données anonymisées ne sont plus reconnues comme à caractère personnel
  • en les conservant donc au-delà des durées de conservation prévues par le RGPD

 

Comment anonymiser des données ?

Si on considère que l’anonymisation doit éliminer toute possibilité d’identification à partir d’un jeu de données, cela sous-entend donc que celles-ci seront limitées à certains types d’utilisations. C’est l’un des points de départ du processus d’anonymisation des données.

La CNIL donne d’ailleurs plusieurs prérequis déterminant pour définir la stratégie d’anonymisation à suivre. Il est ainsi conseillé :

  • d’identifier et de classer les informations à conserver selon leur pertinence,
  • de supprimer les informations secondaires ou inutiles afin de ne conserver que celles qui sont essentielles,
  • de supprimer les détails d’identification directe,
  • de supprimer les données d’identification “rares” pouvant permettre une réidentification,
  • de définir une conservation la plus fine qui soit en fonction de la donnée.

 

Ensuite, les entreprises peuvent appliquer au choix plusieurs méthodes d’anonymisation des données, de manière complémentaire. Voici les deux grandes familles de techniques :

La Randomisation

La randomisation consiste à modifier ou à rendre moins précises les données.
Par exemple, on va remplacer un métier par un domaine d’activité. Ou encore remplacer un âge par une tranche d’âge.

La Généralisation

La généralisation repose sur la modification d’ordre de grandeur afin de rendre commune une caractéristique à un ensemble d’individus. Elle permet de diluer une donnée et de limiter le phénomène d’individualisation.

Par exemple, on va remplacer une date de naissance par une année.

Mon anonymisation est-elle efficace ?

La mise en place de solutions visant à l’anonymisation des données à caractère personnel est un très grand pas vers le respect des droits et libertés des personnes.

Toutefois, avant de crier victoire, il convient de s’assurer que les données ont bien été anonymisées. Pour cela le RGPD apporte lui aussi sa pierre à l’édifice en mettant en évidence 3 grandes situations à risque.

Chacun d’eux doit susciter une interrogation. Si vous répondez “oui” à l’une de ces questions, alors l’anonymisation au sein de votre entreprise n’est pas respectée.

L’individualisation

Est-ce qu’il est possible d’isoler un individu à partir d’un jeu de données ?

L’individualisation correspond à la possibilité d’isoler une personne dans un ensemble de données à partir de caractères individuels qui lui sont propres.

La corrélation

Est-ce qu’il est possible de faire le lien entre plusieurs données concernant une même personne ?

La corrélation correspond à la possibilité de faire le lien entre, au moins, deux données distinctes se rapportant à un même individu dans une ou plusieurs bases de données.

L’inférence

Est-il possible de déduire de nouvelles informations sur un individu ?

L’inférence correspond à la faculté de déduire, avec quasi-certitude, de nouvelles informations sur un individu à partir d’un ensemble d’autres données.

Besoin d’un audit RGPD ? D’être accompagné ? D’une formation ?
Contactez AP3R, votre consultant RGPD à Angers et dans tout le grand ouest !