# Introduction
Rédaction de ce guide
Ce guide d'anonymisation est en cours de rédaction (juin 2022). La version présente pourra être enrichie en fonction de vos commentaires.
Il sera régulièrement et progressivement mis à jour.
# À quoi sert ce guide ?
Ce guide est une introduction à des techniques d'anonymisation de données tabulaires. Il vous propose un accompagnement méthodologique dans votre procédure d'anonymisation, afin de limiter les risques que des personnes issues de votre base anonymisée ne soient ré-identifiées par des analyses a postériori.
Il est important de garder à l'esprit que la publication de données personnelles est encadrée légalement, et qu'il y a divers niveaux d'occultation nécessaires selon la nature des données, depuis le simple brouillage des éléments directement identifiants jusqu'à des techniques plus poussées pour empêcher que des informations sensibles ne puissent être déduites d'analyse de corrélations effectuées sur la base anonymisée.
Ce guide se contentera de proposer des méthodologies pour anonymiser des données. En particulier, ce guide n'est pas une référence légale permettant de caractériser le niveau minimal d'occultation requis pour chaque type de données.
# À qui s'adresse ce guide ?
Ce guide s'adresse à des personnes désireuses de publier des données, notamment dans le cadre de l'open data, tout en protégeant la confidentialité de données à caractère personnel ou de données jugées sensibles.
Ce guide intéressera également les équipes effectuant des traitements de données personnelles, et qui seraient dans l'obligation légale d'anonymiser ces bases tabulaires avant tout traitement.
# Sommaire
Ce guide est composé de trois parties :
- une définition et des exemples de projets d'anonymisation ;
- une revue de quelques méthodes d'anonymisation ;
- une présentation non exhaustive de quelques logiciels pouvant aider à l'anonymisation.
Ce que ce guide n'est pas
- un guide juridique sur la protection des données à caractère personnel ;
- un guide prêt à emploi sur l'anonymisation de données textuelles (qui doivent d'abord être transformées en données tabulaires) ;
- un guide sur la sécurité des données et des systèmes d'information.
# Comment contribuer ?
Ce document est un outil évolutif et ouvert.
Si vous souhaitez faire des propositions pour le faire évoluer, vous êtes invités à proposer une modification sur GitHub ou en contactant directement l'équipe du Lab IA d'Etalab.
En particulier, le lab IA d'Etalab est preneur de tout retour d'expérience pour faire évoluer ce guide et mettre à jour nos bonnes pratiques.
Principe →