Qu’est-ce que les métadonnées ?
Qu'est-ce que les métadonnées ?
Les fichiers ne contiennent pas seulement le texte ou l'image visible à l'écran.
Pour une photo, il peut s'agir de l'heure de prise de vue ou du modèle d'appareil. Pour un document, du nom de l'auteur ou du logiciel d'édition. Pour un PDF, de l'heure de création ou du titre du document. Pour une vidéo, de l'appareil d'enregistrement ou d'informations de localisation.
Ces "données sur les données" sont appelées métadonnées.
Les métadonnées sont des informations utiles. Elles servent à gérer, rechercher, modifier et organiser les fichiers.
Mais du point de vue de l'anonymat, les métadonnées deviennent des indices faciles à oublier.
Informations cachées qui restent dans le fichier
Les métadonnées ne sont pas le contenu même du fichier, mais des informations sur ce fichier.
Par exemple, les métadonnées d'une photo peuvent contenir l'heure de prise de vue, le modèle d'appareil, des informations sur l'objectif et la position GPS. Les fichiers de document peuvent conserver le nom de l'auteur, le nom de l'entreprise, l'historique des modifications, des commentaires et le logiciel utilisé.
| Fichier | Informations qui peuvent rester | Point d'attention pour l'anonymat |
|---|---|---|
| Photo | Heure de prise de vue, informations de localisation, modèle d'appareil | Le lieu ou l'appareil peut être compris |
| Vidéo | Heure de prise de vue, informations de localisation, informations sur l'appareil | Peut mener au lieu de tournage ou aux lieux habituels |
| Auteur, titre, logiciel de création | Un nom personnel ou un nom d'organisation peut rester | |
| Document Office | Auteur, nom d'entreprise, historique des modifications, commentaires | Des informations internes ou des noms de personnes ayant travaillé peuvent rester |
| Audio | Heure d'enregistrement, informations sur le logiciel, tags | Peut devenir un indice sur l'environnement d'enregistrement ou l'historique d'édition |
Les métadonnées ne ressortent pas toujours quand on ouvre un fichier. C'est pour cela qu'elles sont dangereuses.
Même si le texte visible est soigneusement flouté ou généralisé, si un nom d'auteur reste à l'intérieur du fichier, l'anonymat s'affaiblit très vite.
Pourquoi les métadonnées restent
Les métadonnées ne sont pas mauvaises à l'origine.
Les applications photo organisent les photos par heure et lieu de prise de vue. Les logiciels de création de documents gèrent les auteurs et l'historique des modifications. Les outils de création de PDF enregistrent le titre et le logiciel de création.
Autrement dit, les métadonnées existent pour rendre le travail plus pratique.
Le problème est que ces informations pratiques restent aussi lors de la publication ou du partage.
Une information qui ne pose pas problème lorsqu'elle est utilisée seulement sur votre propre appareil devient un indice vers l'identité ou l'organisation lorsqu'elle est transmise à l'extérieur.
Métadonnées problématiques pour l'anonymat
Les métadonnées auxquelles il faut faire particulièrement attention pour l'anonymat sont celles qui sont liées à une personne, un lieu, un moment, un appareil ou une organisation.
| Type | Exemple | À quoi cela mène |
|---|---|---|
| Informations personnelles | Nom de l'auteur, nom d'utilisateur, nom d'entreprise | Vrai nom ou appartenance |
| Informations temporelles | Heure de création, heure de prise de vue, heure de mise à jour | Heure d'activité, horaires de travail, historique des déplacements |
| Informations de localisation | GPS, lieu de prise de vue | Lieux habituels, lieu de travail, école, lieux fréquentés |
| Informations sur l'appareil | Modèle d'appareil photo, modèle de smartphone, nom du logiciel | Appareil ou environnement utilisé |
| Informations d'édition | Commentaires, historique des changements, calques | Travail interne, personnes concernées, informations avant correction |
Pris isolément, ces éléments peuvent sembler petits. Mais combinés au contenu publié, à l'arrière-plan de l'image, au compte et à l'heure de publication, ils deviennent des matériaux pour déduire une identité.
Supprimer les métadonnées ne suffit pas
Supprimer les métadonnées est important. Mais cela seul ne rend pas la situation sûre.
Par exemple, même si les informations GPS sont supprimées d'une photo, le lieu peut encore être déduit si un nom de gare, de magasin, d'école, une affiche interne, un uniforme ou une plaque d'immatriculation apparaît en arrière-plan.
Même si les informations d'auteur sont supprimées d'un PDF, les possibilités peuvent se réduire si le texte contient un nom de service, un terme interne ou un contexte connu seulement d'un petit nombre de personnes.
| Ce qu'il faut vérifier | Où regarder | Exemple |
|---|---|---|
| Métadonnées | Informations internes du fichier | Auteur, heure, informations de localisation |
| Contenu visible | Image ou corps du texte lui-même | Arrière-plan, panneaux, style d'écriture, informations internes |
| Nom du fichier | Nom utilisé au partage | Vrai nom, nom d'affaire, nom d'organisation |
| Chemin de partage | D'où il a été transmis | Historique cloud, e-mail, compte |
Pour l'anonymat, vérifiez séparément les métadonnées et le contenu. Regarder seulement un côté ne suffit pas.
Ordre de vérification avant publication
Pour vérifier les métadonnées, fixer un ordre réduit les oublis.
- Regarder le nom du fichier
- Regarder le contenu visible du fichier
- Vérifier les métadonnées
- Supprimer les métadonnées inutiles
- Revérifier le fichier après suppression
- Vérifier la méthode de partage et la destination d'upload
Ce qui est particulièrement important, c'est de revérifier après suppression.
Certains logiciels ajoutent de nouvelles métadonnées au moment de l'enregistrement ou de la conversion. Les informations peuvent aussi changer après la modification d'une image, l'export d'un PDF ou l'upload vers le cloud.
Il est également important de ne pas confondre le fichier vérifié avec le fichier qui sera publié.
Si, après avoir vérifié le fichier d'origine, vous l'enregistrez sous un autre nom, exportez un nouveau fichier après avoir modifié une image, le convertissez en PDF ou le regroupez dans une archive, vérifiez à nouveau le fichier final destiné à la publication.
| Opération | Raison de revérifier |
|---|---|
| Enregistrer sous | De nouvelles informations d'auteur peuvent être ajoutées |
| Conversion PDF | Le logiciel de création ou un titre peut être ajouté |
| Modification d'image | Le logiciel d'édition ou l'heure d'enregistrement peut être ajouté |
| Compression | Des noms de fichiers ou de dossiers internes restent |
| Upload cloud | Des informations de propriétaire ou un historique peuvent être ajoutés |
Ce qu'il faut éviter dans la gestion des métadonnées
Quand vous gérez des métadonnées, évitez les erreurs suivantes.
- Se rassurer parce que seul le nom du fichier a été changé
- Supprimer seulement le GPS d'une image sans regarder l'arrière-plan
- Regarder seulement les propriétés du PDF sans vérifier les commentaires ou l'historique des modifications
- Ne pas revérifier le fichier après conversion
- Ne pas vérifier l'historique ou le compte d'un lien de partage cloud
- Déplacer tel quel un fichier créé dans un environnement sous vrai nom vers un environnement anonyme
Les métadonnées ne sont pas réglées en supprimant un seul élément. Vérifiez aussi le format du fichier, le logiciel de création, la méthode d'édition et la méthode de partage.
Ne pas tout laisser aux outils
Les outils de suppression des métadonnées sont utiles. Mais il est dangereux de penser qu'un fichier est sûr simplement parce qu'il est passé par un outil.
Un format peut ne pas être pris en charge par l'outil. Une partie des métadonnées peut rester. Des informations peuvent rester dans le texte visible ou l'arrière-plan. Après suppression, un autre logiciel peut ajouter de nouvelles informations.
Pour les mesures liées aux métadonnées, considérez la suppression, la revérification et la vérification du contenu comme un ensemble. Les méthodes de vérification détaillées et l'utilisation d'ExifTool sont traitées dans un autre article.
Le poids varie selon le destinataire
Le risque lié aux métadonnées varie selon le destinataire.
Le niveau de vérification nécessaire n'est pas le même entre une photo envoyée à la famille et des documents envoyés comme information anonyme. Il diffère aussi entre une image publiée sur un réseau social public et une image dont le fichier original est partagé dans le cloud.
Dans les situations à haut risque, envisagez aussi d'extraire seulement les informations nécessaires plutôt que de transmettre le fichier original tel quel. Décidez du niveau de vérification des métadonnées selon l'objectif et le destinataire.
Résumé
Les métadonnées ne sont pas le contenu même du fichier, mais des informations sur ce fichier.
Photos, vidéos, PDF, documents Office et fichiers audio peuvent conserver auteur, heure, informations de localisation, informations sur l'appareil, historique des modifications, etc.
Les métadonnées sont des informations utiles, mais pour l'anonymat elles deviennent des indices liés à l'identité, au lieu, au moment, à l'organisation et à l'appareil.
Cependant, supprimer les métadonnées ne rend pas tout sûr. Il faut aussi vérifier séparément les arrière-plans des images, le contenu du texte, les noms de fichiers, les chemins de partage et l'historique cloud.
Pour l'anonymat, il est important de regarder à la fois les "informations qui restent derrière le fichier" et les "informations qui restent visibles".
Outils liés
ExifTool
Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.
Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.
URL : https://exiftool.org/
MAT2
Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.
Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.