Learn

38 articlesCatégorie : Tous
Métadonnées

Qu’est-ce que les métadonnées ?

Qu'est-ce que les métadonnées ?

Les fichiers ne contiennent pas seulement le texte ou l'image visible à l'écran.

Pour une photo, il peut s'agir de l'heure de prise de vue ou du modèle d'appareil. Pour un document, du nom de l'auteur ou du logiciel d'édition. Pour un PDF, de l'heure de création ou du titre du document. Pour une vidéo, de l'appareil d'enregistrement ou d'informations de localisation.

Ces "données sur les données" sont appelées métadonnées.

Les métadonnées sont des informations utiles. Elles servent à gérer, rechercher, modifier et organiser les fichiers.

Mais du point de vue de l'anonymat, les métadonnées deviennent des indices faciles à oublier.

Informations cachées qui restent dans le fichier

Les métadonnées ne sont pas le contenu même du fichier, mais des informations sur ce fichier.

Par exemple, les métadonnées d'une photo peuvent contenir l'heure de prise de vue, le modèle d'appareil, des informations sur l'objectif et la position GPS. Les fichiers de document peuvent conserver le nom de l'auteur, le nom de l'entreprise, l'historique des modifications, des commentaires et le logiciel utilisé.

FichierInformations qui peuvent resterPoint d'attention pour l'anonymat
PhotoHeure de prise de vue, informations de localisation, modèle d'appareilLe lieu ou l'appareil peut être compris
VidéoHeure de prise de vue, informations de localisation, informations sur l'appareilPeut mener au lieu de tournage ou aux lieux habituels
PDFAuteur, titre, logiciel de créationUn nom personnel ou un nom d'organisation peut rester
Document OfficeAuteur, nom d'entreprise, historique des modifications, commentairesDes informations internes ou des noms de personnes ayant travaillé peuvent rester
AudioHeure d'enregistrement, informations sur le logiciel, tagsPeut devenir un indice sur l'environnement d'enregistrement ou l'historique d'édition

Les métadonnées ne ressortent pas toujours quand on ouvre un fichier. C'est pour cela qu'elles sont dangereuses.

Même si le texte visible est soigneusement flouté ou généralisé, si un nom d'auteur reste à l'intérieur du fichier, l'anonymat s'affaiblit très vite.

Pourquoi les métadonnées restent

Les métadonnées ne sont pas mauvaises à l'origine.

Les applications photo organisent les photos par heure et lieu de prise de vue. Les logiciels de création de documents gèrent les auteurs et l'historique des modifications. Les outils de création de PDF enregistrent le titre et le logiciel de création.

Autrement dit, les métadonnées existent pour rendre le travail plus pratique.

Le problème est que ces informations pratiques restent aussi lors de la publication ou du partage.

Une information qui ne pose pas problème lorsqu'elle est utilisée seulement sur votre propre appareil devient un indice vers l'identité ou l'organisation lorsqu'elle est transmise à l'extérieur.

Métadonnées problématiques pour l'anonymat

Les métadonnées auxquelles il faut faire particulièrement attention pour l'anonymat sont celles qui sont liées à une personne, un lieu, un moment, un appareil ou une organisation.

TypeExempleÀ quoi cela mène
Informations personnellesNom de l'auteur, nom d'utilisateur, nom d'entrepriseVrai nom ou appartenance
Informations temporellesHeure de création, heure de prise de vue, heure de mise à jourHeure d'activité, horaires de travail, historique des déplacements
Informations de localisationGPS, lieu de prise de vueLieux habituels, lieu de travail, école, lieux fréquentés
Informations sur l'appareilModèle d'appareil photo, modèle de smartphone, nom du logicielAppareil ou environnement utilisé
Informations d'éditionCommentaires, historique des changements, calquesTravail interne, personnes concernées, informations avant correction

Pris isolément, ces éléments peuvent sembler petits. Mais combinés au contenu publié, à l'arrière-plan de l'image, au compte et à l'heure de publication, ils deviennent des matériaux pour déduire une identité.

Supprimer les métadonnées ne suffit pas

Supprimer les métadonnées est important. Mais cela seul ne rend pas la situation sûre.

Par exemple, même si les informations GPS sont supprimées d'une photo, le lieu peut encore être déduit si un nom de gare, de magasin, d'école, une affiche interne, un uniforme ou une plaque d'immatriculation apparaît en arrière-plan.

Même si les informations d'auteur sont supprimées d'un PDF, les possibilités peuvent se réduire si le texte contient un nom de service, un terme interne ou un contexte connu seulement d'un petit nombre de personnes.

Ce qu'il faut vérifierOù regarderExemple
MétadonnéesInformations internes du fichierAuteur, heure, informations de localisation
Contenu visibleImage ou corps du texte lui-mêmeArrière-plan, panneaux, style d'écriture, informations internes
Nom du fichierNom utilisé au partageVrai nom, nom d'affaire, nom d'organisation
Chemin de partageD'où il a été transmisHistorique cloud, e-mail, compte

Pour l'anonymat, vérifiez séparément les métadonnées et le contenu. Regarder seulement un côté ne suffit pas.

Ordre de vérification avant publication

Pour vérifier les métadonnées, fixer un ordre réduit les oublis.

  1. Regarder le nom du fichier
  2. Regarder le contenu visible du fichier
  3. Vérifier les métadonnées
  4. Supprimer les métadonnées inutiles
  5. Revérifier le fichier après suppression
  6. Vérifier la méthode de partage et la destination d'upload

Ce qui est particulièrement important, c'est de revérifier après suppression.

Certains logiciels ajoutent de nouvelles métadonnées au moment de l'enregistrement ou de la conversion. Les informations peuvent aussi changer après la modification d'une image, l'export d'un PDF ou l'upload vers le cloud.

Il est également important de ne pas confondre le fichier vérifié avec le fichier qui sera publié.

Si, après avoir vérifié le fichier d'origine, vous l'enregistrez sous un autre nom, exportez un nouveau fichier après avoir modifié une image, le convertissez en PDF ou le regroupez dans une archive, vérifiez à nouveau le fichier final destiné à la publication.

OpérationRaison de revérifier
Enregistrer sousDe nouvelles informations d'auteur peuvent être ajoutées
Conversion PDFLe logiciel de création ou un titre peut être ajouté
Modification d'imageLe logiciel d'édition ou l'heure d'enregistrement peut être ajouté
CompressionDes noms de fichiers ou de dossiers internes restent
Upload cloudDes informations de propriétaire ou un historique peuvent être ajoutés

Ce qu'il faut éviter dans la gestion des métadonnées

Quand vous gérez des métadonnées, évitez les erreurs suivantes.

  • Se rassurer parce que seul le nom du fichier a été changé
  • Supprimer seulement le GPS d'une image sans regarder l'arrière-plan
  • Regarder seulement les propriétés du PDF sans vérifier les commentaires ou l'historique des modifications
  • Ne pas revérifier le fichier après conversion
  • Ne pas vérifier l'historique ou le compte d'un lien de partage cloud
  • Déplacer tel quel un fichier créé dans un environnement sous vrai nom vers un environnement anonyme

Les métadonnées ne sont pas réglées en supprimant un seul élément. Vérifiez aussi le format du fichier, le logiciel de création, la méthode d'édition et la méthode de partage.

Ne pas tout laisser aux outils

Les outils de suppression des métadonnées sont utiles. Mais il est dangereux de penser qu'un fichier est sûr simplement parce qu'il est passé par un outil.

Un format peut ne pas être pris en charge par l'outil. Une partie des métadonnées peut rester. Des informations peuvent rester dans le texte visible ou l'arrière-plan. Après suppression, un autre logiciel peut ajouter de nouvelles informations.

Pour les mesures liées aux métadonnées, considérez la suppression, la revérification et la vérification du contenu comme un ensemble. Les méthodes de vérification détaillées et l'utilisation d'ExifTool sont traitées dans un autre article.

Le poids varie selon le destinataire

Le risque lié aux métadonnées varie selon le destinataire.

Le niveau de vérification nécessaire n'est pas le même entre une photo envoyée à la famille et des documents envoyés comme information anonyme. Il diffère aussi entre une image publiée sur un réseau social public et une image dont le fichier original est partagé dans le cloud.

Dans les situations à haut risque, envisagez aussi d'extraire seulement les informations nécessaires plutôt que de transmettre le fichier original tel quel. Décidez du niveau de vérification des métadonnées selon l'objectif et le destinataire.

Résumé

Les métadonnées ne sont pas le contenu même du fichier, mais des informations sur ce fichier.

Photos, vidéos, PDF, documents Office et fichiers audio peuvent conserver auteur, heure, informations de localisation, informations sur l'appareil, historique des modifications, etc.

Les métadonnées sont des informations utiles, mais pour l'anonymat elles deviennent des indices liés à l'identité, au lieu, au moment, à l'organisation et à l'appareil.

Cependant, supprimer les métadonnées ne rend pas tout sûr. Il faut aussi vérifier séparément les arrière-plans des images, le contenu du texte, les noms de fichiers, les chemins de partage et l'historique cloud.

Pour l'anonymat, il est important de regarder à la fois les "informations qui restent derrière le fichier" et les "informations qui restent visibles".

Outils liés

Metadata inspection

ExifTool

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://exiftool.org/

Ouvrir le site externe
Metadata removal

MAT2

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://0xacab.org/jvoisin/mat2

Ouvrir le site externe

Articles liés