Vérifier les métadonnées des fichiers reçus
Les fichiers reçus d'une source ne doivent pas être ouverts tels quels ni partagés tels quels.
Images, PDF, documents Office, vidéos, sons et fichiers compressés peuvent conserver des informations autres que le contenu principal. Nom d'auteur, nom d'organisation, lieu de prise de vue, date et heure de prise de vue, historique de modification, commentaires, noms de fichiers internes. Ces informations deviennent des indices qui désignent la source.
La vérification des métadonnées est nécessaire non seulement avant publication, mais aussi avant le partage au sein de la rédaction.
Ce que sont les métadonnées
Les métadonnées sont des informations associées à un fichier, et non le contenu du fichier lui-même.
Pour un document, l'auteur ou l'historique de modification peuvent poser problème ; pour une image, la date de prise de vue ou le GPS ; pour une vidéo, les informations d'appareil ou le son ; pour une archive compressée, les noms de dossiers internes.
| Fichier | Informations à vérifier |
|---|---|
| Image | GPS, date et heure de prise de vue, modèle d'appareil, miniature |
| Auteur, logiciel d'édition, informations intégrées | |
| Word ou Excel | Auteur, nom d'organisation, historique des modifications, commentaires |
| Vidéo | Date et heure de prise de vue, informations sur l'appareil, son, arrière-plan |
| Audio | Environnement d'enregistrement, locuteurs, sons de fond, informations de création |
| Fichier compressé | Noms de fichiers internes, structure des dossiers, dates de création |
Si l'on juge un fichier seulement à son apparence, ces informations sont manquées.
Les métadonnées sont des informations descriptives attachées au fichier. Elles peuvent inclure l'auteur, la date et l'heure, l'appareil, l'historique de modification, les informations de position, le logiciel et les noms de fichiers internes. Même si la source a supprimé son nom du texte, son vrai nom ou le nom de son organisation peut rester dans les métadonnées.
Mais les métadonnées ne sont pas le seul problème. L'arrière-plan d'une image, les voix ou noms de lieux dans un son, les termes internes du texte, le nom de fichier et la structure des dossiers deviennent aussi des indices. La vérification des métadonnées fait partie de la vérification globale du fichier.
Comment elles se relient à la source
Les métadonnées peuvent parfois révéler directement le nom de la source.
Mais ce n'est pas tout. Un nom d'organisation, un nom d'appareil, un nom de service, un lieu ou une heure de prise de vue peuvent aussi réduire les candidats.
| Information restante | Lien avec la source |
|---|---|
| Nom d'auteur | Un vrai nom ou un compte interne apparaît |
| Nom d'organisation | Le lieu de travail ou le service devient visible |
| Lieu de prise de vue | Le lieu où le document a été photographié devient visible |
| Heure de prise de vue | Peut être recoupée avec les horaires de travail ou les journaux d'entrée et sortie |
| Historique de commentaires | Les coéditeurs et les échanges internes deviennent visibles |
Dans des documents internes, ce n'est pas toujours l'auteur qui est soupçonné : ce peut être un lecteur ou un éditeur.
Il faut réfléchir à quelle information mène à quelle personne.
Par exemple, le GPS d'une image indique le lieu de prise de vue. Le dernier enregistreur d'un document Office indique un nom de compte interne. La date de création d'un PDF coïncide avec l'heure de consultation d'un document. Une archive compressée conserve un dossier portant le nom d'un service. Ces éléments indiquent non seulement la source elle-même, mais aussi les destinataires du document ou les services concernés.
Dans la protection des sources, on ne conclut pas « le nom n'apparaît pas, donc c'est sûr ». Il faut vérifier qu'il ne reste pas d'informations qui réduisent les candidats.
Ordre de vérification
Les fichiers reçus doivent être vérifiés dans un environnement de contrôle isolé.
Si on les place tels quels dans le cloud habituel ou sur un appareil personnel, synchronisation, aperçu, historique et sauvegardes peuvent se produire.
| Ordre | Action |
|---|---|
| 1 | Noter le canal de réception et la situation de l'expéditeur |
| 2 | Ne pas ouvrir imprudemment le fichier original ; créer une copie pour vérifier |
| 3 | Vérifier le nom de fichier, l'extension et la date de création |
| 4 | Vérifier les métadonnées, les commentaires et l'historique des modifications |
| 5 | Supprimer les informations inutiles de la copie de publication |
| 6 | Faire revérifier par une autre personne avant publication |
Il peut être nécessaire de conserver le fichier original pour sa valeur probante.
Même dans ce cas, il faut le traiter séparément du fichier destiné à la publication.
Si un fichier reçu est ouvert dans l'environnement habituel, l'aperçu, la synchronisation, les fichiers récents, l'antivirus ou la sauvegarde cloud peuvent se déclencher. Le fichier provenant de la source se retrouve alors ailleurs. Pour les documents à risque élevé, il faut séparer l'environnement de vérification et le lieu de stockage.
Il est aussi important de ne pas modifier directement le fichier original. Il peut devoir être préservé comme preuve. Il faut distinguer le fichier original, la copie de vérification et la copie de publication, et ne modifier que la copie de publication.
Ne pas dépendre seulement des outils
Les outils sont utiles pour vérifier les métadonnées.
ExifTool est un outil représentatif qui permet de vérifier localement les métadonnées de nombreux formats de fichiers. Le point important est de pouvoir vérifier les fichiers reçus en local, sans les téléverser vers un site de vérification en ligne dont on ne connaît pas bien le fonctionnement. Son usage détaillé est traité dans un autre article.
URL : https://exiftool.org/
Cependant, les outils ne rendent pas un fichier sûr à eux seuls.
L'arrière-plan d'une image, le contenu audio, les expressions propres dans le texte d'un document ou le type de document lui-même peuvent permettre de déduire la source.
| Méthode de vérification | Ce qui est facilement manqué |
|---|---|
| Outil de vérification des métadonnées | Arrière-plan d'une image ou contenu du texte |
| Vérification visuelle | Informations d'auteur internes au fichier |
| Écoute audio | Métadonnées et informations sur l'appareil d'enregistrement |
| Suppression automatique | Une partie des commentaires ou de l'historique des modifications |
Il faut combiner la vérification par outil et la vérification humaine.
Un outil comme ExifTool aide à voir des informations invisibles. Mais l'absence d'affichage par l'outil ne signifie pas que le fichier est sûr. Un nom de gare dans l'arrière-plan d'une image, un nom prononcé dans un enregistrement ou une formulation qui révèle un service dans un document doivent être vérifiés par une personne.
À l'inverse, le contrôle visuel humain seul peut manquer les informations d'auteur ou les données intégrées à l'intérieur du fichier. Dans la protection des sources, il faut combiner les outils avec la vérification visuelle et l'examen du contenu audio.
Vérifier avant le partage dans la rédaction
Vérifier les métadonnées seulement juste avant publication peut être trop tard. Au moment où le fichier original est placé dans un dossier partagé, un chat ou un cloud de rédaction, les lecteurs et l'historique de partage s'étendent. Il ne faut pas partager tel quel avec de nombreuses personnes un fichier contenant des informations sur la source.
| À vérifier avant partage | Raison |
|---|---|
| Périmètre de partage | Ne pas élargir au-delà des personnes nécessaires |
| Nom de fichier | Vérifier qu'il ne révèle pas la source ou l'organisation |
| Métadonnées | Vérifier auteur, position et historique de modification |
| Lieu de stockage | Éviter le cloud sous vrai nom ou les grands dossiers partagés |
| Copie de publication | La traiter séparément du fichier original |
Les fichiers reçus deviennent des objets de protection des sources avant même de devenir des éléments publiés.
Pour les documents à risque élevé, il peut être nécessaire de ne pas décider seul de la vérification ou du traitement. Valeur probante, risque juridique et protection des sources se croisent ; il faut, selon les cas, consulter un responsable éditorial, un avocat ou un spécialiste de confiance. Mais même lors de la consultation, il faut éviter d'élargir imprudemment la diffusion du fichier original. Juste après réception, il faut d'abord l'isoler. Avant de le faire circuler dans le cloud ou le chat habituel, il faut décider de l'environnement de vérification, du lieu de stockage et du périmètre de partage.
Conclusion
Les fichiers reçus d'une source conservent des informations autres que le contenu principal.
Auteur, nom d'organisation, lieu de prise de vue, date et heure de prise de vue, historique de modification, commentaires et noms de fichiers internes deviennent des indices qui désignent la source.
Les fichiers doivent être vérifiés non seulement avant publication, mais aussi avant le partage au sein de la rédaction.
Les outils comme ExifTool sont utiles, mais l'arrière-plan, le texte, le son et la déduction à partir du type de document doivent être examinés séparément.
La vérification des métadonnées est une tâche de base de la protection des sources.
Outils liés
Google Lens
Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.
Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.
URL : https://lens.google/
ExifTool
Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.
Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.
URL : https://exiftool.org/
MAT2
Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.
Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.
qpdf
Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.
Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.
FFmpeg
Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.
Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.
URL : https://ffmpeg.org/
SecureDrop
Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.
Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.
URL : https://securedrop.org/
GlobaLeaks
Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.
Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.
URL : https://globaleaks.org/