Learn

266 articlesCatégorie : Tous
Métadonnées

Risques invisibles qui restent dans les PDF

Les PDF semblent sûrs parce que leur apparence est fixe.

Pourtant, un PDF peut conserver des informations autres que le texte affiché à l'écran.

Nom du créateur, application de création, date de modification, annotations, fichiers intégrés, texte caché, traces du document d'origine, etc.

Quand vous partagez anonymement un document, penser "c'est bon parce que je l'ai converti en PDF" est dangereux.

Cet article organise les risques invisibles qui restent dans les PDF et les points à vérifier avant publication.

Un PDF ne se juge pas seulement à son apparence

Un PDF est un format pratique qui s'affiche comme du papier.

Cependant, un fichier PDF peut contenir des informations autres que les pages affichées.

InformationContenuPoint d'attention pour l'anonymat
CréateurNom d'utilisateur ou information d'application ayant créé le documentRapproche d'une personne ou d'une organisation
Date de créationHeure de création ou de modificationSe relie à l'heure d'action ou de soumission
AnnotationsCommentaires, marqueurs, notesLe processus d'édition ou les personnes liées apparaissent
Éléments intégrésPièces jointes, polices, imagesLes données d'origine ou l'environnement de création restent
Texte cachéOCR, texte copiableDes informations censées être caviardées peuvent rester

Même si l'apparence du PDF est propre, ses informations internes ne le sont pas nécessairement.

Pour l'anonymat, vérifiez séparément les pages affichées et les informations internes du fichier.

Ce que la conversion en PDF supprime et ce qu'elle laisse

Lorsque vous convertissez un document Office ou une image en PDF, certaines informations changent.

Mais tous les risques ne disparaissent pas.

Ce qui change par la conversionCe qui peut rester
Un document modifiable devient un affichage fixeCréateur, application de création, date de création
Le contenu est intégré comme imageTexte dans l'image, arrière-plan, reflets
Les polices et la mise en page sont fixéesPolices intégrées et informations d'application
Les commentaires peuvent disparaîtreLes annotations ou historiques de modification peuvent rester sous une autre forme
Le caviardage semble effectuéLe texte dessous peut rester

La conversion en PDF peut être utile dans certaines situations.

Mais "avoir fait un PDF" et "avoir fini de vérifier l'anonymat" sont deux choses différentes.

Caviardage et texte caché

Le cas particulièrement dangereux dans un PDF est celui où l'on pense avoir caché une information par caviardage.

Si vous placez seulement un rectangle noir par-dessus le texte, le texte dessous peut rester dans le fichier.

Même s'il est illisible à l'écran, les caractères d'origine peuvent apparaître par copie, recherche, extraction ou analyse interne.

MéthodeRisque
Superposer une forme noireLe texte dessous peut rester
Mettre le texte dans la couleur du fondIl peut apparaître par copie ou recherche
Transformer en capture d'écranBaisse de qualité, texte lisible par OCR, informations d'arrière-plan restantes
Utiliser une fonction dédiée de caviardageUne revérification après traitement est nécessaire

Pour les documents qui nécessitent un caviardage, utilisez une fonction dédiée, puis vérifiez après traitement par recherche, copie et contrôle des métadonnées.

Pour les documents à haut risque, ne décidez pas seulement avec cet article et envisagez aussi de consulter un spécialiste ou une personne ou structure de confiance.

Informations d'organisation dans les PDF

Dans les lancements d'alerte et les documents de reportage, les informations d'organisation présentes dans un PDF deviennent un gros problème.

Outre le nom du créateur, les modèles, noms de service, chemins de fichier, annotations, numéros de diffusion, filigranes et formats de numérotation des pages deviennent des indices.

IndiceCe qu'il révèle
Nom du créateurAuteur du document ou compte du terminal
Nom d'entrepriseOrganisation d'appartenance ou environnement de création
ModèleService ou flux de travail
Auteur d'annotationPersonne impliquée dans l'édition
Filigrane ou numéro de diffusionDestinataire ou origine du document

Un PDF ressemble à une "version finale".

Mais précisément parce qu'il s'agit d'une version finale, des traces de création interne peuvent y rester.

Pourquoi c'est particulièrement dangereux pour les alertes et les documents de reportage

Dans les lancements d'alerte et les documents de reportage, les informations internes d'un PDF peuvent indiquer "qui pouvait connaître ce document".

Même si le document lui-même ne contient pas de nom, le cercle des candidats se réduit si le périmètre de diffusion, l'heure de modification, les annotations, le filigrane, les numéros de page, le numéro de document ou un modèle propre à un service restent.

Indice dans le PDFCe qui est déduit
Numéro de diffusionÀ quel service ou à quelle personne le document a été distribué
FiligraneInformation destinée à identifier un lecteur ou destinataire
Nom de l'annotateurPersonne ayant relu ou personne liée
Date de modificationQui pouvait travailler à ce moment-là
ModèleOrganisation, service ou flux de travail

Même si ces informations n'ont pas de sens pour le public général, elles peuvent être de forts indices pour les personnes internes à l'organisation.

Pour l'anonymat, pensez non seulement à ce que voit une personne qui ne connaît pas le contexte, mais aussi à ce que voit une personne qui le connaît.

Attention aussi à l'extraction de texte dans les PDF

Même quand un PDF ressemble à une image, il peut contenir du texte en interne.

Dans un PDF traité par OCR, un texte de recherche peut se trouver derrière l'image scannée.

Même si vous caviardez ou floutez l'image, le texte d'origine reste dangereux s'il est conservé dans le texte de recherche.

ÉtatCe qu'il faut vérifier
PDF scannéUn texte OCR est-il présent ?
PDF caviardéLe texte d'origine apparaît-il par copie ou recherche ?
PDF contenant des imagesDu texte ou un arrière-plan dans l'image reste-t-il ?
PDF annotéLe contenu des annotations ou commentaires est-il extractible ?
Formulaire PDFLes champs saisis ou états sélectionnés restent-ils ?

Avant de publier un PDF, ne vous contentez pas de le lire visuellement : effectuez aussi une recherche, une copie et une vérification des métadonnées.

"Invisible à l'écran" n'est pas une preuve de sécurité.

Outils utilisables pour la vérification

Si vous utilisez un service en ligne pour vérifier, convertir, caviarder ou supprimer les métadonnées d'un PDF, le fichier d'origine, son nom, ses informations internes et les informations d'accès peuvent être transmis au service. Pour un document à haut risque, n'envoyez pas le fichier vers un service externe ; vérifiez-le dans un environnement local, puis revérifiez le résultat avec une autre méthode.

ExifTool est parfois utilisé pour vérifier les métadonnées des PDF.

URL: https://exiftool.org/

qpdf est aussi une option pour vérifier la structure ou convertir un PDF. qpdf est un outil utilisé pour vérifier la structure des fichiers PDF et les convertir ; sa documentation officielle permet de consulter son usage.

URL: https://qpdf.readthedocs.io/

Cependant, utiliser un outil ne rend pas automatiquement le fichier sûr.

Il faut lire les informations affichées, puis revérifier après suppression ou régénération.

Vérification avant publication

Avant de publier un PDF, vérifiez dans l'ordre suivant.

OrdreCe qu'il faut vérifierRaison
1Regarder le créateur et la date de créationVérifier que cela ne se relie pas à la personne ou à l'heure de travail
2Regarder les annotations et commentairesVérifier que le processus d'édition ou les personnes liées ne restent pas
3Vérifier les zones caviardéesVoir si le texte dessous reste présent
4Regarder les fichiers intégrés et imagesVérifier qu'aucune donnée d'origine ou autre fichier ne reste
5Regarder le nom du fichierVérifier qu'aucun nom, service ou nom de projet ne reste
6Revérifier après suppressionConfirmer que le traitement a réussi

Le PDF est un format qui se copie facilement après publication.

La vérification avant publication est donc importante.

Décider de ne pas publier un PDF

Pour un PDF à haut risque, la suppression ou la conversion peut ne pas suffire.

Le contenu même du document peut réduire le cercle des sources possibles.

Par exemple, si une chronologie connue seulement des personnes présentes à une réunion, des abréviations propres à un service ou des différences de formulation selon les destinataires restent, le cercle des candidats se réduit même après suppression des métadonnées.

Dans ce cas, il faut envisager de ne pas publier le PDF tel quel : résumer le contenu, généraliser les expressions propres, faire vérifier seulement le nécessaire par une personne ou structure de confiance, ou porter le document à un spécialiste ou un organisme d'aide.

Dans l'anonymat, rendre le fichier propre et pouvoir le publier sont deux questions différentes.

Résumé

Les PDF semblent sûrs parce que leur apparence est fixe, mais ils peuvent conserver en interne le créateur, la date de création, les annotations, les éléments intégrés et le texte caché.

La conversion en PDF seule ne complète pas l'anonymat.

Il faut faire particulièrement attention au caviardage, aux annotations, aux informations d'organisation, aux numéros de diffusion et aux noms de fichier.

Les outils comme ExifTool et qpdf aident à vérifier, mais la sécurité ne se décide pas au seul nom de l'outil.

Avant publication, vérifiez ensemble l'apparence, les informations internes, le nom de fichier et le résultat après suppression.

Outils liés

Metadata inspection

ExifTool

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://exiftool.org/

Ouvrir le site externe
Metadata removal

MAT2

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://0xacab.org/jvoisin/mat2

Ouvrir le site externe
PDF inspection

qpdf

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://qpdf.readthedocs.io/

Ouvrir le site externe

Articles liés