Quand on publie anonymement, beaucoup de personnes retirent leur nom et leur adresse.
Mais le texte lui-même peut contenir des indices sur l'identité. Le style, les tournures, les termes spécialisés, les expressions régionales, les expériences racontées, la chronologie, la façon dont les émotions apparaissent, les mots souvent utilisés. Ces informations peuvent être reliées à d'anciens comptes ou à un environnement d'identité réelle.
En matière d'anonymat, on examine un texte à la fois par son contenu et par sa manière d'être écrit.
Cet article classe les indices qui permettent de déduire une identité à partir d'un texte.
Indices présents dans le contenu
Le contenu d'un texte contient facilement des informations qui resserrent le cercle autour de la personne ou de ses proches.
Indice
Exemple
Risque pour l'anonymat
Région
Gare, magasin, météo, dialecte
Les lieux habituels deviennent visibles
Profession
Termes du secteur, mode de travail
Les lieux de travail possibles se réduisent
École
Année, événements, enseignants
La personne ou sa famille peut être cernée
Famille
Enfant, conjoint, personne vivant au domicile
Cela implique aussi d'autres personnes
Chronologie
Ce qui s'est passé tel jour
Peut être recoupé avec des traces
Même sans écrire de nom réel, la combinaison des éléments de contenu réduit le nombre de candidats possibles.
Indices présents dans l'écriture
La manière d'écrire devient elle aussi un indice.
Les mêmes tournures, l'usage de la ponctuation, les fins de phrase, les retours à la ligne, le choix de termes spécialisés et les fautes récurrentes peuvent créer une corrélation avec d'anciens messages.
Manière d'écrire
Ce qui devient visible
Point d'attention
Tics de langage
Impression d'un même auteur
Vérifier que cela ne ressemble pas trop aux réseaux sociaux en identité réelle
Termes spécialisés
Profession ou expérience
Ne pas être plus précis que nécessaire
Dialecte
Région ou origine
Devient fort lorsqu'il recoupe des noms de lieux
Retours à la ligne et signes
Habitudes de style
S'accumulent sur la durée
Fautes récurrentes
Impression de même personne
Les mêmes erreurs répétées se remarquent
Le style seul ne permet pas toujours d'identifier une personne.
Mais lorsqu'il est combiné à d'anciens comptes, aux heures de publication et aux sujets abordés, il devient un indice fort.
Informations comprises seulement par les personnes concernées
Dans un texte, les informations les plus dangereuses sont souvent celles que seules les personnes concernées peuvent comprendre.
Un lecteur ordinaire peut ne rien y voir, alors que le lieu de travail, l'école, la famille ou l'organisation visée peut comprendre.
Information
Vue depuis l'extérieur
Vue par les personnes concernées
Déroulement d'une réunion
Scène courante de travail
Permet de savoir quel service est concerné
Paroles d'un enseignant
Histoire scolaire
Permet d'identifier un enseignant ou une classe
Événement familial
Histoire personnelle
La famille peut reconnaître la personne
Coulisses d'un événement
Histoire de participant
Les personnes présentes peuvent comprendre
Caractéristiques d'un document
Document ordinaire
Permet de savoir de quel dossier il s'agit
Avant publication, il faut vérifier non seulement si une personne extérieure comprend, mais aussi si une personne au courant comprendrait en lisant.
Logique de réécriture
Pour réduire les indices dans un texte, on conserve le sens tout en abaissant la granularité.
Information d'origine
Exemple de réécriture
Sens conservé
Près de la gare de Shibuya
Autour d'une gare en zone urbaine
La nature du lieu
Troisième année en comptabilité
Quelques années dans un service administratif
Position et expérience
Réunion du 12 mai
Réunion interne récente
Déroulement de l'événement
Mon fils en deuxième année de collège
Mon enfant
Contexte familial
Nom réel du chef de service
Supérieur hiérarchique
Relation
Cela dit, dans une alerte ou une demande de conseil, certaines situations exigent des informations exactes.
On peut aussi séparer les usages: flouter le texte destiné à la publication, et transmettre les informations exactes à un interlocuteur de confiance.
Corrélation textuelle à l'ère de l'IA
La corrélation entre textes ne vient pas seulement de la mémoire humaine.
La recherche, le résumé, la traduction et la comparaison de textes rendent plus faciles les rapprochements entre anciens messages et messages actuels. Quand l'effort nécessaire pour lire de grands volumes de publications diminue, les correspondances de style, de sujets et de termes spécialisés deviennent plus faciles à trouver.
Matériau
Exemple de corrélation
Point d'attention
Style
Impression d'un même auteur
Vérifier qu'il ne ressemble pas trop au côté identité réelle
Termes spécialisés
Profession ou appartenance
Les limiter au périmètre nécessaire
Combinaison de sujets
Loisirs, région, profession
Le portrait de la personne se précise
Anciennes publications
Ancien identifiant ou blog
Peuvent être trouvées par recherche
Traduction
Publications dans une autre langue
Les publications à l'étranger ne sont pas séparées automatiquement
Il n'est pas nécessaire de faire croire que le texte a été écrit par une personne complètement différente.
Mais pour une prise de parole à haut risque, il faut éviter de laisser apparaître trop fortement les mêmes habitudes que dans les textes du côté identité réelle.
Ordre de relecture avant publication
Pour vérifier un texte, on regarde d'abord le contenu, puis les personnes concernées, puis la manière d'écrire.
Ordre
Élément à regarder
Raison
1
Noms réels, noms de lieux, noms d'organisations
Ce sont des indices directs
2
Travail, école, famille
Ils resserrent les candidats possibles
3
Dates, nombres de personnes, fonctions
Ils peuvent être recoupés avec des traces
4
Informations comprises seulement par les personnes concernées
Elles mènent à une identification interne
5
Style et tics de langage
Ils corrèlent avec d'anciens comptes
Il ne faut pas commencer par corriger uniquement le style: les indices forts se retirent d'abord.
Ensuite, on revoit les habitudes d'écriture et les biais dans les sujets abordés.
Un texte court n'est pas forcément sûr
Même une publication courte peut être dangereuse si elle contient des détails identifiants.
Des phrases courtes comme "là, dans le magasin devant la gare", "dans notre service aujourd'hui" ou "tout à l'heure à l'école de mon enfant" peuvent sembler pauvres en informations, mais elles exposent fortement le lieu, le moment et les personnes concernées.
Expression courte
Informations exposées
Dans le magasin devant la gare, maintenant
Lieu et heure actuelle
Dans notre service aujourd'hui
Lieu de travail et date
À l'école de mon enfant
Famille et école
Après le travail de nuit
Mode de travail
À l'hôpital habituel
Lieux habituels et information de santé
On ne regarde pas la longueur du texte, mais ce qui peut être relié.
Périmètre à regarder
Élément à vérifier
Publications récentes
Détails identifiants actuellement exposés
Anciennes publications
Répétition des mêmes sujets ou régions
Réponses
Informations ajoutées sous le coup de l'émotion
Profil
Attributs qui se combinent avec le corps du texte
Autres comptes
Recoupement du même style ou des mêmes sujets
Le texte se vérifie à l'échelle du compte entier, pas seulement publication par publication.
Réduire la corrélation plutôt qu'écrire comme quelqu'un d'autre
Dans une publication anonyme, il n'est pas nécessaire de penser qu'il faut écrire comme une personne complètement différente.
L'important est de réduire les corrélations fortes avec le côté identité réelle ou avec d'anciens comptes. Quand les tournures particulières utilisées habituellement, les mêmes suites de termes spécialisés, les mêmes régions, la même manière de se mettre en colère et les mêmes images se recoupent, le texte prend une signature personnelle.
Corrélation à éviter
Exemple d'ajustement
Raison
Même formule récurrente
La remplacer par une expression plus générale
Réduit les correspondances avec d'anciennes publications
Termes professionnels trop précis
Les ramener à ce qui est nécessaire au lecteur
Élargit les appartenances possibles
Expression régionale
Utiliser une formulation standard
Affaiblit la corrélation avec les lieux habituels
Même manière de se mettre en colère
Séparer les faits et les effets
Atténue les habitudes émotionnelles
Même anecdote personnelle
Flouter la période et les détails
Évite le lien avec le côté identité réelle
La protection du texte peut rester compatible avec la lisibilité.
Si l'on retire trop d'informations au point de rendre le sens incompréhensible, le message n'atteint plus les lecteurs. Un texte qui protège l'anonymat retire les détails utilisables pour identifier, tout en gardant la structure et le contexte nécessaires à la compréhension.
Au final, il faut vérifier si une personne qui vous connaît du côté identité réelle aurait du mal à sentir qu'il s'agit de la même personne.
Résumé
Un texte contient des indices d'identité à la fois dans son contenu et dans sa manière d'être écrit.
Quand la région, la profession, l'école, la famille, la chronologie, les termes spécialisés, le style, les tics de langage et les informations comprises seulement par les personnes concernées se recoupent, la personne ou ses proches peuvent être cernés.
En matière d'anonymat, supprimer le nom ne suffit pas.
Il faut relire le texte et vérifier ce qui peut être relié à des informations passées ou à un environnement d'identité réelle.
L'essentiel est de réduire les détails utilisables pour identifier tout en conservant le sens nécessaire.
Outils liés
OSINT directory
OSINT Framework
Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.
Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.
Un texte peut révéler des indices d'identité par son contenu, son style, les informations comprises par les proches, la granularité, les textes courts et les habitudes du compte.