Learn

284 articlesCatégorie : Tous
Texte et contenu

Indices d'identité dans un texte

Quand on publie anonymement, beaucoup de personnes retirent leur nom et leur adresse.

Mais le texte lui-même peut contenir des indices sur l'identité. Le style, les tournures, les termes spécialisés, les expressions régionales, les expériences racontées, la chronologie, la façon dont les émotions apparaissent, les mots souvent utilisés. Ces informations peuvent être reliées à d'anciens comptes ou à un environnement d'identité réelle.

En matière d'anonymat, on examine un texte à la fois par son contenu et par sa manière d'être écrit.

Cet article classe les indices qui permettent de déduire une identité à partir d'un texte.

Indices présents dans le contenu

Le contenu d'un texte contient facilement des informations qui resserrent le cercle autour de la personne ou de ses proches.

IndiceExempleRisque pour l'anonymat
RégionGare, magasin, météo, dialecteLes lieux habituels deviennent visibles
ProfessionTermes du secteur, mode de travailLes lieux de travail possibles se réduisent
ÉcoleAnnée, événements, enseignantsLa personne ou sa famille peut être cernée
FamilleEnfant, conjoint, personne vivant au domicileCela implique aussi d'autres personnes
ChronologieCe qui s'est passé tel jourPeut être recoupé avec des traces

Même sans écrire de nom réel, la combinaison des éléments de contenu réduit le nombre de candidats possibles.

Indices présents dans l'écriture

La manière d'écrire devient elle aussi un indice.

Les mêmes tournures, l'usage de la ponctuation, les fins de phrase, les retours à la ligne, le choix de termes spécialisés et les fautes récurrentes peuvent créer une corrélation avec d'anciens messages.

Manière d'écrireCe qui devient visiblePoint d'attention
Tics de langageImpression d'un même auteurVérifier que cela ne ressemble pas trop aux réseaux sociaux en identité réelle
Termes spécialisésProfession ou expérienceNe pas être plus précis que nécessaire
DialecteRégion ou origineDevient fort lorsqu'il recoupe des noms de lieux
Retours à la ligne et signesHabitudes de styleS'accumulent sur la durée
Fautes récurrentesImpression de même personneLes mêmes erreurs répétées se remarquent

Le style seul ne permet pas toujours d'identifier une personne.

Mais lorsqu'il est combiné à d'anciens comptes, aux heures de publication et aux sujets abordés, il devient un indice fort.

Informations comprises seulement par les personnes concernées

Dans un texte, les informations les plus dangereuses sont souvent celles que seules les personnes concernées peuvent comprendre.

Un lecteur ordinaire peut ne rien y voir, alors que le lieu de travail, l'école, la famille ou l'organisation visée peut comprendre.

InformationVue depuis l'extérieurVue par les personnes concernées
Déroulement d'une réunionScène courante de travailPermet de savoir quel service est concerné
Paroles d'un enseignantHistoire scolairePermet d'identifier un enseignant ou une classe
Événement familialHistoire personnelleLa famille peut reconnaître la personne
Coulisses d'un événementHistoire de participantLes personnes présentes peuvent comprendre
Caractéristiques d'un documentDocument ordinairePermet de savoir de quel dossier il s'agit

Avant publication, il faut vérifier non seulement si une personne extérieure comprend, mais aussi si une personne au courant comprendrait en lisant.

Logique de réécriture

Pour réduire les indices dans un texte, on conserve le sens tout en abaissant la granularité.

Information d'origineExemple de réécritureSens conservé
Près de la gare de ShibuyaAutour d'une gare en zone urbaineLa nature du lieu
Troisième année en comptabilitéQuelques années dans un service administratifPosition et expérience
Réunion du 12 maiRéunion interne récenteDéroulement de l'événement
Mon fils en deuxième année de collègeMon enfantContexte familial
Nom réel du chef de serviceSupérieur hiérarchiqueRelation

Cela dit, dans une alerte ou une demande de conseil, certaines situations exigent des informations exactes.

On peut aussi séparer les usages: flouter le texte destiné à la publication, et transmettre les informations exactes à un interlocuteur de confiance.

Corrélation textuelle à l'ère de l'IA

La corrélation entre textes ne vient pas seulement de la mémoire humaine.

La recherche, le résumé, la traduction et la comparaison de textes rendent plus faciles les rapprochements entre anciens messages et messages actuels. Quand l'effort nécessaire pour lire de grands volumes de publications diminue, les correspondances de style, de sujets et de termes spécialisés deviennent plus faciles à trouver.

MatériauExemple de corrélationPoint d'attention
StyleImpression d'un même auteurVérifier qu'il ne ressemble pas trop au côté identité réelle
Termes spécialisésProfession ou appartenanceLes limiter au périmètre nécessaire
Combinaison de sujetsLoisirs, région, professionLe portrait de la personne se précise
Anciennes publicationsAncien identifiant ou blogPeuvent être trouvées par recherche
TraductionPublications dans une autre langueLes publications à l'étranger ne sont pas séparées automatiquement

Il n'est pas nécessaire de faire croire que le texte a été écrit par une personne complètement différente.

Mais pour une prise de parole à haut risque, il faut éviter de laisser apparaître trop fortement les mêmes habitudes que dans les textes du côté identité réelle.

Ordre de relecture avant publication

Pour vérifier un texte, on regarde d'abord le contenu, puis les personnes concernées, puis la manière d'écrire.

OrdreÉlément à regarderRaison
1Noms réels, noms de lieux, noms d'organisationsCe sont des indices directs
2Travail, école, familleIls resserrent les candidats possibles
3Dates, nombres de personnes, fonctionsIls peuvent être recoupés avec des traces
4Informations comprises seulement par les personnes concernéesElles mènent à une identification interne
5Style et tics de langageIls corrèlent avec d'anciens comptes

Il ne faut pas commencer par corriger uniquement le style: les indices forts se retirent d'abord.

Ensuite, on revoit les habitudes d'écriture et les biais dans les sujets abordés.

Un texte court n'est pas forcément sûr

Même une publication courte peut être dangereuse si elle contient des détails identifiants.

Des phrases courtes comme "là, dans le magasin devant la gare", "dans notre service aujourd'hui" ou "tout à l'heure à l'école de mon enfant" peuvent sembler pauvres en informations, mais elles exposent fortement le lieu, le moment et les personnes concernées.

Expression courteInformations exposées
Dans le magasin devant la gare, maintenantLieu et heure actuelle
Dans notre service aujourd'huiLieu de travail et date
À l'école de mon enfantFamille et école
Après le travail de nuitMode de travail
À l'hôpital habituelLieux habituels et information de santé

On ne regarde pas la longueur du texte, mais ce qui peut être relié.

Périmètre à regarderÉlément à vérifier
Publications récentesDétails identifiants actuellement exposés
Anciennes publicationsRépétition des mêmes sujets ou régions
RéponsesInformations ajoutées sous le coup de l'émotion
ProfilAttributs qui se combinent avec le corps du texte
Autres comptesRecoupement du même style ou des mêmes sujets

Le texte se vérifie à l'échelle du compte entier, pas seulement publication par publication.

Réduire la corrélation plutôt qu'écrire comme quelqu'un d'autre

Dans une publication anonyme, il n'est pas nécessaire de penser qu'il faut écrire comme une personne complètement différente.

L'important est de réduire les corrélations fortes avec le côté identité réelle ou avec d'anciens comptes. Quand les tournures particulières utilisées habituellement, les mêmes suites de termes spécialisés, les mêmes régions, la même manière de se mettre en colère et les mêmes images se recoupent, le texte prend une signature personnelle.

Corrélation à éviterExemple d'ajustementRaison
Même formule récurrenteLa remplacer par une expression plus généraleRéduit les correspondances avec d'anciennes publications
Termes professionnels trop précisLes ramener à ce qui est nécessaire au lecteurÉlargit les appartenances possibles
Expression régionaleUtiliser une formulation standardAffaiblit la corrélation avec les lieux habituels
Même manière de se mettre en colèreSéparer les faits et les effetsAtténue les habitudes émotionnelles
Même anecdote personnelleFlouter la période et les détailsÉvite le lien avec le côté identité réelle

La protection du texte peut rester compatible avec la lisibilité.

Si l'on retire trop d'informations au point de rendre le sens incompréhensible, le message n'atteint plus les lecteurs. Un texte qui protège l'anonymat retire les détails utilisables pour identifier, tout en gardant la structure et le contexte nécessaires à la compréhension.

Au final, il faut vérifier si une personne qui vous connaît du côté identité réelle aurait du mal à sentir qu'il s'agit de la même personne.

Résumé

Un texte contient des indices d'identité à la fois dans son contenu et dans sa manière d'être écrit.

Quand la région, la profession, l'école, la famille, la chronologie, les termes spécialisés, le style, les tics de langage et les informations comprises seulement par les personnes concernées se recoupent, la personne ou ses proches peuvent être cernés.

En matière d'anonymat, supprimer le nom ne suffit pas.

Il faut relire le texte et vérifier ce qui peut être relié à des informations passées ou à un environnement d'identité réelle.

L'essentiel est de réduire les détails utilisables pour identifier tout en conservant le sens nécessaire.

Outils liés

OSINT directory

OSINT Framework

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://osintframework.com/

Ouvrir le site externe

Articles liés