Risques liés à Wayback Machine et aux archives

Anciennes informations et recherche

Risques liés à Wayback Machine et aux archives

Une information publiée une fois ne disparaît pas toujours complètement, même si vous la supprimez.

Elle reste dans les résultats de recherche. Elle est capturée en capture d'écran. Elle est republiée. Elle est enregistrée dans des archives.

Un exemple représentatif est de l'Internet Archive.

Wayback Machine est un service de l'Internet Archive qui enregistre et permet de consulter des états passés de pages web. URL : https://web.archive.org/

Cet article organise la manière dont les archives se rapportent à l'anonymat.

Qu'est-ce qu'une archive

Une archive est un état passé enregistré d'une page web.

Même pour des pages qui sont maintenant supprimées, leur état passé peut rester dans une archive.

Anciens profils. Blogs supprimés. Sites fermés. Anciennes pages de réseaux sociaux. Annonces d'événements. Présentations de membres.

Si ces éléments restent, ils peuvent se relier à l'activité anonyme actuelle.

Les archives ne sauvegardent pas complètement l'Internet passé tel qu'il était. Certaines pages sont enregistrées, d'autres non. Des images ou du CSS peuvent aussi manquer. Les pages qui exigent une connexion peuvent ne pas être visibles.

Cependant, quand on pense à l'anonymat, il est plus prudent de partir du principe que quelque chose peut rester. Des profils que la personne pensait avoir supprimés, d'anciennes bios, des pseudonymes, des listes de liens et des événements de participation peuvent être visibles par des tiers. Les anciens sites web et blogs, en particulier, peuvent rester plus longtemps que la personne ne s'en souvient.

Des pages supprimées peuvent être retrouvées

Même si la personne pense "je l'ai déjà supprimé", cela peut être retrouvable du point de vue d'un tiers.

Par exemple, un ancien blog contenait le nom réel et le pseudonyme. Ce blog a été supprimé. Mais il reste dans une archive.

Si vous utilisez le même pseudonyme ou le même récit d'expérience sur un compte anonyme actuel, cela se relie à la page passée.

Il est plus prudent de ne pas considérer qu'une information supprimée a toujours disparu.

Un cas fréquent est celui où l'information n'apparaît pas dans les résultats de recherche actuels, mais peut être retrouvée dans une archive si quelqu'un connaît l'ancienne URL. Pages de profil passées, pages de participation à des événements, articles de blog, portfolios et présentations sur des forums en sont des exemples. D'anciennes listes de liens ou d'anciens profils peuvent aussi mener à d'autres pages anciennes.

Dans l'activité anonyme, l'ancienne URL elle-même devient un indice. Souvenez-vous des domaines, services de blog, ID utilisateur et URL de profils que vous avez utilisés dans le passé, et vérifiez s'ils restent dans des archives.

Informations souvent visibles dans les archives

Informations qui ont tendance à rester dans les archives	Effet sur l'anonymat
Ancien profil	Le nom réel, la région et la profession sont visibles
Ancien pseudonyme	Il se relie au nom anonyme actuel
Images et icônes	Elles se relient par recherche d'images ou par souvenir
Page d'événement	L'affiliation et l'historique d'activité sont visibles
Ancienne liste de liens	Les relations et sites exploités sont visibles

Les archives sont une recherche qui remonte le temps. Regarder seulement les pages actuelles ne suffit pas.

Dans les archives, ce qui est particulièrement dangereux, c'est l'information qui ne semblait pas poser problème à l'époque. Vous aviez autrefois une activité sous votre nom réel. Vous aviez écrit le nom de votre école ou de votre lieu de travail. Vous utilisiez le même pseudonyme pour plusieurs activités. Votre image de profil montrait votre visage ou des lieux habituels.

Même si cette information était naturelle à ce moment-là, elle devient un risque lorsqu'elle est combinée avec l'activité anonyme actuelle. Les archives deviennent un pont entre votre ancien vous et l'activité anonyme actuelle.

Information d'une archive passée	Lien avec l'activité anonyme actuelle
Le nom réel et le pseudonyme figurent sur la même page	Le nom anonyme peut être relié à la personne
Une ancienne image de profil reste	Elle est comparée avec les icônes actuelles ou les photos de visage
Une école ou un lieu de travail est mentionné	Cela recoupe les informations d'affiliation dans les publications
Un ancien récit d'expérience reste	Il correspond au contexte des publications actuelles
Une liste de liens reste	Les relations et sites exploités sont visibles

Ne pas se rassurer avec les seules demandes de suppression

Il peut être possible de supprimer quelque chose d'une archive. Cependant, une demande de suppression ne supprime pas forcément tout.

Autres archives. Résultats de recherche. Sites de republication. Screenshots. Citations sur les réseaux sociaux.

Cela peut rester ailleurs.

Les demandes de suppression peuvent être utiles. Toutefois, pour l'anonymat, il est plus prudent de concevoir les publications actuelles en partant du principe que l'information reste.

Lorsque vous faites une demande de suppression, vous devez aussi connaître précisément les URL visées. Pas seulement la page d'accueil du même site : des articles individuels, profils, URL d'images, PDF et anciennes sous-pages peuvent aussi avoir été enregistrés. Même si la page d'accueil disparaît, des pages de niveau inférieur peuvent rester.

En dehors de Wayback Machine, il existe aussi les caches de moteurs de recherche, les sites de citation, les sites miroirs, les captures d'écran sur les réseaux sociaux et les données sauvegardées par des personnes. Il vaut mieux ne pas traiter la disparition d'un endroit comme une disparition globale.

Ce qu'il faut vérifier

Avant une activité anonyme, vérifiez les informations suivantes. Toutefois, si vous saisissez directement de vrais noms, d'anciens noms de famille, des adresses e-mail, des ID utilisateur, des images non publiées ou des documents à haut risque dans des moteurs de recherche ou une IA externe, les termes recherchés ou les contenus téléversés peuvent rester dans les journaux du service. Dans les cas à haut risque, évitez les environnements sous identité réelle, réduisez les termes de recherche au minimum et vérifiez en partant du principe que les documents non publiés ne doivent pas être téléversés vers des services externes.

Rechercher par nom réel et anciens pseudonymes
Vérifier les URL d'anciens blogs et sites dans Wayback Machine
Voir si d'anciens profils restent
Voir si d'anciennes images ou icônes restent
Voir s'il existe les mêmes récits d'expérience ou le même style d'écriture que dans l'activité anonyme actuelle
Noter et organiser les URL de pages supprimées

La vérification des archives fait partie de la gestion des informations passées.

Décider de l'ordre de vérification réduit les oublis. Recherchez d'abord par nom réel, ancien nom de famille, pseudonyme, adresse e-mail et ID utilisateur. Ensuite, vérifiez dans Wayback Machine les anciennes URL trouvées. Regardez aussi les liens et les URL d'images présents sur ces pages.

Classez les informations trouvées avant de passer directement à une demande de suppression. S'agit-il d'une information qui identifie directement la personne, d'une information qui montre des lieux habituels, d'une information qui relie un ancien nom anonyme à un nom réel, ou simplement d'un ancien historique d'activité ? Sans classement, il est facile de se tromper dans les priorités.

Le refléter dans la pratique actuelle

Si des informations restent dans une archive, il est important de ne pas utiliser les mêmes matériaux dans l'activité anonyme actuelle.

Si un ancien pseudonyme reste, n'utilisez pas un nom similaire. Si une ancienne image reste, n'utilisez pas la même image ni une icône avec la même impression. Si une ancienne profession ou école reste, n'écrivez pas le même contexte en détail dans les publications actuelles. Si un ancien récit d'expérience reste, ne réutilisez pas tel quel le même récit du côté anonyme.

Traiter les archives ne consiste pas seulement à effacer le passé. C'est un travail de conception de la publication actuelle en tenant compte du passé qui reste.

Lors de la vérification, il est aussi important de regarder par URL, et pas seulement le site entier. La page d'accueil, le profil, les articles individuels, les fichiers image, les PDF, les pages de tags et les archives mensuelles peuvent être enregistrés séparément. Même si vous pensez "le site a disparu", seules des pages individuelles peuvent rester. Vérifiez aussi les pages accessibles depuis d'anciens liens.

Résumé

Des archives comme Wayback Machine peuvent conserver des pages web passées.

Des blogs supprimés, anciens profils, anciens pseudonymes, images et pages d'événements peuvent se relier à l'activité anonyme actuelle s'ils restent.

Ne vous rassurez pas avec les seules demandes de suppression. Il est important de vérifier en partant du principe que les informations passées restent.

Pour protéger l'anonymat, il faut regarder non seulement les publications actuelles, mais aussi les traces des informations publiées dans le passé.

Outils liés

Archive check

Wayback Machine

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://web.archive.org/

Ouvrir le site externe

OSINT directory

OSINT Framework

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://osintframework.com/

Ouvrir le site externe

Learn