Informations qui restent dans les sites d'archive et demandes de suppression
Supprimer une page web ne signifie pas forcément que l'information disparaît complètement d'Internet.
Elle peut rester dans les résultats de recherche, caches, republications, captures d'écran et sites d'archive.
Pour l'anonymat, c'est important.
Même si le nom ou le profil disparaît de la page actuelle, une ancienne page sauvegardée peut permettre de remonter d'anciennes informations. Ancien handle, photo de visage, profil, affiliation, historique d'activité et anciennes URL deviennent des entrées reliant à l'activité anonyme actuelle.
Cet article explique comment penser les informations restant dans les archives, comment vérifier, comment envisager les demandes de suppression ou d'exclusion, et comment agir quand l'information ne peut pas être supprimée.
Qu'est-ce qu'un site d'archive ?
Un site d'archive est un service qui conserve d'anciennes pages web pour permettre leur consultation ultérieure.
Un exemple représentatif est la exploitée par Internet Archive. La Wayback Machine est une grande archive permettant de vérifier comment des pages web apparaissaient par le passé.
URL : https://web.archive.org/
La Wayback Machine est utile pour la recherche, le journalisme, la vérification de documents ou la consultation de pages disparues. Mais pour une personne, elle peut aussi être un endroit où reste une ancienne page que l'on croyait supprimée.
Une archive n'est pas mauvaise en soi.
Le problème apparaît quand une ancienne information affecte l'anonymat ou la sécurité actuels.
| Ce qui reste dans l'archive | Effet sur l'anonymat |
|---|---|
| Ancien profil | Vrai nom, région, affiliation, tranche d'âge et liens se relient à l'activité actuelle |
| Ancien article de blog | Style, intérêts, lieux habituels et ancien handle restent |
| Page d'entreprise, d'école ou d'organisation | Affiliation ou historique d'activité reste |
| Images et PDF | Photo de visage, informations de créateur, informations d'événement restent |
| Page supprimée | Des informations invisibles aujourd'hui sont vérifiées dans une ancienne version |
Supprimer la page d'origine ne supprime pas forcément l'archive
Beaucoup de personnes se trompent sur ce point.
Même si la page d'origine est supprimée, les pages sauvegardées par un site d'archive ne disparaissent pas forcément automatiquement.
Par exemple, supposons qu'une ancienne page de profil soit supprimée. L'URL actuelle affiche une erreur 404 et semble ne plus apparaître en recherche. Pourtant, si cette URL a été archivée auparavant, l'affichage passé peut rester.
Pour l'anonymat, cette « ancienne version » pose problème.
Le compte anonyme actuel ressemble à un ancien handle. Le contenu publié ressemble à un ancien blog. La région ou le métier resté dans le profil se superpose au contenu actuel. Dans ces cas, l'archive devient un matériau de corrélation.
Quand vous vérifiez les archives, regardez non seulement les pages actuelles, mais aussi les anciennes URL que vous avez utilisées.
Que vérifier
Pour vérifier les archives, commencez par lister les URL qui vous concernent.
Chercher votre vrai nom ou handle ne suffit pas. Vérifiez aussi les URL que vous connaissez directement : ancien blog, page de profil, page publique SNS, page de présentation d'entreprise ou d'école, annonce d'événement, URL de PDF.
| Cible à vérifier | Raison |
|---|---|
| URL d'ancien blog | Vérifier si des articles ou profils supprimés restent |
| Ancienne page de profil | Voir si nom, région, liens et présentation restent |
| Page d'entreprise, d'école ou d'organisation | Voir si affiliation, rôle ou participation à un événement restent |
| URL de fichier image | Voir si l'image seule est sauvegardée même supprimée de la page |
| URL de PDF ou document | Vérifier créateur, liste de noms ou documents distribués |
| Résultats de recherche d'ancien handle | Voir si des pages archivées sont accessibles |
Attention : les archives ne sont pas seulement par page.
Même si la page HTML a disparu, les fichiers image ou PDF peuvent être sauvegardés directement. Même si le texte d'un article de blog a disparu, la page d'accueil ou une page de catégorie peut conserver le titre ou l'extrait.
La vérification ne se fait pas une seule fois.
Revoyez à différents moments : avant de commencer une activité anonyme, après un changement de profil, après une demande de suppression.
Penser les demandes de suppression ou d'exclusion
Si vous voulez supprimer des informations d'une archive, commencez par organiser le site d'origine.
Si la page d'origine est encore publique, supprimer seulement l'archive a peu de sens. Envisagez d'abord suppression, passage en privé, correction des informations personnelles ou remplacement de PDF côté site d'origine.
Ensuite, vérifiez les procédures de suppression ou d'exclusion du site d'archive.
| Étape | Action | Raison |
|---|---|---|
| 1 | Vérifier si la page d'origine est encore publique | Si l'information source reste, elle sera retrouvée |
| 2 | Si vous gérez la page, supprimer ou rendre privée | Traiter d'abord les lieux où vous avez les droits |
| 3 | Si un autre administrateur existe, demander correction ou suppression | Entreprise, école, organisation ou site tiers demandent une réponse du gestionnaire |
| 4 | Organiser les URL restant dans l'archive | Clarifier les cibles de demande |
| 5 | Demander selon la procédure du site d'archive | Chaque service a sa propre méthode |
Une demande de suppression peut exiger l'URL cible, les informations sauvegardées, la raison du problème et des informations montrant que vous êtes la personne ou le gestionnaire.
Mais fournir trop d'informations supplémentaires pour vérifier l'identité crée un autre risque. Vérifiez la portée nécessaire et jugez prudemment quelles informations donner à quel guichet.
Si des droits juridiques, diffamation, harcèlement, informations de mineur, images sexuelles ou abus d'informations personnelles sont en jeu, envisagez aussi de consulter un avocat ou un guichet de soutien.
Différence avec robots.txt et noindex
Si vous gérez votre propre site, vous pouvez penser aux contrôles pour moteurs de recherche et robots.
Les mécanismes représentatifs sont robots.txt et noindex.
Mais ils ne sont pas universels.
robots.txt indique aux robots quelle zone ils peuvent explorer. noindex indique de ne pas afficher une page dans les résultats de recherche. Aucun des deux ne supprime forcément une archive déjà sauvegardée ou une copie conservée par un tiers.
| Mécanisme | Rôle principal | Attention |
|---|---|---|
| robots.txt | Indique aux robots les zones à explorer | Tous les acteurs ne le respectent pas et cela ne supprime pas forcément les anciennes sauvegardes |
| noindex | Évite l'affichage dans les résultats de recherche | Ne supprime pas le contenu de la page |
| Suppression de la page d'origine | Supprime l'information actuellement publique | Archives et republications peuvent rester |
| Demande de suppression d'archive | Demande la suppression d'une page sauvegardée | Dépend de la procédure et du jugement du service |
Ces réglages relèvent aussi du référencement et de l'administration de site.
Pour l'anonymat, il est important de comprendre que « ne pas apparaître en recherche » et « l'information n'existe pas » sont deux choses différentes.
Quand une archive ne peut pas être supprimée
La suppression d'archive ne réussit pas toujours.
La source est un autre service, la vérification d'identité est difficile, l'information est traitée comme ayant une valeur publique, plusieurs republications existent, des captures d'écran se sont diffusées. Dans ces cas, tout supprimer devient difficile.
Même alors, il est possible de ne pas relier l'archive à l'activité anonyme actuelle.
| Information restante | À éviter dans l'activité anonyme actuelle |
|---|---|
| Ancien handle | Ne pas utiliser de nom proche, même abréviation ou même texte de profil |
| Région ou affiliation | Ne pas publier de sujets détaillés suggérant la même région ou affiliation |
| Ancien style | Ne pas répéter les mêmes finales, formules ou tournures spécialisées |
| Photo de visage ou d'événement | Ne pas relier aux images, activités ou relations actuelles |
| Ancienne URL | Ne pas créer de lien vers les anciennes URL depuis les nouveaux comptes |
Si une information ne peut pas être supprimée, intégrez-la au modèle de menace.
Autrement dit, supposez que « cette information peut être trouvée si quelqu'un cherche », puis concevez le contenu actuel, les images, le timing et les comptes autour de cette hypothèse.
L'anonymat ne consiste pas à effacer complètement les informations passées.
Il consiste à ne pas augmenter les matériaux qui relient ces informations au comportement actuel.
Résumé
Les sites d'archive peuvent conserver des pages supprimées, anciens profils, images, PDF et informations d'événement.
Même si la page d'origine est supprimée, archives, résultats de recherche, republications et captures d'écran ne disparaissent pas automatiquement.
Vérifiez d'abord les URL qui vous concernent, anciens handles, anciens profils, images et PDF. Ensuite, envisagez dans l'ordre suppression ou correction de la page d'origine, demande au gestionnaire du site, puis demande de suppression au site d'archive.
Des archives comme la Wayback Machine sont socialement des mécanismes de mémoire importants.
Mais pour l'anonymat individuel, les anciennes informations deviennent aussi une entrée vers l'activité actuelle.
Si une information ne peut pas être supprimée, reconstruisez la pratique en le supposant. Il est important de ne pas relier anciens handles, régions, affiliations, style, images et anciennes URL à l'activité anonyme actuelle.
Outils liés
Wayback Machine
Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.
Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.
URL : https://web.archive.org/
Google Search removal tools
Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.
Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.
OSINT Framework
Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.
Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.