Informations qui restent dans les sites d'archive et demandes de suppression

Anciennes informations et suppression

Informations qui restent dans les sites d'archive et demandes de suppression

Supprimer une page web ne signifie pas forcément que l'information disparaît complètement d'Internet.

Elle peut rester dans les résultats de recherche, caches, republications, captures d'écran et sites d'archive.

Pour l'anonymat, c'est important.

Même si le nom ou le profil disparaît de la page actuelle, une ancienne page sauvegardée peut permettre de remonter d'anciennes informations. Ancien handle, photo de visage, profil, affiliation, historique d'activité et anciennes URL deviennent des entrées reliant à l'activité anonyme actuelle.

Cet article explique comment penser les informations restant dans les archives, comment vérifier, comment envisager les demandes de suppression ou d'exclusion, et comment agir quand l'information ne peut pas être supprimée.

Qu'est-ce qu'un site d'archive ?

Un site d'archive est un service qui conserve d'anciennes pages web pour permettre leur consultation ultérieure.

Un exemple représentatif est la exploitée par Internet Archive. La Wayback Machine est une grande archive permettant de vérifier comment des pages web apparaissaient par le passé.

URL : https://web.archive.org/

La Wayback Machine est utile pour la recherche, le journalisme, la vérification de documents ou la consultation de pages disparues. Mais pour une personne, elle peut aussi être un endroit où reste une ancienne page que l'on croyait supprimée.

Une archive n'est pas mauvaise en soi.

Le problème apparaît quand une ancienne information affecte l'anonymat ou la sécurité actuels.

Ce qui reste dans l'archive	Effet sur l'anonymat
Ancien profil	Vrai nom, région, affiliation, tranche d'âge et liens se relient à l'activité actuelle
Ancien article de blog	Style, intérêts, lieux habituels et ancien handle restent
Page d'entreprise, d'école ou d'organisation	Affiliation ou historique d'activité reste
Images et PDF	Photo de visage, informations de créateur, informations d'événement restent
Page supprimée	Des informations invisibles aujourd'hui sont vérifiées dans une ancienne version

Supprimer la page d'origine ne supprime pas forcément l'archive

Beaucoup de personnes se trompent sur ce point.

Même si la page d'origine est supprimée, les pages sauvegardées par un site d'archive ne disparaissent pas forcément automatiquement.

Par exemple, supposons qu'une ancienne page de profil soit supprimée. L'URL actuelle affiche une erreur 404 et semble ne plus apparaître en recherche. Pourtant, si cette URL a été archivée auparavant, l'affichage passé peut rester.

Pour l'anonymat, cette « ancienne version » pose problème.

Le compte anonyme actuel ressemble à un ancien handle. Le contenu publié ressemble à un ancien blog. La région ou le métier resté dans le profil se superpose au contenu actuel. Dans ces cas, l'archive devient un matériau de corrélation.

Quand vous vérifiez les archives, regardez non seulement les pages actuelles, mais aussi les anciennes URL que vous avez utilisées.

Que vérifier

Pour vérifier les archives, commencez par lister les URL qui vous concernent.

Chercher votre vrai nom ou handle ne suffit pas. Vérifiez aussi les URL que vous connaissez directement : ancien blog, page de profil, page publique SNS, page de présentation d'entreprise ou d'école, annonce d'événement, URL de PDF.

Cible à vérifier	Raison
URL d'ancien blog	Vérifier si des articles ou profils supprimés restent
Ancienne page de profil	Voir si nom, région, liens et présentation restent
Page d'entreprise, d'école ou d'organisation	Voir si affiliation, rôle ou participation à un événement restent
URL de fichier image	Voir si l'image seule est sauvegardée même supprimée de la page
URL de PDF ou document	Vérifier créateur, liste de noms ou documents distribués
Résultats de recherche d'ancien handle	Voir si des pages archivées sont accessibles

Attention : les archives ne sont pas seulement par page.

Même si la page HTML a disparu, les fichiers image ou PDF peuvent être sauvegardés directement. Même si le texte d'un article de blog a disparu, la page d'accueil ou une page de catégorie peut conserver le titre ou l'extrait.

La vérification ne se fait pas une seule fois.

Revoyez à différents moments : avant de commencer une activité anonyme, après un changement de profil, après une demande de suppression.

Penser les demandes de suppression ou d'exclusion

Si vous voulez supprimer des informations d'une archive, commencez par organiser le site d'origine.

Si la page d'origine est encore publique, supprimer seulement l'archive a peu de sens. Envisagez d'abord suppression, passage en privé, correction des informations personnelles ou remplacement de PDF côté site d'origine.

Ensuite, vérifiez les procédures de suppression ou d'exclusion du site d'archive.

Étape	Action	Raison
1	Vérifier si la page d'origine est encore publique	Si l'information source reste, elle sera retrouvée
2	Si vous gérez la page, supprimer ou rendre privée	Traiter d'abord les lieux où vous avez les droits
3	Si un autre administrateur existe, demander correction ou suppression	Entreprise, école, organisation ou site tiers demandent une réponse du gestionnaire
4	Organiser les URL restant dans l'archive	Clarifier les cibles de demande
5	Demander selon la procédure du site d'archive	Chaque service a sa propre méthode

Une demande de suppression peut exiger l'URL cible, les informations sauvegardées, la raison du problème et des informations montrant que vous êtes la personne ou le gestionnaire.

Mais fournir trop d'informations supplémentaires pour vérifier l'identité crée un autre risque. Vérifiez la portée nécessaire et jugez prudemment quelles informations donner à quel guichet.

Si des droits juridiques, diffamation, harcèlement, informations de mineur, images sexuelles ou abus d'informations personnelles sont en jeu, envisagez aussi de consulter un avocat ou un guichet de soutien.

Différence avec `robots.txt` et `noindex`

Si vous gérez votre propre site, vous pouvez penser aux contrôles pour moteurs de recherche et robots.

Les mécanismes représentatifs sont robots.txt et noindex.

Mais ils ne sont pas universels.

robots.txt indique aux robots quelle zone ils peuvent explorer. noindex indique de ne pas afficher une page dans les résultats de recherche. Aucun des deux ne supprime forcément une archive déjà sauvegardée ou une copie conservée par un tiers.

Mécanisme	Rôle principal	Attention
robots.txt	Indique aux robots les zones à explorer	Tous les acteurs ne le respectent pas et cela ne supprime pas forcément les anciennes sauvegardes
noindex	Évite l'affichage dans les résultats de recherche	Ne supprime pas le contenu de la page
Suppression de la page d'origine	Supprime l'information actuellement publique	Archives et republications peuvent rester
Demande de suppression d'archive	Demande la suppression d'une page sauvegardée	Dépend de la procédure et du jugement du service

Ces réglages relèvent aussi du référencement et de l'administration de site.

Pour l'anonymat, il est important de comprendre que « ne pas apparaître en recherche » et « l'information n'existe pas » sont deux choses différentes.

Quand une archive ne peut pas être supprimée

La suppression d'archive ne réussit pas toujours.

La source est un autre service, la vérification d'identité est difficile, l'information est traitée comme ayant une valeur publique, plusieurs republications existent, des captures d'écran se sont diffusées. Dans ces cas, tout supprimer devient difficile.

Même alors, il est possible de ne pas relier l'archive à l'activité anonyme actuelle.

Information restante	À éviter dans l'activité anonyme actuelle
Ancien handle	Ne pas utiliser de nom proche, même abréviation ou même texte de profil
Région ou affiliation	Ne pas publier de sujets détaillés suggérant la même région ou affiliation
Ancien style	Ne pas répéter les mêmes finales, formules ou tournures spécialisées
Photo de visage ou d'événement	Ne pas relier aux images, activités ou relations actuelles
Ancienne URL	Ne pas créer de lien vers les anciennes URL depuis les nouveaux comptes

Si une information ne peut pas être supprimée, intégrez-la au modèle de menace.

Autrement dit, supposez que « cette information peut être trouvée si quelqu'un cherche », puis concevez le contenu actuel, les images, le timing et les comptes autour de cette hypothèse.

L'anonymat ne consiste pas à effacer complètement les informations passées.

Il consiste à ne pas augmenter les matériaux qui relient ces informations au comportement actuel.

Résumé

Les sites d'archive peuvent conserver des pages supprimées, anciens profils, images, PDF et informations d'événement.

Même si la page d'origine est supprimée, archives, résultats de recherche, republications et captures d'écran ne disparaissent pas automatiquement.

Vérifiez d'abord les URL qui vous concernent, anciens handles, anciens profils, images et PDF. Ensuite, envisagez dans l'ordre suppression ou correction de la page d'origine, demande au gestionnaire du site, puis demande de suppression au site d'archive.

Des archives comme la Wayback Machine sont socialement des mécanismes de mémoire importants.

Mais pour l'anonymat individuel, les anciennes informations deviennent aussi une entrée vers l'activité actuelle.

Si une information ne peut pas être supprimée, reconstruisez la pratique en le supposant. Il est important de ne pas relier anciens handles, régions, affiliations, style, images et anciennes URL à l'activité anonyme actuelle.

Outils liés

Archive check

Wayback Machine

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://web.archive.org/

Ouvrir le site externe

Search result removal

Google Search removal tools

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://support.google.com/websearch/answer/3143948

Ouvrir le site externe

OSINT directory

OSINT Framework

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://osintframework.com/

Ouvrir le site externe

Learn