Learn

266 articlesCatégorie : Tous
Anciennes informations et suppression

Informations qui restent dans les sites d'archive et demandes de suppression

Supprimer une page web ne signifie pas forcément que l'information disparaît complètement d'Internet.

Elle peut rester dans les résultats de recherche, caches, republications, captures d'écran et sites d'archive.

Pour l'anonymat, c'est important.

Même si le nom ou le profil disparaît de la page actuelle, une ancienne page sauvegardée peut permettre de remonter d'anciennes informations. Ancien handle, photo de visage, profil, affiliation, historique d'activité et anciennes URL deviennent des entrées reliant à l'activité anonyme actuelle.

Cet article explique comment penser les informations restant dans les archives, comment vérifier, comment envisager les demandes de suppression ou d'exclusion, et comment agir quand l'information ne peut pas être supprimée.

Qu'est-ce qu'un site d'archive ?

Un site d'archive est un service qui conserve d'anciennes pages web pour permettre leur consultation ultérieure.

Un exemple représentatif est la exploitée par Internet Archive. La Wayback Machine est une grande archive permettant de vérifier comment des pages web apparaissaient par le passé.

URL : https://web.archive.org/

La Wayback Machine est utile pour la recherche, le journalisme, la vérification de documents ou la consultation de pages disparues. Mais pour une personne, elle peut aussi être un endroit où reste une ancienne page que l'on croyait supprimée.

Une archive n'est pas mauvaise en soi.

Le problème apparaît quand une ancienne information affecte l'anonymat ou la sécurité actuels.

Ce qui reste dans l'archiveEffet sur l'anonymat
Ancien profilVrai nom, région, affiliation, tranche d'âge et liens se relient à l'activité actuelle
Ancien article de blogStyle, intérêts, lieux habituels et ancien handle restent
Page d'entreprise, d'école ou d'organisationAffiliation ou historique d'activité reste
Images et PDFPhoto de visage, informations de créateur, informations d'événement restent
Page suppriméeDes informations invisibles aujourd'hui sont vérifiées dans une ancienne version

Supprimer la page d'origine ne supprime pas forcément l'archive

Beaucoup de personnes se trompent sur ce point.

Même si la page d'origine est supprimée, les pages sauvegardées par un site d'archive ne disparaissent pas forcément automatiquement.

Par exemple, supposons qu'une ancienne page de profil soit supprimée. L'URL actuelle affiche une erreur 404 et semble ne plus apparaître en recherche. Pourtant, si cette URL a été archivée auparavant, l'affichage passé peut rester.

Pour l'anonymat, cette « ancienne version » pose problème.

Le compte anonyme actuel ressemble à un ancien handle. Le contenu publié ressemble à un ancien blog. La région ou le métier resté dans le profil se superpose au contenu actuel. Dans ces cas, l'archive devient un matériau de corrélation.

Quand vous vérifiez les archives, regardez non seulement les pages actuelles, mais aussi les anciennes URL que vous avez utilisées.

Que vérifier

Pour vérifier les archives, commencez par lister les URL qui vous concernent.

Chercher votre vrai nom ou handle ne suffit pas. Vérifiez aussi les URL que vous connaissez directement : ancien blog, page de profil, page publique SNS, page de présentation d'entreprise ou d'école, annonce d'événement, URL de PDF.

Cible à vérifierRaison
URL d'ancien blogVérifier si des articles ou profils supprimés restent
Ancienne page de profilVoir si nom, région, liens et présentation restent
Page d'entreprise, d'école ou d'organisationVoir si affiliation, rôle ou participation à un événement restent
URL de fichier imageVoir si l'image seule est sauvegardée même supprimée de la page
URL de PDF ou documentVérifier créateur, liste de noms ou documents distribués
Résultats de recherche d'ancien handleVoir si des pages archivées sont accessibles

Attention : les archives ne sont pas seulement par page.

Même si la page HTML a disparu, les fichiers image ou PDF peuvent être sauvegardés directement. Même si le texte d'un article de blog a disparu, la page d'accueil ou une page de catégorie peut conserver le titre ou l'extrait.

La vérification ne se fait pas une seule fois.

Revoyez à différents moments : avant de commencer une activité anonyme, après un changement de profil, après une demande de suppression.

Penser les demandes de suppression ou d'exclusion

Si vous voulez supprimer des informations d'une archive, commencez par organiser le site d'origine.

Si la page d'origine est encore publique, supprimer seulement l'archive a peu de sens. Envisagez d'abord suppression, passage en privé, correction des informations personnelles ou remplacement de PDF côté site d'origine.

Ensuite, vérifiez les procédures de suppression ou d'exclusion du site d'archive.

ÉtapeActionRaison
1Vérifier si la page d'origine est encore publiqueSi l'information source reste, elle sera retrouvée
2Si vous gérez la page, supprimer ou rendre privéeTraiter d'abord les lieux où vous avez les droits
3Si un autre administrateur existe, demander correction ou suppressionEntreprise, école, organisation ou site tiers demandent une réponse du gestionnaire
4Organiser les URL restant dans l'archiveClarifier les cibles de demande
5Demander selon la procédure du site d'archiveChaque service a sa propre méthode

Une demande de suppression peut exiger l'URL cible, les informations sauvegardées, la raison du problème et des informations montrant que vous êtes la personne ou le gestionnaire.

Mais fournir trop d'informations supplémentaires pour vérifier l'identité crée un autre risque. Vérifiez la portée nécessaire et jugez prudemment quelles informations donner à quel guichet.

Si des droits juridiques, diffamation, harcèlement, informations de mineur, images sexuelles ou abus d'informations personnelles sont en jeu, envisagez aussi de consulter un avocat ou un guichet de soutien.

Différence avec robots.txt et noindex

Si vous gérez votre propre site, vous pouvez penser aux contrôles pour moteurs de recherche et robots.

Les mécanismes représentatifs sont robots.txt et noindex.

Mais ils ne sont pas universels.

robots.txt indique aux robots quelle zone ils peuvent explorer. noindex indique de ne pas afficher une page dans les résultats de recherche. Aucun des deux ne supprime forcément une archive déjà sauvegardée ou une copie conservée par un tiers.

MécanismeRôle principalAttention
robots.txtIndique aux robots les zones à explorerTous les acteurs ne le respectent pas et cela ne supprime pas forcément les anciennes sauvegardes
noindexÉvite l'affichage dans les résultats de rechercheNe supprime pas le contenu de la page
Suppression de la page d'origineSupprime l'information actuellement publiqueArchives et republications peuvent rester
Demande de suppression d'archiveDemande la suppression d'une page sauvegardéeDépend de la procédure et du jugement du service

Ces réglages relèvent aussi du référencement et de l'administration de site.

Pour l'anonymat, il est important de comprendre que « ne pas apparaître en recherche » et « l'information n'existe pas » sont deux choses différentes.

Quand une archive ne peut pas être supprimée

La suppression d'archive ne réussit pas toujours.

La source est un autre service, la vérification d'identité est difficile, l'information est traitée comme ayant une valeur publique, plusieurs republications existent, des captures d'écran se sont diffusées. Dans ces cas, tout supprimer devient difficile.

Même alors, il est possible de ne pas relier l'archive à l'activité anonyme actuelle.

Information restanteÀ éviter dans l'activité anonyme actuelle
Ancien handleNe pas utiliser de nom proche, même abréviation ou même texte de profil
Région ou affiliationNe pas publier de sujets détaillés suggérant la même région ou affiliation
Ancien styleNe pas répéter les mêmes finales, formules ou tournures spécialisées
Photo de visage ou d'événementNe pas relier aux images, activités ou relations actuelles
Ancienne URLNe pas créer de lien vers les anciennes URL depuis les nouveaux comptes

Si une information ne peut pas être supprimée, intégrez-la au modèle de menace.

Autrement dit, supposez que « cette information peut être trouvée si quelqu'un cherche », puis concevez le contenu actuel, les images, le timing et les comptes autour de cette hypothèse.

L'anonymat ne consiste pas à effacer complètement les informations passées.

Il consiste à ne pas augmenter les matériaux qui relient ces informations au comportement actuel.

Résumé

Les sites d'archive peuvent conserver des pages supprimées, anciens profils, images, PDF et informations d'événement.

Même si la page d'origine est supprimée, archives, résultats de recherche, republications et captures d'écran ne disparaissent pas automatiquement.

Vérifiez d'abord les URL qui vous concernent, anciens handles, anciens profils, images et PDF. Ensuite, envisagez dans l'ordre suppression ou correction de la page d'origine, demande au gestionnaire du site, puis demande de suppression au site d'archive.

Des archives comme la Wayback Machine sont socialement des mécanismes de mémoire importants.

Mais pour l'anonymat individuel, les anciennes informations deviennent aussi une entrée vers l'activité actuelle.

Si une information ne peut pas être supprimée, reconstruisez la pratique en le supposant. Il est important de ne pas relier anciens handles, régions, affiliations, style, images et anciennes URL à l'activité anonyme actuelle.

Outils liés

Archive check

Wayback Machine

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://web.archive.org/

Ouvrir le site externe
Search result removal

Google Search removal tools

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://support.google.com/websearch/answer/3143948

Ouvrir le site externe
OSINT directory

OSINT Framework

Ressource externe liée à cet article. Ouvrez-la seulement si elle correspond à votre situation et à votre modèle de menace.

Pourquoi il est listé ici: Elle peut aider sur le sujet de l’article, mais elle se situe hors d’Anonymity Sense et doit être vérifiée avant usage.

URL : https://osintframework.com/

Ouvrir le site externe

Articles liés