Informações que ficam em sites de arquivo e pedidos de remoção
Mesmo removendo uma página Web, a informação não necessariamente desaparece completamente da Internet.
Ela pode permanecer em resultados de busca, cache, republicações, capturas de tela e sites de arquivo.
Ao pensar em anonimato, isso é importante.
Mesmo removendo nome ou perfil da página atual, se uma página antiga estiver salva, informações antigas podem ser encontradas. Handles antigos, fotos de rosto, perfis, afiliações, histórico de atividade e URLs antigas viram entradas que conectam atividade anônima atual.
Este artigo explica como pensar informações em sites de arquivo, como confirmar, como avançar com pedidos de remoção ou exclusão, e como operar quando não é possível apagar.
O que são sites de arquivo
Sites de arquivo são serviços que salvam páginas Web antigas e permitem vê-las depois.
Um exemplo representativo é a , operada pelo Internet Archive. A Wayback Machine é um grande arquivo para confirmar como páginas Web apareciam no passado.
URL : https://web.archive.org/
A Wayback Machine é útil para pesquisa, jornalismo, confirmação de materiais e referência a páginas perdidas. Por outro lado, para indivíduos, também pode ser um lugar onde páginas antigas que pareciam removidas continuam.
Arquivos não são algo ruim.
O problema é quando informações antigas afetam o anonimato ou a segurança atuais.
| O que fica no arquivo | Impacto sobre o anonimato |
|---|---|
| Perfil antigo | Nome real, região, afiliação, faixa etária e links se conectam à atividade atual |
| Postagens antigas de blog | Estilo, interesses, lugares de rotina e handle antigo permanecem |
| Página de empresa, escola ou organização | Afiliação e histórico de atividade permanecem |
| Imagens e PDFs | Foto de rosto, informações de autor e evento permanecem |
| Página removida | Informações hoje invisíveis são vistas em versão antiga |
Mesmo apagando a página original, o arquivo pode permanecer
Há um ponto fácil de entender errado.
Apagar a página original não significa que páginas salvas em sites de arquivo desapareçam automaticamente.
Por exemplo, imagine apagar uma página de perfil antiga. Ao abrir a URL atual, aparece erro 404, e parece que ela também sumiu das buscas. Mas, se aquela URL foi arquivada antes, a exibição antiga pode permanecer.
No anonimato, essa "versão antiga" é o problema.
A conta anônima atual parece com um handle antigo. O conteúdo publicado parece com o antigo blog. A região ou profissão que ficou no perfil antigo se sobrepõe à comunicação atual. Nesses casos, o arquivo vira material de correlação.
Ao verificar arquivos, é preciso olhar não só a página atual, mas também URLs usadas no passado.
O que verificar
Na verificação de arquivos, primeiro levante URLs relacionadas a você.
Buscar apenas nome real ou handle não basta. Confirme também URLs conhecidas diretamente, como blog antigo, página de perfil, página pública de SNS, página de apresentação em empresa ou escola, anúncio de evento e URL de PDF.
| Alvo de verificação | Motivo para olhar |
|---|---|
| URL de blog antigo | Confirmar se artigos ou perfil removidos permanecem |
| Página de perfil antiga | Ver se nome, região, links e bio permanecem |
| Página de empresa, escola ou organização | Ver se afiliação, cargo ou participação em evento permanecem |
| URL de arquivo de imagem | Ver se a imagem isolada foi salva mesmo depois de sair da página |
| URL de PDF ou material | Confirmar autor, lista de nomes e material distribuído |
| Resultados de busca do handle antigo | Confirmar se levam a páginas arquivadas |
O ponto de atenção é que arquivos não são apenas por página.
Mesmo que o HTML tenha desaparecido, imagens e PDFs podem estar salvos diretamente. Mesmo que o texto de um blog tenha sumido, a página inicial ou uma página de categoria pode manter título e trecho.
A verificação não termina uma vez.
Revise em momentos diferentes, como antes de iniciar atividade anônima, depois de mudar perfil e depois de enviar pedido de remoção.
Como pensar pedidos de remoção ou exclusão
Se quiser remover informações que ficaram em arquivo, organize primeiro o lado do site original.
Se a página original ainda está pública, remover apenas do arquivo tem pouco efeito. Considere primeiro apagar a página original, torná-la privada, corrigir informações pessoais ou substituir PDFs.
Depois, confirme procedimentos de remoção ou exclusão do site de arquivo.
| Etapa | O que fazer | Motivo |
|---|---|---|
| 1 | Confirmar se a página original ainda está pública | Se a informação original permanece, pode ser reencontrada |
| 2 | Se você gerencia a página, remover ou tornar privada | Começar pelo lugar onde há permissão de gestão |
| 3 | Se outra pessoa gerencia, pedir correção ou remoção | Empresas, escolas, organizações e sites de outras pessoas dependem do administrador |
| 4 | Organizar URLs que permanecem no arquivo | Deixar claro o alvo do pedido |
| 5 | Solicitar conforme o procedimento do site de arquivo | Cada serviço tem método diferente |
Pedidos de remoção podem exigir URL alvo, informação salva, motivo do problema e informações que mostrem que você é a pessoa ou administrador.
Mas entregar informações demais para comprovar identidade cria outro risco. Confirme o necessário e decida com cuidado que informação entregar a qual canal.
Quando houver direitos legais, difamação, assédio, informações de menores, imagens sexuais ou abuso de informações pessoais, considere também consultar advogado ou canal de apoio.
Diferença em relação a robots.txt e noindex
Se você gerencia um site, pode pensar em controles para mecanismos de busca e crawlers.
Exemplos representativos são robots.txt e noindex.
Mas eles não são soluções universais.
robots.txt é uma instrução que informa a crawlers quais áreas podem rastrear. noindex é uma instrução para evitar aparecer em resultados de busca. Nenhum dos dois é um mecanismo que necessariamente apaga arquivos já salvos ou cópias salvas por terceiros.
| Mecanismo | Papel principal | Ponto de atenção |
|---|---|---|
| robots.txt | Informar a crawlers que áreas podem rastrear | Nem todos obedecem, e não apaga necessariamente o que foi salvo antes |
| noindex | Evitar inclusão em resultados de busca | Não apaga o conteúdo da página |
| Remoção da página original | Apagar informação pública atual | Arquivos e republicações podem permanecer |
| Pedido de remoção do arquivo | Pedir remoção de página salva | Depende do procedimento e julgamento do serviço |
Essas configurações técnicas pertencem também ao campo de gestão de sites e mecanismos de busca.
Do ponto de vista do anonimato, é importante entender que "não aparecer em buscas" e "a informação não existir" são coisas diferentes.
Quando há arquivo que não pode ser removido
Remoção de arquivo nem sempre dá certo.
A fonte salva pode ser outro serviço, a comprovação de identidade pode ser difícil, a informação pode ser tratada como de interesse público, há várias republicações ou capturas de tela se espalharam. Nesses casos, remover tudo fica difícil.
Mesmo assim, é possível operar sem conectar isso à atividade anônima atual.
| Informação que permanece | O que evitar na atividade anônima atual |
|---|---|
| Handle antigo | Não usar nome parecido, mesma abreviação ou mesmo texto de perfil |
| Região ou afiliação | Não publicar detalhes que permitam inferir a mesma região ou afiliação |
| Estilo antigo | Não repetir mesmos finais, frases fixas ou expressões especializadas |
| Foto de rosto ou evento | Não conectar a imagens, atividade ou relações atuais |
| URL antiga | Não linkar para URL antiga a partir da nova conta |
Se há informação que não pode ser apagada, inclua-a no modelo de ameaça.
Ou seja, pressuponha que "esta informação pode ser encontrada se alguém procurar" e pense conteúdo atual, imagens, tempo e desenho de conta com isso em mente.
Anonimato não é apagar completamente informações passadas.
É não aumentar materiais que conectem informações passadas às ações atuais.
Resumo
Sites de arquivo podem manter páginas removidas, perfis antigos, imagens, PDFs e informações de eventos.
Mesmo apagando a página original, arquivos, resultados de busca, republicações e capturas de tela não desaparecem automaticamente.
Primeiro confirme URLs relacionadas a você, handles antigos, perfis passados, imagens e PDFs. Depois, considere em ordem a remoção ou correção da página original, pedido ao administrador do site e pedido de remoção ao site de arquivo.
Arquivos como a Wayback Machine são mecanismos socialmente importantes de registro.
Mas, para o anonimato individual, informações antigas também podem virar entrada que conecta a atividade atual.
Quando há informação que não pode ser apagada, refaça a operação levando isso em conta. É importante não conectar handle antigo, região, afiliação, estilo, imagens e URLs antigas à atividade anônima atual.
Ferramentas relacionadas
Wayback Machine
Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.
Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.
URL : https://web.archive.org/
Google Search removal tools
Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.
Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.
OSINT Framework
Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.
Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.