Sitios de archivo y solicitudes de eliminación
Información que queda en sitios de archivo y solicitudes de eliminación
Aunque se elimine una página web, esa información no siempre desaparece por completo de internet.
Puede quedar en resultados de búsqueda, cachés, republicaciones, capturas de pantalla y sitios de archivo.
Al pensar en anonimato, esto es importante.
Aunque se borren nombre o perfil de la página actual, si una versión pasada quedó guardada, la información antigua puede rastrearse. Antiguos seudónimos, fotos de rostro, perfiles, afiliaciones, historial de actividad y URL pasadas pueden convertirse en entradas que conectan con la actividad anónima actual.
Este artículo explica cómo pensar la información que queda en sitios de archivo, cómo revisarla, cómo avanzar con solicitudes de eliminación o exclusión, y cómo operar cuando no se puede borrar.
Qué es un sitio de archivo
Un sitio de archivo es un servicio que guarda páginas web pasadas para que puedan verse después.
Un ejemplo representativo es , operada por Internet Archive. Wayback Machine es un gran archivo para confirmar cómo se veían páginas web pasadas.
URL : https://web.archive.org/
Wayback Machine ayuda en investigación, periodismo, comprobación documental y referencia a páginas perdidas. Al mismo tiempo, para una persona puede ser un lugar donde queda una página antigua que creía borrada.
Un archivo no es algo malo en sí.
El problema aparece cuando información antigua afecta al anonimato o la seguridad actuales.
| Qué queda en un archivo | Impacto en anonimato |
|---|---|
| Perfil antiguo | Nombre real, región, afiliación, edad aproximada y enlaces se conectan con la actividad actual |
| Entradas antiguas de blog | Quedan estilo, intereses, lugares rutinarios y antiguo seudónimo |
| Página de empresa, escuela u organización | Queda afiliación o historial de actividad |
| Imágenes y PDF | Quedan rostro, información de autor o información de evento |
| Página eliminada | Se confirma en una versión pasada información que ya no se ve |
El archivo puede quedar aunque se borre la página original
Hay un punto que suele malinterpretarse.
Aunque se elimine la página original, las páginas guardadas en un sitio de archivo no siempre se borran automáticamente.
Por ejemplo, imagina que eliminas un perfil antiguo. La URL actual muestra un error 404 y parece que ya no aparece en búsqueda. Pero si esa URL se archivó antes, puede quedar la visualización pasada.
En anonimato, esta "versión pasada" es el problema.
La cuenta anónima actual se parece a un antiguo seudónimo. El contenido publicado se parece al antiguo blog. La región o profesión que quedaba en el perfil se superpone con la comunicación actual. En esos casos, el archivo se convierte en material de correlación.
Al revisar archivos, hay que mirar no solo la página actual, sino también URL usadas en el pasado.
Qué revisar
En una revisión de archivos, primero enumera URL relacionadas contigo.
No basta con buscar nombre real o seudónimos. Revisa también URL de blogs antiguos, páginas de perfil, páginas públicas de redes sociales, páginas de empresas o escuelas, anuncios de eventos, URL de PDF y otras URL directas que conozcas.
| Objetivo de revisión | Motivo |
|---|---|
| URL de blog antiguo | Confirmar si quedan artículos o perfiles eliminados |
| Página de perfil antigua | Mirar si quedan nombre, región, enlaces o biografía |
| Página de empresa, escuela u organización | Mirar si quedan afiliación, cargo o participación en eventos |
| URL de archivo de imagen | Mirar si la imagen quedó guardada aunque se borrara de la página |
| URL de PDF o material | Confirmar autor, lista de nombres o material distribuido |
| Resultados de búsqueda de antiguo seudónimo | Confirmar si llevan a páginas archivadas |
Ten en cuenta que los archivos no son solo por página.
Aunque el HTML se haya borrado, imágenes o PDF pueden estar guardados directamente. Aunque el texto del blog se haya borrado, la página principal o de categoría puede conservar títulos o extractos.
La revisión no termina en una sola vez.
Vuelve a mirar en momentos distintos: antes de empezar actividad anónima, después de cambiar perfiles o después de enviar solicitudes de eliminación.
Cómo pensar solicitudes de eliminación o exclusión
Si quieres eliminar información de un archivo, primero ordena el sitio original.
Si la página original sigue publicada, borrar solo el archivo tiene poco sentido. Considera primero eliminar la página original, hacerla privada, corregir información personal o sustituir PDF.
Después revisa el procedimiento de solicitud de eliminación o exclusión del sitio de archivo.
| Etapa | Qué hacer | Motivo |
|---|---|---|
| 1 | Confirmar si la página original sigue publicada | Si la fuente queda, se redescubre |
| 2 | Si puedes gestionar la página, eliminarla o hacerla privada | Actuar primero donde tienes control |
| 3 | Si otra persona administra, pedir corrección o eliminación | Empresas, escuelas, organizaciones o sitios ajenos requieren gestión externa |
| 4 | Ordenar las URL que quedan en el archivo | Aclarar el objetivo de solicitud |
| 5 | Solicitar según el procedimiento del sitio de archivo | Cada servicio tiene métodos distintos |
En una solicitud de eliminación pueden pedir URL objetivo, información guardada, motivo del problema y datos que demuestren que eres la persona afectada o administradora.
Pero entregar demasiada información adicional para verificar identidad crea otro riesgo. Revisa el alcance necesario y decide con cuidado qué entregar a qué canal.
Si intervienen derechos legales, difamación, acoso, información de menores, imágenes sexuales o abuso de información personal, considera también consultar a abogadas, abogados o puntos de apoyo.
Diferencia con robots.txt y noindex
Si administras un sitio propio, quizá pienses en controles para motores de búsqueda o crawlers.
Ejemplos representativos son robots.txt y noindex.
Pero no son soluciones universales.
robots.txt es una instrucción para indicar a crawlers qué pueden recorrer. noindex es una instrucción para no aparecer en resultados de búsqueda. Ninguna de las dos borra necesariamente archivos ya guardados ni copias guardadas por terceros.
| Mecanismo | Rol principal | Punto de atención |
|---|---|---|
| robots.txt | Indicar a crawlers qué pueden recorrer | No todos obedecen y no borra necesariamente copias pasadas |
| noindex | Evitar aparición en resultados de búsqueda | No borra el contenido de la página |
| Eliminación de página original | Borrar información pública actual | Pueden quedar archivos o republicaciones |
| Solicitud de eliminación de archivo | Pedir eliminación de páginas guardadas | Depende de procedimientos y decisiones del servicio |
Estos ajustes técnicos también pertenecen al ámbito de gestión de sitios y motores de búsqueda.
Desde el punto de vista del anonimato, es importante entender que "no aparece en búsqueda" y "la información no existe" son cosas distintas.
Cuando hay archivos que no se pueden borrar
La eliminación de archivos no siempre tiene éxito.
La fuente puede estar en otro servicio, ser difícil verificar identidad, tratarse como información de interés público, estar republicada en varios sitios o haberse difundido como captura de pantalla. En esos casos, borrarlo todo se vuelve difícil.
Aun así, se puede operar para no conectar esa información con la actividad anónima actual.
| Información que queda | Qué evitar en la actividad anónima actual |
|---|---|
| Antiguo seudónimo | No usar nombres parecidos, mismas abreviaturas o misma biografía |
| Región o afiliación | No publicar con detalle temas que sugieran la misma región o afiliación |
| Estilo pasado | No repetir las mismas terminaciones, frases fijas o expresiones especializadas |
| Foto de rostro o evento | No conectarla con imágenes, actividad o relaciones actuales |
| URL pasada | No enlazar desde una cuenta nueva a URL antiguas |
Si hay información que no se puede borrar, inclúyela en el modelo de amenazas.
Es decir, asume que "esta información puede encontrarse si se busca" y diseña contenido actual, imágenes, horarios y cuentas con esa premisa.
El anonimato no consiste en borrar por completo la información pasada.
Consiste en no aumentar materiales que conecten información pasada y conducta actual.
Resumen
En sitios de archivo pueden quedar páginas eliminadas, perfiles antiguos, imágenes, PDF e información de eventos.
Aunque se borre la página original, archivos, resultados de búsqueda, republicaciones y capturas no desaparecen automáticamente.
Primero revisa URL relacionadas contigo, antiguos seudónimos, perfiles pasados, imágenes y PDF. Después considera en orden eliminación o corrección de la página original, solicitud al administrador del sitio y solicitud de eliminación al sitio de archivo.
Archivos como Wayback Machine son mecanismos socialmente importantes de registro.
Pero para el anonimato individual, la información antigua también puede convertirse en una entrada que conecta con la actividad actual.
Si hay información que no se puede borrar, reconstruye la operación suponiendo que existe. Es importante no conectar antiguo seudónimo, región, afiliación, estilo, imágenes o URL pasadas con la actividad anónima actual.
Herramientas relacionadas
Wayback Machine
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.
URL : https://web.archive.org/
Google Search removal tools
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.
OSINT Framework
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.