Learn

284 artículosCategoría: Todo
Información pasada y eliminación

Sitios de archivo y solicitudes de eliminación

Información que queda en sitios de archivo y solicitudes de eliminación

Aunque se elimine una página web, esa información no siempre desaparece por completo de internet.

Puede quedar en resultados de búsqueda, cachés, republicaciones, capturas de pantalla y sitios de archivo.

Al pensar en anonimato, esto es importante.

Aunque se borren nombre o perfil de la página actual, si una versión pasada quedó guardada, la información antigua puede rastrearse. Antiguos seudónimos, fotos de rostro, perfiles, afiliaciones, historial de actividad y URL pasadas pueden convertirse en entradas que conectan con la actividad anónima actual.

Este artículo explica cómo pensar la información que queda en sitios de archivo, cómo revisarla, cómo avanzar con solicitudes de eliminación o exclusión, y cómo operar cuando no se puede borrar.

Qué es un sitio de archivo

Un sitio de archivo es un servicio que guarda páginas web pasadas para que puedan verse después.

Un ejemplo representativo es , operada por Internet Archive. Wayback Machine es un gran archivo para confirmar cómo se veían páginas web pasadas.

URL : https://web.archive.org/

Wayback Machine ayuda en investigación, periodismo, comprobación documental y referencia a páginas perdidas. Al mismo tiempo, para una persona puede ser un lugar donde queda una página antigua que creía borrada.

Un archivo no es algo malo en sí.

El problema aparece cuando información antigua afecta al anonimato o la seguridad actuales.

Qué queda en un archivoImpacto en anonimato
Perfil antiguoNombre real, región, afiliación, edad aproximada y enlaces se conectan con la actividad actual
Entradas antiguas de blogQuedan estilo, intereses, lugares rutinarios y antiguo seudónimo
Página de empresa, escuela u organizaciónQueda afiliación o historial de actividad
Imágenes y PDFQuedan rostro, información de autor o información de evento
Página eliminadaSe confirma en una versión pasada información que ya no se ve

El archivo puede quedar aunque se borre la página original

Hay un punto que suele malinterpretarse.

Aunque se elimine la página original, las páginas guardadas en un sitio de archivo no siempre se borran automáticamente.

Por ejemplo, imagina que eliminas un perfil antiguo. La URL actual muestra un error 404 y parece que ya no aparece en búsqueda. Pero si esa URL se archivó antes, puede quedar la visualización pasada.

En anonimato, esta "versión pasada" es el problema.

La cuenta anónima actual se parece a un antiguo seudónimo. El contenido publicado se parece al antiguo blog. La región o profesión que quedaba en el perfil se superpone con la comunicación actual. En esos casos, el archivo se convierte en material de correlación.

Al revisar archivos, hay que mirar no solo la página actual, sino también URL usadas en el pasado.

Qué revisar

En una revisión de archivos, primero enumera URL relacionadas contigo.

No basta con buscar nombre real o seudónimos. Revisa también URL de blogs antiguos, páginas de perfil, páginas públicas de redes sociales, páginas de empresas o escuelas, anuncios de eventos, URL de PDF y otras URL directas que conozcas.

Objetivo de revisiónMotivo
URL de blog antiguoConfirmar si quedan artículos o perfiles eliminados
Página de perfil antiguaMirar si quedan nombre, región, enlaces o biografía
Página de empresa, escuela u organizaciónMirar si quedan afiliación, cargo o participación en eventos
URL de archivo de imagenMirar si la imagen quedó guardada aunque se borrara de la página
URL de PDF o materialConfirmar autor, lista de nombres o material distribuido
Resultados de búsqueda de antiguo seudónimoConfirmar si llevan a páginas archivadas

Ten en cuenta que los archivos no son solo por página.

Aunque el HTML se haya borrado, imágenes o PDF pueden estar guardados directamente. Aunque el texto del blog se haya borrado, la página principal o de categoría puede conservar títulos o extractos.

La revisión no termina en una sola vez.

Vuelve a mirar en momentos distintos: antes de empezar actividad anónima, después de cambiar perfiles o después de enviar solicitudes de eliminación.

Cómo pensar solicitudes de eliminación o exclusión

Si quieres eliminar información de un archivo, primero ordena el sitio original.

Si la página original sigue publicada, borrar solo el archivo tiene poco sentido. Considera primero eliminar la página original, hacerla privada, corregir información personal o sustituir PDF.

Después revisa el procedimiento de solicitud de eliminación o exclusión del sitio de archivo.

EtapaQué hacerMotivo
1Confirmar si la página original sigue publicadaSi la fuente queda, se redescubre
2Si puedes gestionar la página, eliminarla o hacerla privadaActuar primero donde tienes control
3Si otra persona administra, pedir corrección o eliminaciónEmpresas, escuelas, organizaciones o sitios ajenos requieren gestión externa
4Ordenar las URL que quedan en el archivoAclarar el objetivo de solicitud
5Solicitar según el procedimiento del sitio de archivoCada servicio tiene métodos distintos

En una solicitud de eliminación pueden pedir URL objetivo, información guardada, motivo del problema y datos que demuestren que eres la persona afectada o administradora.

Pero entregar demasiada información adicional para verificar identidad crea otro riesgo. Revisa el alcance necesario y decide con cuidado qué entregar a qué canal.

Si intervienen derechos legales, difamación, acoso, información de menores, imágenes sexuales o abuso de información personal, considera también consultar a abogadas, abogados o puntos de apoyo.

Diferencia con robots.txt y noindex

Si administras un sitio propio, quizá pienses en controles para motores de búsqueda o crawlers.

Ejemplos representativos son robots.txt y noindex.

Pero no son soluciones universales.

robots.txt es una instrucción para indicar a crawlers qué pueden recorrer. noindex es una instrucción para no aparecer en resultados de búsqueda. Ninguna de las dos borra necesariamente archivos ya guardados ni copias guardadas por terceros.

MecanismoRol principalPunto de atención
robots.txtIndicar a crawlers qué pueden recorrerNo todos obedecen y no borra necesariamente copias pasadas
noindexEvitar aparición en resultados de búsquedaNo borra el contenido de la página
Eliminación de página originalBorrar información pública actualPueden quedar archivos o republicaciones
Solicitud de eliminación de archivoPedir eliminación de páginas guardadasDepende de procedimientos y decisiones del servicio

Estos ajustes técnicos también pertenecen al ámbito de gestión de sitios y motores de búsqueda.

Desde el punto de vista del anonimato, es importante entender que "no aparece en búsqueda" y "la información no existe" son cosas distintas.

Cuando hay archivos que no se pueden borrar

La eliminación de archivos no siempre tiene éxito.

La fuente puede estar en otro servicio, ser difícil verificar identidad, tratarse como información de interés público, estar republicada en varios sitios o haberse difundido como captura de pantalla. En esos casos, borrarlo todo se vuelve difícil.

Aun así, se puede operar para no conectar esa información con la actividad anónima actual.

Información que quedaQué evitar en la actividad anónima actual
Antiguo seudónimoNo usar nombres parecidos, mismas abreviaturas o misma biografía
Región o afiliaciónNo publicar con detalle temas que sugieran la misma región o afiliación
Estilo pasadoNo repetir las mismas terminaciones, frases fijas o expresiones especializadas
Foto de rostro o eventoNo conectarla con imágenes, actividad o relaciones actuales
URL pasadaNo enlazar desde una cuenta nueva a URL antiguas

Si hay información que no se puede borrar, inclúyela en el modelo de amenazas.

Es decir, asume que "esta información puede encontrarse si se busca" y diseña contenido actual, imágenes, horarios y cuentas con esa premisa.

El anonimato no consiste en borrar por completo la información pasada.

Consiste en no aumentar materiales que conecten información pasada y conducta actual.

Resumen

En sitios de archivo pueden quedar páginas eliminadas, perfiles antiguos, imágenes, PDF e información de eventos.

Aunque se borre la página original, archivos, resultados de búsqueda, republicaciones y capturas no desaparecen automáticamente.

Primero revisa URL relacionadas contigo, antiguos seudónimos, perfiles pasados, imágenes y PDF. Después considera en orden eliminación o corrección de la página original, solicitud al administrador del sitio y solicitud de eliminación al sitio de archivo.

Archivos como Wayback Machine son mecanismos socialmente importantes de registro.

Pero para el anonimato individual, la información antigua también puede convertirse en una entrada que conecta con la actividad actual.

Si hay información que no se puede borrar, reconstruye la operación suponiendo que existe. Es importante no conectar antiguo seudónimo, región, afiliación, estilo, imágenes o URL pasadas con la actividad anónima actual.

Herramientas relacionadas

Archive check

Wayback Machine

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://web.archive.org/

Abrir sitio externo
Search result removal

Google Search removal tools

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://support.google.com/websearch/answer/3143948

Abrir sitio externo
OSINT directory

OSINT Framework

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://osintframework.com/

Abrir sitio externo

Artículos relacionados