Riesgos de metadatos en PDF
Los PDF se usan a menudo como materiales públicos o de envío.
Pero un PDF no se puede juzgar solo por su apariencia. Aunque el texto no incluya nombres, dentro del archivo pueden quedar nombre de autor, software de creación, fecha de creación, anotaciones, archivos incrustados e información de formulario.
En anonimato, no solo el contenido del PDF, sino también el entorno en que se creó y el historial de edición se vuelven pistas.
Este artículo organiza la información que suele quedar en PDF y los puntos de revisión antes de publicar.
Información que queda en PDF
Un PDF puede incluir información distinta del documento en sí.
| Información | Qué indica | Riesgo para el anonimato |
|---|---|---|
| Autor | Nombre de usuario del OS o del software documental | Aparecen nombre personal u organización |
| Fecha de creación | Cuándo se creó | Se conecta con hora de actividad o periodo de creación |
| Software de creación | Word, LibreOffice, escáner, etc. | Da pistas del entorno de trabajo |
| Título | Nombre del documento original o caso | Queda un nombre interno |
| Anotaciones | Comentarios o notas de edición | Aparecen personas relacionadas o proceso de decisión |
| Archivos incrustados | Materiales originales o datos adjuntos | Se mezcla información innecesaria |
Un PDF parece una "versión final".
Sin embargo, dentro puede quedar información del proceso de creación.
Fallos de tachado
Algo especialmente peligroso en PDF son los fallos de tachado.
Aunque visualmente parezca oculto con un rectángulo negro, puede quedar información textual interna. El texto original puede extraerse copiando, buscando o quitando capas.
| Procesamiento común | Problema | Forma de acercarse a algo más seguro |
|---|---|---|
| Superponer una figura negra | El texto original queda dentro | Usar una función dedicada de redacción |
| Solo convertir en captura | Cuidado con calidad e información oculta | Revisar de nuevo el alcance necesario |
| Ocultar con anotación | La anotación puede quitarse | Copiar y buscar después de exportar |
| Eliminar páginas | Pueden quedar incrustados o historial | Regenerar como archivo separado |
| Borrar partes manualmente | Se producen omisiones | Usar una lista de revisión |
En materiales de alto riesgo, es más seguro no juzgar un tachado con una sola mirada.
En contextos legales, periodísticos o de denuncia de irregularidades, puede hacer falta revisión de especialistas o puntos de consulta confiables.
Separar apariencia e interior del PDF
Al revisar un PDF, separa apariencia e información interna.
En la apariencia hay texto, imágenes, tablas, códigos QR, números de página, fondos y marcas de agua. En el interior hay metadatos, anotaciones, archivos incrustados, formularios y enlaces.
| Lugar de revisión | Información que se mira | Razón |
|---|---|---|
| Apariencia | Texto, imágenes, tablas, fondo | Revisar información personal directa |
| Enlaces | URL, destino compartido, tracking | Evitar ID personales o URL internas |
| Metadatos | Autor, software de creación | No revelar el entorno de trabajo |
| Anotaciones | Comentarios, revisión | No dejar conversaciones internas |
| Incrustados | Adjuntos, formularios | No incluir datos innecesarios |
Un PDF parece un impreso.
Pero en realidad es un archivo digital con estructura interna.
Procedimiento de revisión
Antes de publicar un PDF, lo básico es no publicar directamente el archivo original.
Crea una copia de publicación y deja solo la información necesaria.
| Paso | Qué revisar |
|---|---|
| 1 | Crear una copia de publicación en vez de usar el archivo original |
| 2 | Mirar si el nombre de archivo contiene nombre real, caso u organización |
| 3 | Revisar propiedades del documento |
| 4 | Revisar anotaciones, comentarios, formularios e incrustados |
| 5 | Comprobar si las partes tachadas pueden copiarse o buscarse |
| 6 | Abrir de nuevo en otro entorno y revisar la visualización |
| 7 | Confirmar cómo lo ve la otra parte después de subirlo |
Herramientas como ExifTool y qpdf ayudan a revisar.
Pero aunque una herramienta borre metadatos, la información que queda en texto o imágenes debe revisarse aparte. Si subes el PDF original a servicios externos de conversión, redacción o revisión de metadatos, el contenido del documento, la información de acceso y la hora de procesamiento pueden pasar a ese servicio. En PDF de alto riesgo, realiza revisión y conversión en lo posible en un entorno local.
Revisar también a quién se envía el PDF
El riesgo de PDF no está solo dentro del archivo.
Dónde se sube, a quién se envía y con qué cuenta se comparte también afecta al anonimato. Si se comparte desde una nube personal, pueden verse nombre de propietario o correo electrónico. Si se envía por correo, quedan remitente, asunto y hora.
| Método de compartición | Información que queda | Punto de atención |
|---|---|---|
| Enlace de nube | Nombre de propietario, historial de compartición | No compartir desde una cuenta real |
| Adjunto de correo | Remitente, asunto, hora | Mirar correlación de la ruta de contacto |
| Sitio de publicación | Hora de subida, cuenta | Se conecta con el contenido publicado |
| Envío por chat | Queda en el dispositivo de la otra parte | Cuidado con capturas y reenvíos |
| Envío anónimo | Logs del destino, hora de confirmación | Mirar confiabilidad del destino |
Hacer seguro un PDF no significa solo ordenar su interior.
También incluye ruta de compartición, cuenta, hora de envío y conservación del lado receptor.
Separación con otros artículos
Este artículo trata el riesgo de la información que queda en PDF.
El flujo para eliminar realmente metadatos de PDF se trata en "Precauciones al eliminar metadatos de PDF". Si creas un PDF desde un documento Office, también revisa la información de autor y el historial de cambios del archivo Office original.
Es decir, lo importante es no terminar mirando solo el PDF.
| Objeto a mirar | Revisión principal |
|---|---|
| PDF en sí | Autor, anotaciones, incrustados, tachado |
| Office original | Historial de cambios, comentarios, nombre de empresa |
| Imagen | Fondo, reflejo, texto, |
| Ruta de compartición | Nombre de propietario, URL, hora de envío |
| Punto de consulta | Tratamiento de valor probatorio y seguridad |
El PDF es, en muchas situaciones, un "formato fácil de enviar".
Por eso, en denuncias de irregularidades, consultas en escuela o trabajo y aportes a medios, se tiende a enviarlo tal cual. Si el anonimato importa, separa dónde queda información de quien creó, editó, compartió y abrió el PDF.
Cuidado también con PDF recibidos
El riesgo del PDF no afecta solo a archivos creados por ti.
Un PDF recibido de otra persona también puede conservar autor, fecha de creación, software, anotaciones y archivos incrustados. Si publicas tal cual un PDF recibido en una investigación o consulta, puedes crear una línea que vuelva a la persona que lo proporcionó.
| Información del PDF recibido | Riesgo |
|---|---|
| Autor | Se conoce a la persona proveedora u organización |
| Fecha de creación | Se conoce el periodo de creación del material |
| Anotaciones | Quedan notas internas |
| Incrustados | Se mezclan materiales originales |
| Nombre de archivo | Se ve caso o nombre personal |
Cuanto más recibido sea un PDF, más debe revisarse desde la protección de la persona proveedora.
También quedan pistas en PDF escaneados
No se puede decir que escanear papel a PDF sea seguro.
En un PDF escaneado pueden quedar nombre del escáner, software de creación y fecha de creación. Además, en la propia página quedan sello, número de recepción, letra manuscrita, dobleces, notas en márgenes y rasgos de la copiadora. Aunque sea un PDF de imagen sin texto, la apariencia da pistas.
| Pista | Qué se sabe | Punto de atención |
|---|---|---|
| Información del escáner | Equipo o entorno usado | Revisar metadatos |
| Número de recepción | Material interno de la organización | Se estrecha por sistema de numeración |
| Letra manuscrita | Persona que escribió | Puede reconocerla alguien cercano |
| Sello o firma | Persona u organización | Es información identificativa directa |
| Márgenes o dobleces | Cómo fue tratado | Se infiere la ruta del original |
Un PDF escaneado tiene riesgos de documento digital y de documento en papel.
Revisa no solo metadatos, sino también la apariencia de la página ampliada.
Resumen
Un PDF no se puede juzgar como seguro solo por su apariencia.
Pueden quedar nombre de autor, fecha de creación, software, anotaciones, archivos incrustados e información de formulario.
El tachado tampoco basta visualmente. Los procesos que dejan el texto original dentro son peligrosos.
En anonimato, revisa por separado texto, apariencia, información interna, nombre de archivo y destino de compartición del PDF.
En materiales de alto riesgo, considera usar puntos de consulta confiables o especialistas en vez de decidir en solitario.
Herramientas relacionadas
ExifTool
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.
URL : https://exiftool.org/
MAT2
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.
qpdf
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.