Learn

284 artículosCategoría: Todo
Metadatos

Riesgos de metadatos en PDF

Los PDF se usan a menudo como materiales públicos o de envío.

Pero un PDF no se puede juzgar solo por su apariencia. Aunque el texto no incluya nombres, dentro del archivo pueden quedar nombre de autor, software de creación, fecha de creación, anotaciones, archivos incrustados e información de formulario.

En anonimato, no solo el contenido del PDF, sino también el entorno en que se creó y el historial de edición se vuelven pistas.

Este artículo organiza la información que suele quedar en PDF y los puntos de revisión antes de publicar.

Información que queda en PDF

Un PDF puede incluir información distinta del documento en sí.

InformaciónQué indicaRiesgo para el anonimato
AutorNombre de usuario del OS o del software documentalAparecen nombre personal u organización
Fecha de creaciónCuándo se creóSe conecta con hora de actividad o periodo de creación
Software de creaciónWord, LibreOffice, escáner, etc.Da pistas del entorno de trabajo
TítuloNombre del documento original o casoQueda un nombre interno
AnotacionesComentarios o notas de ediciónAparecen personas relacionadas o proceso de decisión
Archivos incrustadosMateriales originales o datos adjuntosSe mezcla información innecesaria

Un PDF parece una "versión final".

Sin embargo, dentro puede quedar información del proceso de creación.

Fallos de tachado

Algo especialmente peligroso en PDF son los fallos de tachado.

Aunque visualmente parezca oculto con un rectángulo negro, puede quedar información textual interna. El texto original puede extraerse copiando, buscando o quitando capas.

Procesamiento comúnProblemaForma de acercarse a algo más seguro
Superponer una figura negraEl texto original queda dentroUsar una función dedicada de redacción
Solo convertir en capturaCuidado con calidad e información ocultaRevisar de nuevo el alcance necesario
Ocultar con anotaciónLa anotación puede quitarseCopiar y buscar después de exportar
Eliminar páginasPueden quedar incrustados o historialRegenerar como archivo separado
Borrar partes manualmenteSe producen omisionesUsar una lista de revisión

En materiales de alto riesgo, es más seguro no juzgar un tachado con una sola mirada.

En contextos legales, periodísticos o de denuncia de irregularidades, puede hacer falta revisión de especialistas o puntos de consulta confiables.

Separar apariencia e interior del PDF

Al revisar un PDF, separa apariencia e información interna.

En la apariencia hay texto, imágenes, tablas, códigos QR, números de página, fondos y marcas de agua. En el interior hay metadatos, anotaciones, archivos incrustados, formularios y enlaces.

Lugar de revisiónInformación que se miraRazón
AparienciaTexto, imágenes, tablas, fondoRevisar información personal directa
EnlacesURL, destino compartido, trackingEvitar ID personales o URL internas
MetadatosAutor, software de creaciónNo revelar el entorno de trabajo
AnotacionesComentarios, revisiónNo dejar conversaciones internas
IncrustadosAdjuntos, formulariosNo incluir datos innecesarios

Un PDF parece un impreso.

Pero en realidad es un archivo digital con estructura interna.

Procedimiento de revisión

Antes de publicar un PDF, lo básico es no publicar directamente el archivo original.

Crea una copia de publicación y deja solo la información necesaria.

PasoQué revisar
1Crear una copia de publicación en vez de usar el archivo original
2Mirar si el nombre de archivo contiene nombre real, caso u organización
3Revisar propiedades del documento
4Revisar anotaciones, comentarios, formularios e incrustados
5Comprobar si las partes tachadas pueden copiarse o buscarse
6Abrir de nuevo en otro entorno y revisar la visualización
7Confirmar cómo lo ve la otra parte después de subirlo

Herramientas como ExifTool y qpdf ayudan a revisar.

Pero aunque una herramienta borre metadatos, la información que queda en texto o imágenes debe revisarse aparte. Si subes el PDF original a servicios externos de conversión, redacción o revisión de metadatos, el contenido del documento, la información de acceso y la hora de procesamiento pueden pasar a ese servicio. En PDF de alto riesgo, realiza revisión y conversión en lo posible en un entorno local.

Revisar también a quién se envía el PDF

El riesgo de PDF no está solo dentro del archivo.

Dónde se sube, a quién se envía y con qué cuenta se comparte también afecta al anonimato. Si se comparte desde una nube personal, pueden verse nombre de propietario o correo electrónico. Si se envía por correo, quedan remitente, asunto y hora.

Método de comparticiónInformación que quedaPunto de atención
Enlace de nubeNombre de propietario, historial de comparticiónNo compartir desde una cuenta real
Adjunto de correoRemitente, asunto, horaMirar correlación de la ruta de contacto
Sitio de publicaciónHora de subida, cuentaSe conecta con el contenido publicado
Envío por chatQueda en el dispositivo de la otra parteCuidado con capturas y reenvíos
Envío anónimoLogs del destino, hora de confirmaciónMirar confiabilidad del destino

Hacer seguro un PDF no significa solo ordenar su interior.

También incluye ruta de compartición, cuenta, hora de envío y conservación del lado receptor.

Separación con otros artículos

Este artículo trata el riesgo de la información que queda en PDF.

El flujo para eliminar realmente metadatos de PDF se trata en "Precauciones al eliminar metadatos de PDF". Si creas un PDF desde un documento Office, también revisa la información de autor y el historial de cambios del archivo Office original.

Es decir, lo importante es no terminar mirando solo el PDF.

Objeto a mirarRevisión principal
PDF en síAutor, anotaciones, incrustados, tachado
Office originalHistorial de cambios, comentarios, nombre de empresa
ImagenFondo, reflejo, texto,
Ruta de comparticiónNombre de propietario, URL, hora de envío
Punto de consultaTratamiento de valor probatorio y seguridad

El PDF es, en muchas situaciones, un "formato fácil de enviar".

Por eso, en denuncias de irregularidades, consultas en escuela o trabajo y aportes a medios, se tiende a enviarlo tal cual. Si el anonimato importa, separa dónde queda información de quien creó, editó, compartió y abrió el PDF.

Cuidado también con PDF recibidos

El riesgo del PDF no afecta solo a archivos creados por ti.

Un PDF recibido de otra persona también puede conservar autor, fecha de creación, software, anotaciones y archivos incrustados. Si publicas tal cual un PDF recibido en una investigación o consulta, puedes crear una línea que vuelva a la persona que lo proporcionó.

Información del PDF recibidoRiesgo
AutorSe conoce a la persona proveedora u organización
Fecha de creaciónSe conoce el periodo de creación del material
AnotacionesQuedan notas internas
IncrustadosSe mezclan materiales originales
Nombre de archivoSe ve caso o nombre personal

Cuanto más recibido sea un PDF, más debe revisarse desde la protección de la persona proveedora.

También quedan pistas en PDF escaneados

No se puede decir que escanear papel a PDF sea seguro.

En un PDF escaneado pueden quedar nombre del escáner, software de creación y fecha de creación. Además, en la propia página quedan sello, número de recepción, letra manuscrita, dobleces, notas en márgenes y rasgos de la copiadora. Aunque sea un PDF de imagen sin texto, la apariencia da pistas.

PistaQué se sabePunto de atención
Información del escánerEquipo o entorno usadoRevisar metadatos
Número de recepciónMaterial interno de la organizaciónSe estrecha por sistema de numeración
Letra manuscritaPersona que escribióPuede reconocerla alguien cercano
Sello o firmaPersona u organizaciónEs información identificativa directa
Márgenes o doblecesCómo fue tratadoSe infiere la ruta del original

Un PDF escaneado tiene riesgos de documento digital y de documento en papel.

Revisa no solo metadatos, sino también la apariencia de la página ampliada.

Resumen

Un PDF no se puede juzgar como seguro solo por su apariencia.

Pueden quedar nombre de autor, fecha de creación, software, anotaciones, archivos incrustados e información de formulario.

El tachado tampoco basta visualmente. Los procesos que dejan el texto original dentro son peligrosos.

En anonimato, revisa por separado texto, apariencia, información interna, nombre de archivo y destino de compartición del PDF.

En materiales de alto riesgo, considera usar puntos de consulta confiables o especialistas en vez de decidir en solitario.

Herramientas relacionadas

Metadata inspection

ExifTool

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://exiftool.org/

Abrir sitio externo
Metadata removal

MAT2

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://0xacab.org/jvoisin/mat2

Abrir sitio externo
PDF inspection

qpdf

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://qpdf.readthedocs.io/

Abrir sitio externo

Artículos relacionados