Metadatos en archivos PDF, Office, video y audio
La información de las imágenes es muy conocida. Sin embargo, los metadatos que deben cuidarse para el anonimato no se limitan a las imágenes.
En archivos PDF, documentos de Office, videos, audio y archivos comprimidos también pueden quedar nombres de autor, historiales de edición, software usado, fecha y hora de captura, información de etiquetas, comentarios, nombres internos de archivos y datos similares.
Aunque creas haber borrado algo visualmente, puede quedar otra información dentro del archivo. Además, aunque elimines metadatos, la identidad o la afiliación pueden inferirse a partir del texto, el fondo, el audio, el texto dentro de la pantalla o el nombre del archivo.
Este artículo organiza la información que suele quedar según el formato del archivo y los puntos que conviene revisar antes de publicar.
Los metadatos son información alrededor del archivo
Los metadatos son información adjunta al propio archivo.
Separada del texto del documento o de la imagen en sí, puede incluir autor, fecha y hora de creación, software de edición, información de ubicación, historial de cambios, comentarios y datos similares.
En el anonimato, los metadatos se convierten en una pista fuerte. Esto se debe a que, aunque no escribas un nombre en el texto, dentro del archivo puede quedar el nombre del autor o de una organización.
| Formato | Información que suele quedar | Punto de atención |
|---|---|---|
| Autor, software de creación, anotaciones, archivos incrustados | Tener cuidado con el manejo de la ocultación y las anotaciones | |
| Documentos de Office | Autor, nombre de la empresa, historial de cambios, comentarios | Pueden quedar hojas ocultas e información de revisión |
| Video | Fecha y hora de captura, información del dispositivo, información de ubicación, software de edición | El audio y el fondo también son pistas |
| Audio | Etiquetas ID3, fecha y hora de grabación, información de la aplicación | Revisar también las voces y los sonidos de fondo |
| Archivos comprimidos | Nombres internos de archivos, nombres de carpetas, archivos innecesarios | Pueden mezclarse datos de trabajo en curso |
Los metadatos se ven de forma distinta según el formato del archivo. Por eso conviene no decidir que todo es seguro con un solo método de comprobación.
Información que cuidar en PDF
PDF es un formato que facilita distribuir documentos. Sin embargo, al publicar materiales de forma anónima, hace falta cuidado.
En un PDF pueden quedar el nombre del autor, fecha y hora de creación, software de creación, título, anotaciones, archivos incrustados, información de formularios y datos similares.
Además, aunque visualmente parezca que algo fue ocultado con un recuadro negro, la información del texto original puede quedar dentro. Si solo se superpone un rectángulo negro como imagen, a veces el texto original puede extraerse copiando o buscando.
| Qué revisar | Razón |
|---|---|
| Propiedades del documento | Puede quedar el nombre del autor o el software de creación |
| Anotaciones | Pueden verse comentarios o notas de edición |
| Archivos incrustados | Pueden incluirse materiales originales o datos innecesarios |
| Tratamiento de la ocultación | Revisar que el texto original no quede internamente |
| Nombre del archivo | Puede incluir el nombre del caso, la organización o el nombre real |
Un PDF parece listo para publicar, pero su estructura interna no siempre es segura. En materiales de alto riesgo, revisa con herramientas locales y, si hace falta, vuelve a generarlo de una forma más segura.
Información que cuidar en documentos de Office
Los documentos de Office, como Word, Excel y PowerPoint, son formatos en los que suele quedar historial de trabajo.
Pueden incluir el nombre del autor, nombre de la empresa, historial de cambios, comentarios, hojas ocultas, plantillas, enlaces, historial de coedición y datos similares.
En denuncias internas o materiales de investigación periodística, entregar un documento de Office tal cual requiere especial cautela. Esto se debe a que puede quedar no solo el contenido del documento, sino también quién lo creó y en qué entorno organizacional fue editado.
| Qué revisar | Información visible |
|---|---|
| Autor | Nombre personal o nombre de cuenta |
| Nombre de la empresa | Organización afiliada o configuración del dispositivo |
| Historial de cambios | Quién editó qué partes |
| Comentarios | Conversaciones internas o rastros de decisiones |
| Hojas ocultas | Datos que no se muestran |
| Enlaces | Rutas internas o URL de la nube |
En los documentos de Office es importante no juzgar solo por la página visible. Si vas a preparar una versión para publicación, elimina el historial innecesario y vuelve a revisar después de exportar a otro formato.
Información que cuidar en videos
En los videos hay que prestar atención tanto a los metadatos como al contenido.
Dentro del archivo pueden quedar fecha y hora de captura, información del dispositivo, información de ubicación, software de edición e información de codificación. Además, en la imagen misma pueden aparecer caras, fondos, letreros, uniformes, vehículos, reflejos en ventanas, notificaciones y nombres de cuenta en pantalla.
Como el video contiene más información que una imagen fija, la comprobación del anonimato también se vuelve más difícil.
| Qué revisar | Razón |
|---|---|
| Fecha y hora de captura | Se vincula con horarios de actividad o participación en el lugar |
| Información de ubicación | Permite conocer el lugar de grabación |
| Información del dispositivo | Muestra el modelo usado o el entorno de edición |
| Fondo | Edificios, letreros y paisajes pueden revelar el lugar |
| Audio | Voces, sonidos ambientales y conversaciones se convierten en pistas |
| Notificaciones | Pueden aparecer nombres de cuenta o contactos |
En los videos, aunque elimines metadatos, sigue pendiente revisar el contenido. Incluso en un video corto, unos segundos de fondo o sonido pueden permitir inferir un lugar o una persona.
Información que cuidar en audio
Los archivos de audio también tienen metadatos.
En MP3 y formatos similares pueden incluirse etiquetas como título, artista, álbum, software de creación y comentarios. También puede quedar información de la aplicación de grabación o del software de edición.
Además, en el audio el contenido en sí es una pista fuerte. Una persona o un lugar pueden inferirse por la voz, la forma de hablar, el dialecto, el sonido de fondo, sonidos de notificaciones, anuncios de estaciones, ruido de autos, eco de la habitación y detalles similares.
| Qué revisar | Razón |
|---|---|
| Etiquetas ID3 | Puede quedar el título o información del autor |
| Fecha y hora de grabación | Puede compararse con el horario de actividad |
| Aplicación de creación | Se convierte en pista del entorno usado |
| Voz | Puede revelar a la persona o a gente relacionada |
| Sonido de fondo | Puede revelar el lugar o la situación |
Si publicas audio de forma anónima, eliminar metadatos no es suficiente. Revisa también la cualidad de la voz, la forma de hablar y los sonidos de fondo.
Información que cuidar en archivos comprimidos
Los archivos comprimidos, como ZIP, se usan para entregar varios archivos juntos.
En los archivos comprimidos, presta atención a los nombres internos de archivos, nombres de carpetas, archivos innecesarios y datos de trabajo en curso.
Por ejemplo, aunque hayas querido incluir solo el PDF que vas a publicar, en la misma carpeta pueden mezclarse el documento de Office original, notas, capturas de pantalla o archivos ocultos. El nombre de la carpeta también puede incluir un nombre real, el nombre del caso o el nombre de la empresa.
Siempre revisa el contenido de un archivo comprimido al abrirlo.
Flujo básico de comprobación
El flujo de comprobación es común, sin importar el formato del archivo.
| Etapa | Qué revisar |
|---|---|
| 1 | No publicar directamente el archivo original |
| 2 | Crear una copia de publicación |
| 3 | Revisar el nombre del archivo |
| 4 | Revisar los metadatos |
| 5 | Revisar texto, imágenes, audio y fondo |
| 6 | Volver a revisar después de eliminar o convertir |
| 7 | Revisar cómo se verá para la otra parte en el destino de subida |
Herramientas como ExifTool se usan para revisar metadatos en varios formatos.
ExifTool es una herramienta local representativa que permite comprobar y editar metadatos de varios formatos, como imágenes, videos y documentos. Al aprender las diferencias entre formatos de archivo, también sirve como punto de entrada para revisar qué información contiene realmente un archivo. URL : https://exiftool.org/
Sin embargo, no te quedes solo con los resultados de la herramienta. Las herramientas ayudan a revisar información interna, pero también hay que revisar por separado el fondo de las imágenes, el texto del documento, el contenido del audio y la visualización del propietario en el destino de subida.
Resumen
Los metadatos no son solo un problema de las imágenes.
En archivos PDF, documentos de Office, videos, audio y archivos comprimidos también pueden quedar autor, historial de edición, software de creación, etiquetas, información de ubicación, nombres internos de archivos y datos similares.
En el anonimato, revisa por separado el contenido del archivo y los metadatos. Aunque elimines metadatos, la identidad o la afiliación pueden inferirse a partir del texto, el fondo, el audio, reflejos, el nombre del archivo y la configuración de uso compartido.
Antes de publicar, no entregues directamente el archivo original; crea una copia de publicación, revisa según el formato y vuelve a revisar después de la eliminación. Hay que pensar que entregar un archivo puede significar entregar no solo el texto, sino también el entorno de creación y la ruta de envío.
Herramientas relacionadas
Wayback Machine
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.
URL : https://web.archive.org/
ExifTool
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.
URL : https://exiftool.org/
MAT2
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.
qpdf
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.
FFmpeg
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.
URL : https://ffmpeg.org/