Learn

38 artículosCategoría: Todo
Metadatos

Metadatos en archivos PDF, Office, video y audio

La información de las imágenes es muy conocida. Sin embargo, los metadatos que deben cuidarse para el anonimato no se limitan a las imágenes.

En archivos PDF, documentos de Office, videos, audio y archivos comprimidos también pueden quedar nombres de autor, historiales de edición, software usado, fecha y hora de captura, información de etiquetas, comentarios, nombres internos de archivos y datos similares.

Aunque creas haber borrado algo visualmente, puede quedar otra información dentro del archivo. Además, aunque elimines metadatos, la identidad o la afiliación pueden inferirse a partir del texto, el fondo, el audio, el texto dentro de la pantalla o el nombre del archivo.

Este artículo organiza la información que suele quedar según el formato del archivo y los puntos que conviene revisar antes de publicar.

Los metadatos son información alrededor del archivo

Los metadatos son información adjunta al propio archivo.

Separada del texto del documento o de la imagen en sí, puede incluir autor, fecha y hora de creación, software de edición, información de ubicación, historial de cambios, comentarios y datos similares.

En el anonimato, los metadatos se convierten en una pista fuerte. Esto se debe a que, aunque no escribas un nombre en el texto, dentro del archivo puede quedar el nombre del autor o de una organización.

FormatoInformación que suele quedarPunto de atención
PDFAutor, software de creación, anotaciones, archivos incrustadosTener cuidado con el manejo de la ocultación y las anotaciones
Documentos de OfficeAutor, nombre de la empresa, historial de cambios, comentariosPueden quedar hojas ocultas e información de revisión
VideoFecha y hora de captura, información del dispositivo, información de ubicación, software de ediciónEl audio y el fondo también son pistas
AudioEtiquetas ID3, fecha y hora de grabación, información de la aplicaciónRevisar también las voces y los sonidos de fondo
Archivos comprimidosNombres internos de archivos, nombres de carpetas, archivos innecesariosPueden mezclarse datos de trabajo en curso

Los metadatos se ven de forma distinta según el formato del archivo. Por eso conviene no decidir que todo es seguro con un solo método de comprobación.

Información que cuidar en PDF

PDF es un formato que facilita distribuir documentos. Sin embargo, al publicar materiales de forma anónima, hace falta cuidado.

En un PDF pueden quedar el nombre del autor, fecha y hora de creación, software de creación, título, anotaciones, archivos incrustados, información de formularios y datos similares.

Además, aunque visualmente parezca que algo fue ocultado con un recuadro negro, la información del texto original puede quedar dentro. Si solo se superpone un rectángulo negro como imagen, a veces el texto original puede extraerse copiando o buscando.

Qué revisarRazón
Propiedades del documentoPuede quedar el nombre del autor o el software de creación
AnotacionesPueden verse comentarios o notas de edición
Archivos incrustadosPueden incluirse materiales originales o datos innecesarios
Tratamiento de la ocultaciónRevisar que el texto original no quede internamente
Nombre del archivoPuede incluir el nombre del caso, la organización o el nombre real

Un PDF parece listo para publicar, pero su estructura interna no siempre es segura. En materiales de alto riesgo, revisa con herramientas locales y, si hace falta, vuelve a generarlo de una forma más segura.

Información que cuidar en documentos de Office

Los documentos de Office, como Word, Excel y PowerPoint, son formatos en los que suele quedar historial de trabajo.

Pueden incluir el nombre del autor, nombre de la empresa, historial de cambios, comentarios, hojas ocultas, plantillas, enlaces, historial de coedición y datos similares.

En denuncias internas o materiales de investigación periodística, entregar un documento de Office tal cual requiere especial cautela. Esto se debe a que puede quedar no solo el contenido del documento, sino también quién lo creó y en qué entorno organizacional fue editado.

Qué revisarInformación visible
AutorNombre personal o nombre de cuenta
Nombre de la empresaOrganización afiliada o configuración del dispositivo
Historial de cambiosQuién editó qué partes
ComentariosConversaciones internas o rastros de decisiones
Hojas ocultasDatos que no se muestran
EnlacesRutas internas o URL de la nube

En los documentos de Office es importante no juzgar solo por la página visible. Si vas a preparar una versión para publicación, elimina el historial innecesario y vuelve a revisar después de exportar a otro formato.

Información que cuidar en videos

En los videos hay que prestar atención tanto a los metadatos como al contenido.

Dentro del archivo pueden quedar fecha y hora de captura, información del dispositivo, información de ubicación, software de edición e información de codificación. Además, en la imagen misma pueden aparecer caras, fondos, letreros, uniformes, vehículos, reflejos en ventanas, notificaciones y nombres de cuenta en pantalla.

Como el video contiene más información que una imagen fija, la comprobación del anonimato también se vuelve más difícil.

Qué revisarRazón
Fecha y hora de capturaSe vincula con horarios de actividad o participación en el lugar
Información de ubicaciónPermite conocer el lugar de grabación
Información del dispositivoMuestra el modelo usado o el entorno de edición
FondoEdificios, letreros y paisajes pueden revelar el lugar
AudioVoces, sonidos ambientales y conversaciones se convierten en pistas
NotificacionesPueden aparecer nombres de cuenta o contactos

En los videos, aunque elimines metadatos, sigue pendiente revisar el contenido. Incluso en un video corto, unos segundos de fondo o sonido pueden permitir inferir un lugar o una persona.

Información que cuidar en audio

Los archivos de audio también tienen metadatos.

En MP3 y formatos similares pueden incluirse etiquetas como título, artista, álbum, software de creación y comentarios. También puede quedar información de la aplicación de grabación o del software de edición.

Además, en el audio el contenido en sí es una pista fuerte. Una persona o un lugar pueden inferirse por la voz, la forma de hablar, el dialecto, el sonido de fondo, sonidos de notificaciones, anuncios de estaciones, ruido de autos, eco de la habitación y detalles similares.

Qué revisarRazón
Etiquetas ID3Puede quedar el título o información del autor
Fecha y hora de grabaciónPuede compararse con el horario de actividad
Aplicación de creaciónSe convierte en pista del entorno usado
VozPuede revelar a la persona o a gente relacionada
Sonido de fondoPuede revelar el lugar o la situación

Si publicas audio de forma anónima, eliminar metadatos no es suficiente. Revisa también la cualidad de la voz, la forma de hablar y los sonidos de fondo.

Información que cuidar en archivos comprimidos

Los archivos comprimidos, como ZIP, se usan para entregar varios archivos juntos.

En los archivos comprimidos, presta atención a los nombres internos de archivos, nombres de carpetas, archivos innecesarios y datos de trabajo en curso.

Por ejemplo, aunque hayas querido incluir solo el PDF que vas a publicar, en la misma carpeta pueden mezclarse el documento de Office original, notas, capturas de pantalla o archivos ocultos. El nombre de la carpeta también puede incluir un nombre real, el nombre del caso o el nombre de la empresa.

Siempre revisa el contenido de un archivo comprimido al abrirlo.

Flujo básico de comprobación

El flujo de comprobación es común, sin importar el formato del archivo.

EtapaQué revisar
1No publicar directamente el archivo original
2Crear una copia de publicación
3Revisar el nombre del archivo
4Revisar los metadatos
5Revisar texto, imágenes, audio y fondo
6Volver a revisar después de eliminar o convertir
7Revisar cómo se verá para la otra parte en el destino de subida

Herramientas como ExifTool se usan para revisar metadatos en varios formatos.

ExifTool es una herramienta local representativa que permite comprobar y editar metadatos de varios formatos, como imágenes, videos y documentos. Al aprender las diferencias entre formatos de archivo, también sirve como punto de entrada para revisar qué información contiene realmente un archivo. URL : https://exiftool.org/

Sin embargo, no te quedes solo con los resultados de la herramienta. Las herramientas ayudan a revisar información interna, pero también hay que revisar por separado el fondo de las imágenes, el texto del documento, el contenido del audio y la visualización del propietario en el destino de subida.

Resumen

Los metadatos no son solo un problema de las imágenes.

En archivos PDF, documentos de Office, videos, audio y archivos comprimidos también pueden quedar autor, historial de edición, software de creación, etiquetas, información de ubicación, nombres internos de archivos y datos similares.

En el anonimato, revisa por separado el contenido del archivo y los metadatos. Aunque elimines metadatos, la identidad o la afiliación pueden inferirse a partir del texto, el fondo, el audio, reflejos, el nombre del archivo y la configuración de uso compartido.

Antes de publicar, no entregues directamente el archivo original; crea una copia de publicación, revisa según el formato y vuelve a revisar después de la eliminación. Hay que pensar que entregar un archivo puede significar entregar no solo el texto, sino también el entorno de creación y la ruta de envío.

Herramientas relacionadas

Archive check

Wayback Machine

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://web.archive.org/

Abrir sitio externo
Metadata inspection

ExifTool

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://exiftool.org/

Abrir sitio externo
Metadata removal

MAT2

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://0xacab.org/jvoisin/mat2

Abrir sitio externo
PDF inspection

qpdf

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://qpdf.readthedocs.io/

Abrir sitio externo
Audio and video

FFmpeg

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://ffmpeg.org/

Abrir sitio externo

Artículos relacionados