Metadados em arquivos PDF, Office, vídeo e áudio
As informações de imagens são bem conhecidas. No entanto, os metadados que exigem atenção para o anonimato não se limitam a imagens.
Em PDFs, documentos do Office, vídeos, áudios e arquivos compactados também podem ficar nomes de autor, históricos de edição, software usado, data e hora de captura, informações de tags, comentários, nomes internos de arquivos e dados semelhantes.
Mesmo que você ache que removeu algo visualmente, outras informações podem permanecer dentro do arquivo. Além disso, mesmo que você remova metadados, identidade ou afiliação ainda podem ser inferidas pelo texto, fundo, áudio, texto visível na tela ou nome do arquivo.
Este artigo organiza as informações que tendem a permanecer em cada formato de arquivo e os pontos a verificar antes da publicação.
Metadados são informações ao redor do arquivo
Metadados são informações anexadas ao próprio arquivo.
Separadas do texto do documento ou da imagem em si, podem incluir autor, data e hora de criação, software de edição, informações de localização, histórico de alterações, comentários e dados semelhantes.
No anonimato, metadados se tornam uma pista forte. Isso porque, mesmo que um nome não esteja escrito no texto, o nome do autor ou da organização pode permanecer dentro do arquivo.
| Formato | Informações que tendem a permanecer | Ponto de atenção |
|---|---|---|
| Autor, software de criação, anotações, arquivos incorporados | Ter cuidado com o tratamento de tarjas e anotações | |
| Documentos do Office | Autor, nome da empresa, histórico de alterações, comentários | Planilhas ocultas e informações de revisão podem permanecer |
| Vídeo | Data e hora de captura, informações do dispositivo, informações de localização, software de edição | Áudio e fundo também se tornam pistas |
| Áudio | Tags ID3, data e hora da gravação, informações do aplicativo | Verificar também vozes e sons de fundo |
| Arquivos compactados | Nomes internos de arquivos, nomes de pastas, arquivos desnecessários | Dados de trabalho em andamento podem se misturar |
Metadados aparecem de formas diferentes conforme o formato do arquivo. Por isso, é melhor não decidir que tudo está seguro com um único método de verificação.
Informações que exigem atenção em PDF
PDF é um formato que facilita a distribuição de documentos. No entanto, ao publicar materiais de forma anônima, é preciso cuidado.
Em PDFs podem permanecer nome do autor, data e hora de criação, software de criação, título, anotações, arquivos incorporados, informações de formulário e dados semelhantes.
Além disso, mesmo que algo pareça visualmente tarjado, as informações do texto original podem permanecer internamente. Se apenas um retângulo preto for sobreposto como imagem, o texto original pode ser extraído por cópia ou busca.
| O que verificar | Motivo |
|---|---|
| Propriedades do documento | Nome do autor ou software de criação pode permanecer |
| Anotações | Comentários ou notas de edição podem ficar visíveis |
| Arquivos incorporados | Materiais originais ou dados desnecessários podem estar incluídos |
| Tratamento de tarja | Verificar se o texto original não permanece internamente |
| Nome do arquivo | Pode conter nome do caso, nome da organização ou nome real |
PDFs parecem prontos para publicação, mas a estrutura interna não é necessariamente segura. Em materiais de alto risco, verifique com ferramentas locais e, se necessário, gere novamente em uma forma mais segura.
Informações que exigem atenção em documentos do Office
Documentos do Office, como Word, Excel e PowerPoint, são formatos em que históricos de trabalho tendem a permanecer.
Podem incluir nome do autor, nome da empresa, histórico de alterações, comentários, planilhas ocultas, modelos, links, histórico de coedição e dados semelhantes.
Em denúncias internas ou materiais de reportagem, entregar documentos do Office como estão exige cuidado especial. Isso porque pode permanecer não apenas o conteúdo do documento, mas também quem o criou e em que ambiente organizacional ele foi editado.
| O que verificar | Informações visíveis |
|---|---|
| Autor | Nome pessoal ou nome de conta |
| Nome da empresa | Organização afiliada ou configurações do dispositivo |
| Histórico de alterações | Quem editou quais partes |
| Comentários | Conversas internas ou rastros de julgamento |
| Planilhas ocultas | Dados que não estão sendo exibidos |
| Links | Caminhos internos ou URLs de nuvem |
Em documentos do Office, é importante não julgar apenas pela página visível. Ao preparar uma versão para publicação, remova históricos desnecessários e verifique novamente depois de exportar para outro formato.
Informações que exigem atenção em vídeos
Em vídeos, é preciso prestar atenção tanto aos metadados quanto ao conteúdo.
Dentro do arquivo podem permanecer data e hora de captura, informações do dispositivo, informações de localização, software de edição e informações de codificação. Além disso, o próprio vídeo pode mostrar rostos, fundos, placas, uniformes, veículos, reflexos em janelas, notificações e nomes de contas na tela.
Como vídeos contêm mais informações do que imagens estáticas, a verificação de anonimato também fica mais difícil.
| O que verificar | Motivo |
|---|---|
| Data e hora de captura | Liga-se ao horário de atividade ou a participação no local |
| Informações de localização | Revela o local de gravação |
| Informações do dispositivo | Mostra o modelo usado ou o ambiente de edição |
| Fundo | Prédios, placas e paisagens revelam o local |
| Áudio | Vozes, sons ambientais e conversas se tornam pistas |
| Notificações | Nomes de conta ou contatos podem aparecer |
Em vídeos, mesmo que os metadados sejam removidos, ainda é necessário verificar o conteúdo. Mesmo em um vídeo curto, alguns segundos de fundo ou som podem permitir inferir um lugar ou uma pessoa.
Informações que exigem atenção em áudio
Arquivos de áudio também têm metadados.
Em MP3 e formatos semelhantes, podem entrar informações de tags como título, artista, álbum, software de criação e comentários. Informações do aplicativo de gravação ou do software de edição também podem permanecer.
Além disso, no áudio, o próprio conteúdo é uma pista forte. Pessoas ou lugares podem ser inferidos pela voz, modo de falar, dialeto, som de fundo, sons de notificação, anúncios de estação, barulho de carros, eco da sala e detalhes semelhantes.
| O que verificar | Motivo |
|---|---|
| Tags ID3 | Título ou informações de autor podem permanecer |
| Data e hora da gravação | Pode ser comparada com o horário de atividade |
| Aplicativo de criação | na-se pista do ambiente usado |
| Voz | Pode revelar a própria pessoa ou pessoas relacionadas |
| Som de fundo | Pode revelar lugar ou situação |
Ao publicar áudio de forma anônima, remover metadados não basta. Verifique também a qualidade da voz, o modo de falar e os sons de fundo.
Informações que exigem atenção em arquivos compactados
Arquivos compactados, como ZIP, são usados ao entregar vários arquivos juntos.
Em arquivos compactados, preste atenção aos nomes internos de arquivos, nomes de pastas, arquivos desnecessários e dados de trabalho em andamento.
Por exemplo, mesmo que você tenha pretendido incluir apenas o PDF a publicar, na mesma pasta podem estar misturados o documento do Office original, notas, capturas de tela ou arquivos ocultos. Nomes de pastas também podem incluir nome real, nome do caso ou nome da empresa.
Sempre verifique o conteúdo de um arquivo compactado ao abri-lo.
Fluxo básico de verificação
O fluxo de verificação é comum independentemente do formato do arquivo.
| Etapa | O que verificar |
|---|---|
| 1 | Não publicar diretamente o arquivo original |
| 2 | Criar uma cópia para publicação |
| 3 | Verificar o nome do arquivo |
| 4 | Verificar os metadados |
| 5 | Verificar texto, imagens, áudio e fundo |
| 6 | Verificar novamente após remoção ou conversão |
| 7 | Verificar como a outra parte verá no destino de upload |
Ferramentas como ExifTool são usadas para verificar metadados em vários formatos.
ExifTool é uma ferramenta local representativa que pode verificar e editar metadados em vários formatos, incluindo imagens, vídeos e documentos. Ao aprender as diferenças entre formatos de arquivo, ela também serve como ponto de entrada para verificar quais informações estão realmente dentro do arquivo. URL : https://exiftool.org/
No entanto, não pare apenas nos resultados da ferramenta. Ferramentas ajudam a verificar informações internas, mas ainda é necessário verificar separadamente fundos de imagens, texto de documentos, conteúdo de áudio e exibição de proprietário no destino de upload.
Resumo
Metadados não são um problema apenas de imagens.
Em PDFs, documentos do Office, vídeos, áudio e arquivos compactados também podem permanecer autor, histórico de edição, software de criação, tags, informações de localização, nomes internos de arquivos e dados semelhantes.
No anonimato, verifique separadamente o conteúdo do arquivo e os metadados. Mesmo que você remova metadados, identidade ou afiliação podem ser inferidas por texto, fundo, áudio, reflexos, nome do arquivo e configurações de compartilhamento.
Antes de publicar, não entregue diretamente o arquivo original; crie uma cópia para publicação, verifique por formato e verifique novamente após a remoção. É preciso considerar que entregar um arquivo pode significar entregar não apenas o texto, mas também o ambiente de criação e a rota de envio.
Ferramentas relacionadas
Wayback Machine
Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.
Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.
URL : https://web.archive.org/
ExifTool
Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.
Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.
URL : https://exiftool.org/
MAT2
Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.
Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.
qpdf
Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.
Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.
FFmpeg
Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.
Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.
URL : https://ffmpeg.org/