Learn

284 artigosCategoria: Tudo
Metadados

Riscos de metadados em PDF

PDFs são usados com frequência como materiais públicos ou de envio.

Mas PDFs não podem ser julgados só pela aparência. Mesmo que o texto não tenha nome, o arquivo pode manter internamente nome do autor, software de criação, data de criação, anotações, arquivos incorporados e informações de formulário.

No anonimato, não só o conteúdo do PDF, mas também o ambiente em que ele foi criado e o histórico de edição viram pistas.

Este artigo organiza informações que tendem a ficar em PDFs e pontos de verificação antes da publicação.

Informações que ficam em PDFs

Um PDF pode conter informações além do documento em si.

InformaçãoO que indicaRisco para anonimato
AutorNome de usuário do OS ou editorNome pessoal ou organização aparece
Data de criaçãoQuando foi criadoLiga a horário de ação ou época de preparo
Software de criaçãoWord, LibreOffice, scanner etc.Dá pista do ambiente de trabalho
TítuloNome do documento original ou casoNome interno permanece
AnotaçõesComentários e notas de ediçãoPessoas relacionadas e processo de julgamento aparecem
Arquivos incorporadosMateriais originais ou anexosMistura informações desnecessárias

PDF parece uma “versão final”.

Mas pode guardar informações do processo de criação.

Falhas de ocultação

Um risco especialmente perigoso em PDFs é a falha na ocultação de trechos.

Mesmo que a tela mostre um retângulo preto, o texto pode continuar internamente. Cópia, busca ou remoção de camadas pode recuperar o texto original.

Processamento comumProblemaComo se aproximar de segurança
Sobrepor forma pretaO texto original fica dentroUsar recurso próprio de ocultação segura
Apenas transformar em capturaAtenção à qualidade e informações ocultasReconfirmar o trecho necessário
Ocultar com anotaçãoA anotação pode ser removidaFazer cópia e busca após exportar
Excluir páginaIncorporações ou histórico podem permanecerRecriar como outro arquivo
Excluir manualmente partePodem ocorrer esquecimentosUsar checklist

Em materiais de alto risco, é mais seguro não julgar áreas ocultadas apenas com um par de olhos.

Em contextos legais, jornalísticos ou de denúncia, pode ser necessária confirmação por especialista ou consulta confiável.

Separar aparência e interior do PDF

Na verificação de PDF, separe aparência e informações internas.

Na aparência, há texto, imagens, tabelas, QR codes, números de página, fundo e marcas d’água. Internamente, há metadados, anotações, arquivos incorporados, formulários e links.

Local de verificaçãoInformaçãoMotivo
AparênciaTexto, imagens, tabelas, fundoVerificar informações pessoais diretas
LinksURLs, destinos de compartilhamento, rastreamentoEvitar IDs pessoais e URLs internas
MetadadosAutor, software de criaçãoNão expor ambiente de trabalho
AnotaçõesComentários, revisãoNão deixar conversas internas
IncorporaçõesAnexos, formuláriosNão incluir dados desnecessários

PDF parece impresso.

Na prática, é um arquivo digital com estrutura interna.

Procedimento de verificação

Antes de publicar um PDF, a base é não publicar o arquivo original diretamente.

Crie uma cópia para publicação e deixe só as informações necessárias.

EtapaO que verificar
1Criar uma cópia para publicação, não usar o original
2Ver se o nome do arquivo tem nome real, caso ou organização
3Verificar propriedades do documento
4Verificar anotações, comentários, formulários e incorporações
5Ver se partes ocultadas não podem ser copiadas ou pesquisadas
6Abrir de novo em outro ambiente para conferir a aparência
7Depois do upload, verificar como aparece para a outra pessoa

Ferramentas como ExifTool e qpdf ajudam na verificação.

Mas, mesmo removendo metadados com ferramenta, informações que ficam no texto ou nas imagens precisam ser verificadas separadamente. Ao enviar o PDF original para serviços externos de conversão, ocultação de trechos ou verificação de metadados, conteúdo do documento, dados de acesso e horário do processamento podem chegar a esse serviço. Em PDFs de alto risco, verifique e converta o máximo possível em ambiente local.

Verificar também o destinatário

O risco do PDF não está só no interior do arquivo.

Para onde ele é enviado, a quem, e com qual conta, também afeta o anonimato. Se compartilhado por nuvem pessoal, nome do proprietário e email podem aparecer. Se enviado por email, remetente, assunto e horário ficam registrados.

Forma de compartilhamentoInformações restantesAtenção
Link de nuvemProprietário, histórico de compartilhamentoNão compartilhar por conta de nome real
Anexo de emailRemetente, assunto, horárioVer correlação do caminho de contato
Site de postagemHorário de upload, contaLiga ao conteúdo publicado
Envio por chatFica no dispositivo da outra pessoaAtenção a captura e encaminhamento
Envio anônimoLogs do destino, horário de confirmaçãoVer confiança no destino

nar um PDF seguro não é apenas arrumar seu interior.

Também inclui rota de compartilhamento, conta, horário de envio e armazenamento do lado receptor.

Separação em relação a outros artigos

Este artigo trata do risco de informações que ficam em PDFs.

O fluxo para remover metadados de PDF é tratado em “Cuidados ao remover metadados de PDF”. Ao criar PDF a partir de Office, também verifique autor e histórico de alterações do arquivo Office original.

Ou seja, é importante não terminar olhando apenas o PDF.

AlvoVerificação principal
PDF em siAutor, anotações, incorporações, áreas ocultadas
Office originalHistórico de alterações, comentários, nome da empresa
ImagemFundo, reflexo, texto,
Rota de compartilhamentoProprietário, URL, horário de envio
ConsultaTratamento de valor probatório e segurança

PDF é, em muitos contextos, um formato “fácil de enviar”.

Justamente por isso, em denúncias, consultas na escola ou no trabalho e fornecimento à imprensa, ele tende a ser enviado como está. Se o anonimato importa, separe onde podem ficar informações de quem criou, editou, compartilhou e abriu o PDF.

Atenção também a PDFs recebidos

O risco de PDF não se limita aos arquivos criados por você.

PDFs recebidos de alguém também podem manter autor, data de criação, software, anotações e arquivos incorporados. Publicar como está um PDF recebido em apuração ou consulta pode criar uma linha de retorno até a fonte.

Informação no PDF recebidoRisco
AutorRevela fonte ou organização
Data de criaçãoMostra época de preparo do material
AnotaçõesMantém notas internas
IncorporaçõesMistura material original
Nome do arquivoMostra caso ou nome pessoal

Quanto mais o PDF foi recebido de outra pessoa, mais deve ser verificado com foco na proteção da fonte.

PDFs digitalizados também deixam pistas

Não dá para dizer que digitalizar papel em PDF torna tudo seguro.

PDFs digitalizados podem manter nome do scanner, software de criação e data de criação. Além disso, o papel em si pode mostrar carimbos, número de protocolo, escrita manual, dobras, notas nas margens e características da copiadora. Mesmo um PDF-imagem sem texto traz pistas pela aparência.

PistaO que revelaAtenção
Informação do scannerEquipamento ou ambiente usadoVerificar metadados
Número de protocoloMaterial interno da organizaçãoSistema de numeração pode estreitar
Escrita manualQuem escreveuConhecidos podem reconhecer
Carimbo ou assinaturaPessoa ou organizaçãoVira identificador direto
Margens e dobrasComo o original foi manuseadoCaminho do original pode ser inferido

PDFs digitalizados têm riscos de documento digital e de papel.

Verifique não só metadados, mas também a aparência da página ampliada.

Resumo

PDFs não são seguros apenas pela aparência.

Nome do autor, data de criação, software, anotações, arquivos incorporados e formulários podem permanecer.

Áreas ocultadas também não bastam pela aparência. Processamentos que deixam o texto original dentro são perigosos.

No anonimato, verifique separadamente texto, aparência, informações internas, nome do arquivo e destino de compartilhamento.

Em materiais de alto risco, considere usar consultas confiáveis ou especialistas, em vez de decidir sozinho.

Ferramentas relacionadas

Metadata inspection

ExifTool

Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.

Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.

URL : https://exiftool.org/

Abrir site externo
Metadata removal

MAT2

Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.

Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.

URL : https://0xacab.org/jvoisin/mat2

Abrir site externo
PDF inspection

qpdf

Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.

Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.

URL : https://qpdf.readthedocs.io/

Abrir site externo

Artigos relacionados