Learn

284 artigosCategoria: Tudo
Metadados

Riscos invisíveis que ficam em PDFs

PDFs parecem seguros porque a aparência fica fixa.

Mas um PDF pode manter informações além do texto mostrado na tela.

Nome do autor, aplicativo de criação, data de atualização, anotações, arquivos incorporados, texto oculto e vestígios do documento original.

Ao compartilhar documentos anonimamente, é perigoso pensar “converti para PDF, então está tudo bem”.

Este artigo organiza riscos invisíveis em PDFs e pontos a verificar antes da publicação.

PDF não pode ser julgado só pela aparência

PDF é um formato conveniente que pode ser exibido como papel.

Mas o arquivo PDF pode conter informações além das páginas exibidas.

InformaçãoConteúdoAtenção no anonimato
AutorNome de usuário ou informação do app que criou o documentoAproxima de pessoa ou organização
Data de criaçãoHora de criação e atualizaçãoLiga a horário de ação ou envio
AnotaçõesComentários, marcações, notasMostra processo de edição e pessoas relacionadas
IncorporaçãoAnexos, fontes, imagensDados originais ou ambiente de criação permanecem
Texto ocultoOCR, texto para cópiaInformação supostamente ocultada pode permanecer

Mesmo que a aparência do PDF esteja limpa, isso não garante que a informação interna esteja limpa.

No anonimato, separe a página exibida das informações internas do arquivo.

O que muda e o que fica na conversão para PDF

Ao converter documentos Office ou imagens para PDF, algumas informações mudam.

Mas nem todos os riscos desaparecem.

O que muda na conversãoO que pode permanecer
Documento editável vira exibição fixaAutor, aplicativo de criação, data de criação
Conteúdo vira imagem incorporadaTexto na imagem, fundo, reflexo
Fontes e layout ficam fixosFontes incorporadas e informação do app
Comentários podem desaparecerAnotações ou histórico podem permanecer de outra forma
Parece que foi ocultadoTexto abaixo pode permanecer

Converter para PDF pode ser útil.

Mas “virou PDF” e “a verificação de anonimato acabou” são coisas diferentes.

Ocultação segura e texto oculto

Um risco especialmente sério em PDFs é tentar ocultar informação apenas pela aparência.

Se apenas um retângulo preto for colocado por cima, o texto abaixo pode continuar no arquivo.

Mesmo invisível na tela, o texto original pode aparecer por cópia, busca, extração ou análise interna.

MétodoRisco
Sobrepor uma forma pretaO texto abaixo pode permanecer
Colocar texto na cor do fundoPode aparecer em cópia ou busca
Transformar em captura de telaPerda de qualidade, OCR e fundo ainda trazem riscos
Usar recurso próprio de ocultação seguraExige nova verificação após o processamento

Quando um documento precisa ocultar trechos, use um recurso próprio de remoção ou ocultação segura e, depois, verifique busca, cópia e metadados.

Em documentos de alto risco, considere consultar especialistas ou apoio confiável, em vez de decidir apenas com base em um artigo.

Informações organizacionais em PDFs

Em denúncias ou materiais jornalísticos, informações organizacionais dentro do PDF podem ser um grande problema.

Além do nome do autor, modelos, departamento, caminhos de arquivo, anotações, números de distribuição, marcas d’água e formato de numeração de páginas podem virar pistas.

PistaO que revela
Nome do autorAutor do documento ou conta do dispositivo
Nome da empresaOrganização ou ambiente de criação
ModeloDepartamento ou fluxo de trabalho
Autor da anotaçãoPessoa envolvida na edição
Marca d’água ou número de distribuiçãoOrigem ou destinatário do material

PDF parece “versão final”.

Justamente por isso, vestígios de criação dentro da organização podem permanecer.

Por que é especialmente perigoso em denúncias e materiais de apuração

Em denúncias e materiais de apuração, informações dentro do PDF podem indicar “quem poderia conhecer este material”.

Mesmo sem nome no documento, se escopo de distribuição, hora de atualização, anotações, marca d’água, numeração de páginas, número do documento ou modelo específico de departamento permanecerem, os candidatos se estreitam.

Pista no PDFO que pode ser inferido
Número de distribuiçãoPara qual departamento ou pessoa o material foi distribuído
Marca d’águaInformação para identificar leitor ou destinatário
Nome em anotaçãoRevisor ou pessoa relacionada
Data de atualizaçãoQuem podia trabalhar naquele horário
ModeloOrganização, departamento ou fluxo de trabalho

Essas informações podem não significar nada para leitores comuns, mas são pistas fortes para pessoas de dentro da organização.

No anonimato, pense não só em como estranhos veem, mas também em como pessoas que sabem o contexto veem.

Atenção à extração de texto em PDFs

Mesmo que pareça uma imagem, um PDF pode conter texto interno.

PDFs com OCR podem guardar texto pesquisável por trás da imagem digitalizada.

Mesmo ocultações visuais ou desfocagens feitas na imagem são perigosas se o texto pesquisável ainda contém as palavras originais.

EstadoO que verificar
PDF digitalizadoHá texto OCR embutido?
PDF com trechos ocultadosCópia ou busca revela texto original?
PDF com imagensTexto e fundo dentro das imagens permanecem?
PDF com anotaçõesComentários e anotações podem ser extraídos?
PDF de formulárioCampos e seleções permanecem?

Antes de publicar um PDF, não basta ler a aparência: faça busca, cópia e verificação de metadados.

“Não aparece na tela” não prova segurança.

Ferramentas úteis para verificação

Se você usar serviços online para verificar, converter, ocultar trechos ou remover metadados de PDFs, o arquivo original, nome do arquivo, informações internas e dados de acesso podem ser enviados ao serviço. Em documentos de alto risco, não envie para serviços externos; verifique localmente e reconfirme por outro método depois do processamento.

ExifTool pode ser usado para verificar metadados de PDF.

URL: https://exiftool.org/

qpdf também é uma opção para verificar estrutura e converter PDFs. qpdf é uma ferramenta para trabalhar com a estrutura de arquivos PDF, e o uso pode ser conferido na documentação oficial.

URL: https://qpdf.readthedocs.io/

Mas uma ferramenta não torna o arquivo seguro automaticamente.

É preciso ler o que aparece e verificar novamente depois de remover ou recriar.

Verificação antes da publicação

Antes de publicar um PDF, verifique nesta ordem.

OrdemO que verificarMotivo
1Autor e data de criaçãoVer se ligam à pessoa ou horário de trabalho
2Anotações e comentáriosVer se processo de edição ou pessoas relacionadas ficaram
3Áreas ocultadasVer se o texto abaixo permanece
4Arquivos e imagens incorporadosVer se dados originais ou outros arquivos ficaram
5Nome do arquivoVer se nome, departamento ou caso aparecem
6Reconfirmar após remoçãoVerificar se o processamento funcionou

PDF é um formato fácil de copiar depois de publicado.

Por isso, a verificação antes da publicação é importante.

Decidir não publicar o PDF

Em PDFs de alto risco, remover ou converter pode não bastar.

O próprio conteúdo do material pode estreitar a fonte.

Por exemplo, se permanecer uma linha do tempo conhecida só pelos participantes de uma reunião, abreviações usadas apenas por um departamento ou marcas diferentes por destinatário, os candidatos se estreitam mesmo sem metadados.

Nesse caso, pode ser necessário não publicar o PDF como está, mas resumir o conteúdo, generalizar nomes próprios, pedir que uma consulta confiável veja apenas o necessário ou levar a especialistas e canais de apoio.

No anonimato, limpar o arquivo e poder publicá-lo são coisas diferentes.

Resumo

PDFs parecem seguros por terem aparência fixa, mas podem manter autor, data de criação, anotações, incorporações e texto oculto.

Converter para PDF não completa o anonimato.

Preste atenção especialmente a áreas ocultadas, anotações, informações organizacionais, números de distribuição e nomes de arquivo.

Ferramentas como ExifTool e qpdf ajudam na verificação, mas o nome da ferramenta não determina segurança.

Antes de publicar, verifique aparência, informações internas, nome do arquivo e reconfirmação após remoção.

Ferramentas relacionadas

Metadata inspection

ExifTool

Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.

Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.

URL : https://exiftool.org/

Abrir site externo
Metadata removal

MAT2

Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.

Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.

URL : https://0xacab.org/jvoisin/mat2

Abrir site externo
PDF inspection

qpdf

Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.

Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.

URL : https://qpdf.readthedocs.io/

Abrir site externo

Artigos relacionados