Learn

38 artigosCategoria: Tudo
Metadados

Remover metadados de PDF

Cuidados ao remover metadados de PDF

Pensar que um PDF fica seguro ao remover metadados é insuficiente.

Remover metadados é importante. Porém, PDFs também contêm texto, imagens, anotações, links, tarjas, arquivos incorporados, nome de arquivo e configurações de compartilhamento. Mesmo apagando só os metadados, informações que levam a uma pessoa ou organização podem permanecer em outro lugar.

Este artigo organiza como pensar a remoção de metadados de PDF e o que revisar depois.

Criar uma cópia antes de remover

O primeiro passo é não tocar diretamente o arquivo original.

Crie uma cópia pública e faça a remoção ou conversão nessa cópia. O original pode precisar manter histórico de edição ou valor de prova. Em consultas, denúncias ou procedimentos legais, trate o original com cuidado.

AlvoTratamentoMotivo
Arquivo originalGuardar em local seguroPara prova e nova revisão
Cópia públicaRemover metadados ou converterPreparar para publicação
Pasta de trabalhoEvitar nomes pessoais ou de casoReduzir vazamento por caminho de arquivo
Destino de compartilhamentoManter ao mínimo necessárioEvitar difusão desnecessária
RegistroManter o que foi removidoPermitir revisão posterior

Remover metadados é parte do trabalho.

Pense também em gestão do original, cópia pública e destino de compartilhamento.

Informações a remover ou revisar

Há vários tipos de informação a revisar ou remover em um PDF.

InformaçãoRiscoComo revisar
AutorNome pessoal ou usuário do sistema apareceVer propriedades do documento
EmpresaOrganização afiliada apareceRevisar propriedades e Office original
Data de criaçãoLiga-se ao horário de atividadeVer propriedades
AnotaçõesComentários ou conversas internas aparecemVer lista de anotações
Arquivos embutidosMateriais originais se misturamRevisar anexos e estrutura
FormuláriosInformações digitadas permanecemRevisar campos de formulário

Se o PDF foi criado a partir de Office, revise também o lado Office.

Mesmo que o PDF pareça limpo, o arquivo original pode manter autor ou histórico.

Revisar novamente após remover

Depois de usar uma ferramenta de remoção, sempre revise de novo.

Mesmo achando que removeu metadados, informações podem ficar em anotações, links, imagens, texto ou áreas tarjadas.

O que revisarMotivo
Propriedades do documentoVer se autor e título sumiram
Busca no textoVer se palavras ocultas aparecem
Cópia de textoVer se texto sob tarja pode ser copiado
Lista de anotaçõesVer se comentários permanecem
LinksVer se há IDs pessoais ou URLs internas
Nome do arquivoVer se há nome real ou organização

Não relaxe apenas porque executou a remoção.

Abra o arquivo final em outro ambiente e revise novamente.

Ferramentas são apoio

Ferramentas locais como ExifTool podem ser usadas para revisar ou converter PDFs.

ExifTool é uma ferramenta representativa para revisar metadados em vários formatos.

URL : https://exiftool.org/

Mas ferramentas não são universais.

Elas ajudam a revisar e remover informações internas, mas não verificam sozinhas informações escritas no texto, fundos de imagens, notificações em screenshots ou nomes de proprietário em links.

O que ferramentas fazemO que não cobrem sozinhas
Revisar metadadosInformações específicas no texto
Remover alguns metadadosSegurança da tarja
Revisar estrutura do arquivoFundos e reflexos em imagens
Converter formatoLogs e proprietário de compartilhamento
Automatizar processamentoJulgamento legal de alto risco

Em documentos de alto risco, não decida publicar apenas pelo resultado da ferramenta.

Há informações que não devem ser removidas

Olhando só o anonimato, pode parecer melhor apagar tudo.

Mas, em consultas sobre dano, denúncias internas ou consultas legais, certas informações devem ser preservadas como prova. Data de criação, histórico de edição e rota de envio do original podem ser importantes depois.

InformaçãoPara publicaçãoPara consulta ou prova
Data de criaçãoConsiderar borrar ou removerPode ser registro necessário
AutorRemover antes de publicarPode ser mantido no original
HistóricoRemover da cópia públicaPode explicar o processo
AnotaçõesRemover da cópia públicaPodem registrar revisões internas
Arquivo originalNão publicarGuardar em local seguro

É por isso que arquivo público e original guardado devem ser separados.

A remoção necessária para proteger o anonimato e a preservação necessária para proteger provas precisam ser pensadas juntas.

Nome e local depois da remoção

Mesmo removendo metadados, nome do arquivo e local de armazenamento podem revelar informação.

Por exemplo, o nome pode conter nome real, empresa ou caso. Um link de nuvem pode mostrar o proprietário de uma conta de nome real. O nome da pasta de trabalho pode aparecer em screenshot. Isso deve ser revisado separadamente.

O que revisarMotivo
Nome do arquivoEvitar nomes reais, organizações e casos
Nome da pastaPode aparecer em compartilhamento de tela ou compactação
Proprietário na nuvemLiga a uma conta de nome real
URL compartilhadaPode conter ID pessoal ou rastreamento
Hora de envioPode ser comparada com registros de atividade

No fim do processo, veja o estado com olhos de terceiros.

Mesmo parecendo seguro no seu dispositivo, quem recebe pode ver proprietário, prévia, cartão de link ou nome de arquivo. Se possível, revise o estado final em outro navegador ou ambiente.

Na revisão posterior, não olhe só metadados.

Revise nomes próprios no texto, fundos de imagens, destinos de links, nomes de arquivos e nomes exibidos no destino de upload. A remoção deve vir junto com a revisão do objeto final inteiro.

Registrar a remoção

Em documentos de alto risco, registrar o que foi removido e o que ficou facilita revisão posterior.

Mas esse registro também exige cuidado. Se for salvo em nuvem de nome real ou dispositivo de trabalho, vira pista que liga você ao material.

O que registrarCuidados
Itens removidosNão incluir no arquivo público
Itens mantidosPoder explicar por que ficaram
Local do originalLimitar a local seguro
Nome do arquivo públicoNão incluir informação pessoal
Data de revisãoCuidado com correlação com registros de atividade

Remover informações é parte da decisão de publicação.

Verificar depois por outro método

A remoção de metadados não termina quando é executada.

Verifique por método diferente do usado para remover. Veja propriedades, selecione e copie texto, abra em outro visualizador ou baixe em outro ambiente. Várias formas de olhar ajudam a perceber falhas e diferenças de exibição.

MétodoProblemas que revela
Ver propriedadesAutor, título, software de criação
Selecionar e copiar textoTexto sob tarja, texto oculto
Abrir em outro visualizadorAnotações ou formulários restantes
Revisar em outro ambienteProprietário ou exibição de compartilhamento
Reler o textoNomes próprios ou vazamentos de contexto

Nesse trabalho, o estado final publicado importa mais que a mensagem de sucesso da ferramenta.

No anonimato, "achei que removi" é especialmente perigoso. Depois de remover, revise como aparece no ambiente de quem recebe.

Resumo

Remover metadados de PDF é importante, mas não torna o arquivo seguro sozinho.

Não publique o original diretamente. Crie uma cópia pública e revise autor, empresa, data, anotações, embutidos, formulários e links.

Depois de remover, revise propriedades, busca, cópia de texto, anotações e nome de arquivo.

Ferramentas são apoio.

Texto, imagens, tarjas, destinos de compartilhamento e riscos legais devem ser revisados separadamente.

Ferramentas relacionadas

Archive check

Wayback Machine

Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.

Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.

URL : https://web.archive.org/

Abrir site externo
Metadata inspection

ExifTool

Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.

Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.

URL : https://exiftool.org/

Abrir site externo
Metadata removal

MAT2

Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.

Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.

URL : https://0xacab.org/jvoisin/mat2

Abrir site externo
PDF inspection

qpdf

Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.

Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.

URL : https://qpdf.readthedocs.io/

Abrir site externo

Artigos relacionados