Learn

284 artigosCategoria: Tudo
Metadados

Texto oculto e comentários XML

Em arquivos que serão publicados, verificar apenas as informações visíveis na tela é insuficiente.

Arquivos SVG, HTML e baseados em XML podem manter texto e comentários que não aparecem na exibição.

Mesmo quando parece haver espaço vazio, dentro do arquivo podem permanecer notas de trabalho, texto antes da remoção, nomes, empresas, URLs internas e nomes de projeto.

No anonimato, é necessário verificar não só informações visíveis, mas também informações que podem ser lidas por quem tentar.

Este artigo organiza como texto oculto e comentários XML viram risco, e o que verificar antes de publicar.

O que é texto oculto

Texto oculto é informação textual que permanece no arquivo de forma invisível ou difícil de perceber na tela.

Inclui texto transparente, texto movido para fora da tela, camadas ocultas, texto extremamente pequeno e elementos ocultados por CSS.

TipoAparênciaConteúdo
Texto transparenteNão aparecePermanece como string
Texto fora da telaFora da área visívelPermanece com coordenadas
Elemento ocultoNão é exibidoPermanece como tag
Texto pequeno demaisDifícil de lerEncontrado por zoom ou busca
Rascunho antes da remoçãoPode não aparecerPermanece como comentário ou outro elemento

Texto oculto permanece mesmo sem má intenção.

Notas deixadas durante o trabalho, nomes que se achou ter apagado, títulos antigos e nomes de empresa no modelo podem permanecer no arquivo publicado.

O que é comentário XML

Comentário XML é uma anotação escrita dentro do arquivo.

Normalmente, não aparece na visualização do navegador. Mas pode ser lida ao abrir o arquivo.

Ele é escrito em forma como <!-- comment --> e usado em SVG, HTML, XML e outros.

O que permanece no comentárioExemploCuidados para anonimato
Nota de trabalhoapagar depois o nome da empresa XNome de organização permanece
Nome de responsávelchecked by TanakaNome pessoal aparece
URL internastaging.exampleAmbiente de desenvolvimento aparece
Nome de projetoproject-alphaPessoas relacionadas entendem
Texto a apagarTexto originalInformação achada apagada permanece

Comentários são úteis em desenvolvimento e produção.

Mas se permanecem em arquivos publicados, informações invisíveis são lidas por terceiros.

Por que isso se relaciona ao anonimato

Texto oculto e comentários podem indicar diretamente a pessoa ou o vínculo.

Além disso, mesmo informações fracas isoladamente se combinam com outras. Quando se sobrepõem a nome de arquivo, pessoa que publicou, horário de publicação, conteúdo da imagem, URL e postagens antigas, candidatos se estreitam.

Informação restanteCom o que se ligaO que acontece
Nome de empresaConteúdo da postagem, profissãoVínculo é inferido
Nome de autorConta, arquivos antigosAproxima do nome real
URL internaOrganização ou projetoPessoas relacionadas se estreitam
Texto de rascunhoRelato originalInformação apagada volta
DataHorário de postagem, eventoComparação por linha do tempo

Informações invisíveis são fáceis de a pessoa que publica deixar passar.

Por isso, elas devem entrar na verificação antes de publicar.

Como verificar

A base da verificação é abrir o arquivo como texto.

SVG, HTML e XML podem ser abertos em editor de texto. Busque nome, empresa, escola, email, URL, marca de comentário, título antigo e termos internos.

Método de verificaçãoO que observarCuidado
Abrir em editor de textoComentários, tags, stringsNão julgar só pela exibição
Buscar dentro do arquivoNome, organização, URLBuscar várias grafias
Ver código-fonte no navegadorEstrutura de HTML e SVGDifere do resultado renderizado
Ampliar visualmenteTexto pequeno, borda da telaConfirmar vazamentos visíveis também

Buscar apenas seu nome não basta.

Verifique também empresa, departamento, escola, projeto, nome de usuário antigo, email, lugar e termos internos.

Mesmo usando ferramenta, verificar manualmente

Ferramentas de otimização ou remoção podem reduzir comentários e metadados desnecessários.

Ao colocar arquivos em serviços Web de otimização ou remoção, conteúdo do arquivo e informações de acesso podem passar para fora. Em publicações que exigem anonimato, verifique primeiro localmente.

Ainda assim, não dá para depender só da ferramenta.

Ferramentas mudam conforme configuração. Elas não substituem totalmente o julgamento, pelo ponto de vista do anonimato, do que deve permanecer e do que deve ser removido.

O que ferramenta pode reduzirO que humanos verificamMotivo
ComentáriosTexto dentro da imagemInformação visual permanece
Atributos desnecessáriosNomes própriosNão julga o significado
MetadadosContextoHá informações que só pessoas relacionadas entendem
Elementos vaziosNome de arquivoInformações externas permanecem separadas

Em publicações que exigem anonimato, abra e verifique novamente o arquivo depois da ferramenta.

Apagar comentários não remove contexto

Mesmo apagando comentários XML, pistas contextuais podem permanecer.

Nomes de id, class, arquivo, pasta, URL, texto na imagem e relatos no corpo do texto ficam em lugares diferentes dos comentários.

O que foi apagadoO que permaneceO que verificar
Comentário XMLid e classSe termos internos permanecem
Nota de trabalhoNome de arquivoSe projeto ou data permanecem
Texto de rascunhoTexto exibidoSe não aparece dentro da imagem
URL internaURL de referênciaVer links externos e nomes de ambiente

Remover comentários é importante, mas não termina a tarefa.

No anonimato, verifique onde cada informação se desloca e permanece.

Cuidado especial em arquivos colaborativos

SVGs e HTML criados por várias pessoas tendem a manter comentários e textos ocultos.

Nomes de responsáveis, comentários de revisão, pedidos de correção, termos internos e nomes de clientes podem entrar durante o trabalho.

Informação que permanece em colaboraçãoExemploCuidado
Nome de responsávelreviewed by ANome pessoal permanece
Nota de correçãoisto é para a empresa XCliente ou organização aparece
Sigla internafirst-team-onlyPessoas internas entendem
Versão antigaTítulo antigo, logo antigoInformação achada apagada permanece

Ao publicar um arquivo colaborativo, verifique o arquivo inteiro, não só a parte que você escreveu.

O importante não é "eu não inseri", mas "permanece no arquivo publicado".

Se o alvo de publicação é um zip ou uma pasta, verifique todos os arquivos incluídos.

Mesmo que um SVG esteja limpo, se um HTML ou README antigo incluído mantém comentários, a informação vaza por ali.

Resumo

Texto oculto e comentários XML são informações que não aparecem na tela, mas permanecem no arquivo.

Em arquivos SVG, HTML e XML, notas de trabalho, nomes, empresas, URLs internas, rascunhos e nomes de projeto podem permanecer.

Antes de publicar, confirme não só a aparência, mas também o conteúdo como texto.

Mesmo otimizando com ferramentas, não julgue que isso é seguro por si só.

No anonimato, é importante verificar tanto a informação exibida quanto a informação que permanece legível dentro do arquivo.

Ferramentas relacionadas

Metadata inspection

ExifTool

Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.

Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.

URL : https://exiftool.org/

Abrir site externo
Metadata removal

MAT2

Recurso externo relacionado a este artigo. Abra apenas se fizer sentido para sua situação e seu modelo de ameaça.

Por que aparece aqui: Pode ajudar com o tema do artigo, mas fica fora do Anonymity Sense e deve ser avaliado antes do uso.

URL : https://0xacab.org/jvoisin/mat2

Abrir site externo

Artigos relacionados