Learn

284 artículosCategoría: Todo
Metadatos

Texto oculto y comentarios XML

En archivos que vas a publicar, revisar solo la información visible en pantalla no basta.

En SVG, HTML y archivos de tipo XML pueden quedar textos y comentarios que no se muestran.

Aunque visualmente parezca vacío, dentro del archivo pueden quedar notas de trabajo, texto anterior al borrado, nombres, empresas, URL internas y nombres de caso.

En anonimato, hay que revisar no solo la información visible, sino también la información que puede leerse si alguien intenta leerla.

Este artículo ordena cómo el texto oculto y los comentarios XML se vuelven riesgo, y qué revisar antes de publicar.

Qué es texto oculto

Texto oculto es información textual que queda dentro de un archivo de forma invisible o difícil de notar en pantalla.

Incluye texto transparente, texto movido fuera del área visible, capas ocultas, texto extremadamente pequeño y elementos ocultos con CSS.

TipoAparienciaContenido
Texto transparenteNo se veQueda como cadena de texto
Texto fuera de pantallaFuera del área visibleQueda con coordenadas
Elemento ocultoNo se muestraQueda como etiqueta
Texto demasiado pequeñoDifícil de leerSe encuentra al ampliar o buscar
Borrador anteriorPuede no verseQueda como comentario u otro elemento

El texto oculto puede quedar sin mala intención.

Notas colocadas durante el trabajo, nombres que se creía borrados, títulos antiguos o el nombre de empresa en una plantilla pueden quedarse en el archivo publicado.

Qué son comentarios XML

Los comentarios XML son notas que se escriben dentro del archivo.

Normalmente no se ven en el navegador, pero pueden leerse si se abre el archivo.

Se escriben con una forma como <!-- comment --> y se usan en SVG, HTML, XML, etc.

Qué queda en el comentarioEjemploPrecaución para el anonimato
Nota de trabajoborrar luego nombre de empresa XXQueda nombre de organización
Nombre de responsablechecked by TanakaSale nombre personal
URL internastaging.exampleSe ve entorno de desarrollo
Nombre de casoproject-alphaLo entienden personas relacionadas
Texto que se iba a borrarExplicación originalQueda información que se creía eliminada

Los comentarios son útiles en desarrollo o producción.

Pero si quedan en un archivo público, información que no se muestra puede ser leída por terceros.

Por qué se relaciona con el anonimato

El texto oculto y los comentarios pueden indicar directamente persona o afiliación.

Además, aunque una información sea débil por sí sola, se combina con otra. Si se cruza con nombre de archivo, persona que publica, hora de publicación, contenido de imagen, URL y publicaciones pasadas, las candidaturas se reducen.

Información que quedóCon qué se conectaQué ocurre
Nombre de empresaContenido de publicación, profesiónSe infiere afiliación
Nombre de autorCuenta, archivos pasadosAcerca al nombre real
URL internaOrganización o proyectoSe reducen personas relacionadas
Texto de borradorRelato originalResucita información borrada
FechaHora de publicación, hechoSe coteja por cronología

La información invisible es información que quien publica suele pasar por alto.

Por eso debe incluirse en la revisión previa a publicar.

Cómo revisar

La base de la revisión es abrir el archivo como texto.

SVG, HTML y XML pueden abrirse con un editor de texto. Busca nombre, empresa, escuela, correo, URL, marcas de comentario, títulos antiguos y términos internos.

Método de revisiónQué mirarPrecaución
Abrir en editor de textoComentarios, etiquetas, cadenasNo decidir solo por la visualización
Búsqueda dentro del archivoNombre, organización, URLBuscar varias formas de escritura
Ver fuente en navegadorEstructura HTML o SVGDifiere del resultado renderizado
Ampliar visualmenteTexto pequeño y bordesRevisar también filtraciones visibles

No basta con buscar tu propio nombre.

Revisa también empresa, departamento, escuela, proyecto, seudónimo antiguo, correo, topónimo y términos internos.

Aunque uses herramientas, revisar a mano

Las herramientas de optimización o eliminación pueden reducir comentarios y metadatos innecesarios.

Si metes un archivo en servicios web de optimización o eliminación, el contenido del archivo e información de acceso pueden pasar al exterior. En publicaciones que requieren anonimato, revisa primero localmente.

Pero no puedes dejarlo todo a herramientas.

El comportamiento depende de la configuración. Las herramientas no sustituyen por completo el juicio sobre qué conservar y qué borrar desde la mirada del anonimato.

Qué puede reducir una herramientaQué mira una personaMotivo
ComentariosTexto dentro de la imagenLa información visible queda
Atributos innecesariosNombres propiosNo juzga significado
MetadatosContextoHay información que solo entienden personas relacionadas
Elementos vacíosNombre de archivoLa información externa queda aparte

En publicaciones que requieren anonimato, después de usar herramientas, abre de nuevo el archivo y revísalo.

Borrar comentarios no elimina el contexto

Aunque borres comentarios XML, puede quedar contexto.

Nombres de id, nombres de class, nombres de archivo, nombres de carpeta, URL, texto dentro de imágenes y relato visible están en lugares distintos del comentario.

Qué se borróQué quedaQué revisar
Comentario XMLid y classSi quedan términos internos
Nota de trabajoNombre de archivoSi quedan nombre de caso o fecha
Texto de borradorTexto visibleSi aparece en la imagen
URL internaURL referenciadaRevisar enlaces externos y nombres de entorno

Borrar comentarios es importante, pero no termina el trabajo.

En anonimato, revisa dónde queda trasladada la información.

Especial cuidado en archivos colaborativos

En SVG o HTML hechos por varias personas, es fácil que queden comentarios y texto oculto.

Durante el trabajo pueden entrar nombres de responsables, comentarios de revisión, solicitudes de corrección, términos internos o nombres de cliente.

Información que queda en colaboraciónEjemploPrecaución
Nombre de responsablereviewed by AQueda nombre personal
Nota de correcciónesto es para empresa XXSe ve cliente u organización
Abreviatura internafirst-team-onlyPersonas internas lo entienden
Versión antiguaTítulo o logo anteriorQueda información que se creía eliminada

Si publicas un archivo colaborativo, revisa todo el archivo, no solo la parte que escribiste.

Lo importante no es "yo no lo puse", sino "si queda en el archivo público".

Si el objeto publicado es un zip o una carpeta, revisa todos los archivos incluidos.

Aunque un SVG esté limpio, si un HTML antiguo o README incluido conserva comentarios, por ahí se filtra información.

Resumen

El texto oculto y los comentarios XML son información que queda dentro del archivo aunque no se vea en pantalla.

En SVG, HTML y archivos de tipo XML pueden quedar notas de trabajo, nombres, empresas, URL internas, borradores y nombres de proyecto.

Antes de publicar, revisa no solo la apariencia, sino también el contenido como texto.

No decidas que es seguro solo porque una herramienta lo optimizó.

En anonimato, es importante revisar tanto la información mostrada como la información que queda legible dentro del archivo.

Herramientas relacionadas

Metadata inspection

ExifTool

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://exiftool.org/

Abrir sitio externo
Metadata removal

MAT2

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://0xacab.org/jvoisin/mat2

Abrir sitio externo

Artículos relacionados