Texto oculto y comentarios XML
En archivos que vas a publicar, revisar solo la información visible en pantalla no basta.
En SVG, HTML y archivos de tipo XML pueden quedar textos y comentarios que no se muestran.
Aunque visualmente parezca vacío, dentro del archivo pueden quedar notas de trabajo, texto anterior al borrado, nombres, empresas, URL internas y nombres de caso.
En anonimato, hay que revisar no solo la información visible, sino también la información que puede leerse si alguien intenta leerla.
Este artículo ordena cómo el texto oculto y los comentarios XML se vuelven riesgo, y qué revisar antes de publicar.
Qué es texto oculto
Texto oculto es información textual que queda dentro de un archivo de forma invisible o difícil de notar en pantalla.
Incluye texto transparente, texto movido fuera del área visible, capas ocultas, texto extremadamente pequeño y elementos ocultos con CSS.
| Tipo | Apariencia | Contenido |
|---|---|---|
| Texto transparente | No se ve | Queda como cadena de texto |
| Texto fuera de pantalla | Fuera del área visible | Queda con coordenadas |
| Elemento oculto | No se muestra | Queda como etiqueta |
| Texto demasiado pequeño | Difícil de leer | Se encuentra al ampliar o buscar |
| Borrador anterior | Puede no verse | Queda como comentario u otro elemento |
El texto oculto puede quedar sin mala intención.
Notas colocadas durante el trabajo, nombres que se creía borrados, títulos antiguos o el nombre de empresa en una plantilla pueden quedarse en el archivo publicado.
Qué son comentarios XML
Los comentarios XML son notas que se escriben dentro del archivo.
Normalmente no se ven en el navegador, pero pueden leerse si se abre el archivo.
Se escriben con una forma como <!-- comment --> y se usan en SVG, HTML, XML, etc.
| Qué queda en el comentario | Ejemplo | Precaución para el anonimato |
|---|---|---|
| Nota de trabajo | borrar luego nombre de empresa XX | Queda nombre de organización |
| Nombre de responsable | checked by Tanaka | Sale nombre personal |
| URL interna | staging.example | Se ve entorno de desarrollo |
| Nombre de caso | project-alpha | Lo entienden personas relacionadas |
| Texto que se iba a borrar | Explicación original | Queda información que se creía eliminada |
Los comentarios son útiles en desarrollo o producción.
Pero si quedan en un archivo público, información que no se muestra puede ser leída por terceros.
Por qué se relaciona con el anonimato
El texto oculto y los comentarios pueden indicar directamente persona o afiliación.
Además, aunque una información sea débil por sí sola, se combina con otra. Si se cruza con nombre de archivo, persona que publica, hora de publicación, contenido de imagen, URL y publicaciones pasadas, las candidaturas se reducen.
| Información que quedó | Con qué se conecta | Qué ocurre |
|---|---|---|
| Nombre de empresa | Contenido de publicación, profesión | Se infiere afiliación |
| Nombre de autor | Cuenta, archivos pasados | Acerca al nombre real |
| URL interna | Organización o proyecto | Se reducen personas relacionadas |
| Texto de borrador | Relato original | Resucita información borrada |
| Fecha | Hora de publicación, hecho | Se coteja por cronología |
La información invisible es información que quien publica suele pasar por alto.
Por eso debe incluirse en la revisión previa a publicar.
Cómo revisar
La base de la revisión es abrir el archivo como texto.
SVG, HTML y XML pueden abrirse con un editor de texto. Busca nombre, empresa, escuela, correo, URL, marcas de comentario, títulos antiguos y términos internos.
| Método de revisión | Qué mirar | Precaución |
|---|---|---|
| Abrir en editor de texto | Comentarios, etiquetas, cadenas | No decidir solo por la visualización |
| Búsqueda dentro del archivo | Nombre, organización, URL | Buscar varias formas de escritura |
| Ver fuente en navegador | Estructura HTML o SVG | Difiere del resultado renderizado |
| Ampliar visualmente | Texto pequeño y bordes | Revisar también filtraciones visibles |
No basta con buscar tu propio nombre.
Revisa también empresa, departamento, escuela, proyecto, seudónimo antiguo, correo, topónimo y términos internos.
Aunque uses herramientas, revisar a mano
Las herramientas de optimización o eliminación pueden reducir comentarios y metadatos innecesarios.
Si metes un archivo en servicios web de optimización o eliminación, el contenido del archivo e información de acceso pueden pasar al exterior. En publicaciones que requieren anonimato, revisa primero localmente.
Pero no puedes dejarlo todo a herramientas.
El comportamiento depende de la configuración. Las herramientas no sustituyen por completo el juicio sobre qué conservar y qué borrar desde la mirada del anonimato.
| Qué puede reducir una herramienta | Qué mira una persona | Motivo |
|---|---|---|
| Comentarios | Texto dentro de la imagen | La información visible queda |
| Atributos innecesarios | Nombres propios | No juzga significado |
| Metadatos | Contexto | Hay información que solo entienden personas relacionadas |
| Elementos vacíos | Nombre de archivo | La información externa queda aparte |
En publicaciones que requieren anonimato, después de usar herramientas, abre de nuevo el archivo y revísalo.
Borrar comentarios no elimina el contexto
Aunque borres comentarios XML, puede quedar contexto.
Nombres de id, nombres de class, nombres de archivo, nombres de carpeta, URL, texto dentro de imágenes y relato visible están en lugares distintos del comentario.
| Qué se borró | Qué queda | Qué revisar |
|---|---|---|
| Comentario XML | id y class | Si quedan términos internos |
| Nota de trabajo | Nombre de archivo | Si quedan nombre de caso o fecha |
| Texto de borrador | Texto visible | Si aparece en la imagen |
| URL interna | URL referenciada | Revisar enlaces externos y nombres de entorno |
Borrar comentarios es importante, pero no termina el trabajo.
En anonimato, revisa dónde queda trasladada la información.
Especial cuidado en archivos colaborativos
En SVG o HTML hechos por varias personas, es fácil que queden comentarios y texto oculto.
Durante el trabajo pueden entrar nombres de responsables, comentarios de revisión, solicitudes de corrección, términos internos o nombres de cliente.
| Información que queda en colaboración | Ejemplo | Precaución |
|---|---|---|
| Nombre de responsable | reviewed by A | Queda nombre personal |
| Nota de corrección | esto es para empresa XX | Se ve cliente u organización |
| Abreviatura interna | first-team-only | Personas internas lo entienden |
| Versión antigua | Título o logo anterior | Queda información que se creía eliminada |
Si publicas un archivo colaborativo, revisa todo el archivo, no solo la parte que escribiste.
Lo importante no es "yo no lo puse", sino "si queda en el archivo público".
Si el objeto publicado es un zip o una carpeta, revisa todos los archivos incluidos.
Aunque un SVG esté limpio, si un HTML antiguo o README incluido conserva comentarios, por ahí se filtra información.
Resumen
El texto oculto y los comentarios XML son información que queda dentro del archivo aunque no se vea en pantalla.
En SVG, HTML y archivos de tipo XML pueden quedar notas de trabajo, nombres, empresas, URL internas, borradores y nombres de proyecto.
Antes de publicar, revisa no solo la apariencia, sino también el contenido como texto.
No decidas que es seguro solo porque una herramienta lo optimizó.
En anonimato, es importante revisar tanto la información mostrada como la información que queda legible dentro del archivo.
Herramientas relacionadas
ExifTool
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.
URL : https://exiftool.org/
MAT2
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.