Anonimización de textos en la era de la IA
Al escribir de forma anónima, antes a veces parecía suficiente no escribir el nombre real, no escribir el nombre de la empresa y difuminar topónimos.
Ahora eso no basta.
La búsqueda, el análisis de textos, la IA de resumen, la búsqueda de textos similares y los historiales largos en SNS hacen más fácil encontrar hábitos de escritura, sesgos de tema, cronologías de experiencias, especialidades y solapamientos con publicaciones pasadas.
En la anonimización de textos en la era de la IA no basta con borrar palabras; hay que revisar "qué figura de persona construye el texto completo".
Este artículo ordena qué pistas se ven desde un texto en la era de la IA y cómo prepararlo antes de publicar.
Incluso en la era de la IA, la base es la correlación
La existencia de IA no significa que la forma de pensar el anonimato haya cambiado por completo.
La base sigue siendo la correlación.
El problema es que información separada se conecte con la misma persona, el mismo lugar de trabajo, la misma región, la misma cuenta pasada o la misma actividad. Lo que cambió con IA y tecnologías de búsqueda es la velocidad con que se encuentran esas correlaciones.
| Pista dentro del texto | Con qué se conecta | Precaución en la era de la IA |
|---|---|---|
| Estilo | Publicaciones pasadas, otra cuenta | Es más fácil encontrar formas de escribir similares |
| Tema | Profesión, región, intereses | Se construye una figura personal desde el historial largo |
| Términos técnicos | Afiliación, área responsable | Se estrechan sector u organización |
| Relato de experiencia | Cronología, personas relacionadas | Se coteja el orden de acontecimientos |
| Expresiones propias | Personas, lugares, organizaciones | La búsqueda muestra candidaturas con facilidad |
La anonimización de textos en la era de la IA no consiste en tener miedo de la IA.
Consiste en revisar asumiendo que las correlaciones que una persona podía pasar por alto manualmente pueden recogerse de forma mecánica.
Aunque borres el nombre real, quedan hábitos de escritura
Los textos tienen hábitos.
Palabras frecuentes, longitud de frases, forma de conectar ideas, forma de titular, elección de ejemplos, puntuación, énfasis, forma de enfadarse, orden de explicación. Todo esto queda sin que la persona lo note.
| Hábito | Ejemplo | Precaución |
|---|---|---|
| Giro de expresión | Frase hecha que usas siempre | Es fuerte si se solapa con el lado de nombre real |
| Estructura | Orden de introducción, ejemplo y conclusión | Se parece a nivel de artículo completo |
| Puntuación | Forma de poner comas y saltos de línea | Los hábitos pequeños se acumulan |
| Elección de ejemplos | Ejemplos del mismo sector o región | Sale la experiencia |
| Expresión emocional | Enfado, ironía, afirmaciones | Se conecta con publicaciones pasadas |
La correlación por estilo de escritura se trata con más detalle en otro artículo.
Aquí lo importante es que "cambiar palabras no cambia el estilo". En anonimización no se miran solo nombres propios, sino también la estructura del texto y la forma de elegir ejemplos.
Pedir a una IA que reescriba no lo vuelve seguro
Si pides a una IA que reescriba el texto, el estilo puede cambiar.
Pero eso no permite decir que sea seguro. La entrada a la IA incluye el texto original, nombres propios, información interna, relatos de experiencia e información de personas relacionadas. Si introduces el texto en un servicio externo, pasas a confiar en ese servicio.
| Método | Qué cambia | Problema que queda |
|---|---|---|
| Cambiar terminaciones | Impresión superficial | Quedan tema, cronología y especialidad |
| Pedir resumen a IA | Extensión y expresión | Entregas el contenido a un externo |
| Quitar solo nombres propios | Menciones directas | La información alrededor estrecha candidaturas |
| Traducir y volver | Parte del estilo | Quedan significado y elección de ejemplos |
La IA puede ser una ayuda útil.
Sin embargo, hay que pensar con cuidado antes de introducir en un servicio externo de IA textos de alto riesgo, denuncias internas, fuentes, materiales no publicados o información de daños personales. El servicio de destino, su política de almacenamiento, la cuenta y el entorno de uso se convierten en nuevas partes de confianza.
Capas que mirar en la anonimización de textos
En la anonimización de textos se miran varias capas en orden.
No basta con mirar solo palabras, solo estilo o solo cronología.
| Capa | Qué comprobar | Ejemplo |
|---|---|---|
| Identificadores directos | Nombre, dirección, organización | Nombre real, escuela, empresa |
| Cuasiidentificadores | Región, profesión, edad, cargo | Información que reduce a pocas personas |
| Estilo | Giros, estructura, hábitos | Misma forma de escribir que el lado de nombre real |
| Contenido | Relatos, especialidad, intereses | Solapamiento con publicaciones pasadas |
| Tiempo | Época de hechos, hora de publicación | Se coteja con registros físicos |
| Elementos externos | Imagen, URL, archivo | Información fuera del texto |
Mirar en este orden reduce omisiones.
Después de borrar nombres, comprueba profesión y región. Luego mira estilo y cronología. Por último, revisa también imágenes y archivos. La anonimización de textos es un trabajo gradual.
Dónde dejar la concreción
Lo difícil de anonimizar es no volver demasiado débil el texto.
Si escribes todo como "en un lugar, una persona vivió un acontecimiento", el anonimato quizá suba. Pero el lector no entenderá nada.
Lo importante es separar la concreción necesaria para el lector de la concreción que acerca a la persona.
| Objetivo | Concreción que se deja | Concreción que se baja |
|---|---|---|
| Advertencia | Tipo de fallo, procedimiento de comprobación | Nombre real de organización, fecha |
| Consulta | Problema, apoyo necesario | Nombre de escuela, trabajo, personas relacionadas |
| Explicación técnica | Mecanismo, ejemplo que no permite reproducir | URL interna, datos reales |
| Compartir experiencia | Problema sentido, estructura | Cronología detallada, cargos con pocas personas |
Incluso en la era de la IA, una buena anonimización no es simple eliminación.
Conserva el sentido y baja la precisión que sirve para cotejar.
Pensar en la parte de confianza antes de introducir en IA
En la anonimización de textos en la era de la IA, antes de "pedir a la IA que lo arregle", piensa qué entregarás a ese servicio de IA.
Si el texto introducido contiene nombre del trabajo, nombres de personas relacionadas, asuntos internos, pruebas no publicadas, información de víctimas o fuentes, en ese momento ya estás entregando información a un servicio externo.
| Información introducida | Qué ocurre | Qué comprobar |
|---|---|---|
| Texto de consulta personal | Incluye lugares rutinarios o personas relacionadas | Si puedes confiar en el servicio de destino |
| Borrador de denuncia interna | Incluye organización y pruebas | Pensar el punto de consulta antes de usar IA externa |
| Notas de cobertura | Incluyen fuente y momento de contacto | Si no implicas a la fuente |
| Texto previsto para publicar | Incluye estilo y nombres propios | Difuminar lo mínimo antes de introducir |
Usar un servicio de IA no es malo en sí.
Pero en textos de alto riesgo, antes de introducirlos en IA elimina localmente nombres propios e información de personas relacionadas. Si aun así queda inquietud, prioriza consultar con una persona confiable o especialista antes que usar una IA externa.
El texto publicado se reutiliza después
Un texto publicado no termina en ese momento.
Lo recoge la búsqueda, se cita, se resume, se captura en pantalla y se redistribuye en otros lugares. Aunque lo elimines después, el texto original puede quedar.
Si después de publicar añades respuestas o complementos, se agregan nuevas pistas.
En textos que necesitan anonimato, gestiona no solo la previa a la publicación, sino también las reacciones posteriores. Respuestas emocionales, relatos adicionales, refutaciones a personas relacionadas y complementos de cronología pueden convertirse en pistas más fuertes que la primera publicación.
Revisión antes de publicar
En la anonimización de textos en la era de la IA, revisa en este orden.
- Borrar identificadores directos como nombres, organizaciones y topónimos
- Convertir profesión, región, cargo, edad y años de experiencia en expresiones más amplias
- Comprobar si el relato saca con demasiado detalle la cronología
- Mirar si el estilo o los temas coinciden con la cuenta de nombre real
- Comprobar si, combinado con publicaciones pasadas, se construye una figura personal
- Revisar también imágenes, archivos, URL y capturas de pantalla
Si quedan elementos sobre los que no puedes decidir, no publiques tal cual.
Lo que no entiendes debe pasar a una de estas opciones: difuminar más, retrasar la publicación, no publicar o consultar con alguien confiable.
Resumen
En la anonimización de textos en la era de la IA, borrar el nombre real o el nombre de la empresa no basta.
Cuando se combinan estilo, temas, especialidad, relatos, cronología, publicaciones pasadas, imágenes, archivos y URL, se acercan a la persona o a quienes la rodean.
La IA y las tecnologías de búsqueda hacen más fácil encontrar estas correlaciones.
En anonimización, conserva el sentido necesario para el lector mientras bajas la precisión que sirve para cotejar.
Es importante revisar no solo el texto, sino también información pasada y todo el material publicado.
Herramientas relacionadas
OSINT Framework
Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.
Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.