Learn

284 artículosCategoría: Todo
Texto y contenido

Anonimización de textos en la era de la IA

Al escribir de forma anónima, antes a veces parecía suficiente no escribir el nombre real, no escribir el nombre de la empresa y difuminar topónimos.

Ahora eso no basta.

La búsqueda, el análisis de textos, la IA de resumen, la búsqueda de textos similares y los historiales largos en SNS hacen más fácil encontrar hábitos de escritura, sesgos de tema, cronologías de experiencias, especialidades y solapamientos con publicaciones pasadas.

En la anonimización de textos en la era de la IA no basta con borrar palabras; hay que revisar "qué figura de persona construye el texto completo".

Este artículo ordena qué pistas se ven desde un texto en la era de la IA y cómo prepararlo antes de publicar.

Incluso en la era de la IA, la base es la correlación

La existencia de IA no significa que la forma de pensar el anonimato haya cambiado por completo.

La base sigue siendo la correlación.

El problema es que información separada se conecte con la misma persona, el mismo lugar de trabajo, la misma región, la misma cuenta pasada o la misma actividad. Lo que cambió con IA y tecnologías de búsqueda es la velocidad con que se encuentran esas correlaciones.

Pista dentro del textoCon qué se conectaPrecaución en la era de la IA
EstiloPublicaciones pasadas, otra cuentaEs más fácil encontrar formas de escribir similares
TemaProfesión, región, interesesSe construye una figura personal desde el historial largo
Términos técnicosAfiliación, área responsableSe estrechan sector u organización
Relato de experienciaCronología, personas relacionadasSe coteja el orden de acontecimientos
Expresiones propiasPersonas, lugares, organizacionesLa búsqueda muestra candidaturas con facilidad

La anonimización de textos en la era de la IA no consiste en tener miedo de la IA.

Consiste en revisar asumiendo que las correlaciones que una persona podía pasar por alto manualmente pueden recogerse de forma mecánica.

Aunque borres el nombre real, quedan hábitos de escritura

Los textos tienen hábitos.

Palabras frecuentes, longitud de frases, forma de conectar ideas, forma de titular, elección de ejemplos, puntuación, énfasis, forma de enfadarse, orden de explicación. Todo esto queda sin que la persona lo note.

HábitoEjemploPrecaución
Giro de expresiónFrase hecha que usas siempreEs fuerte si se solapa con el lado de nombre real
EstructuraOrden de introducción, ejemplo y conclusiónSe parece a nivel de artículo completo
PuntuaciónForma de poner comas y saltos de líneaLos hábitos pequeños se acumulan
Elección de ejemplosEjemplos del mismo sector o regiónSale la experiencia
Expresión emocionalEnfado, ironía, afirmacionesSe conecta con publicaciones pasadas

La correlación por estilo de escritura se trata con más detalle en otro artículo.

Aquí lo importante es que "cambiar palabras no cambia el estilo". En anonimización no se miran solo nombres propios, sino también la estructura del texto y la forma de elegir ejemplos.

Pedir a una IA que reescriba no lo vuelve seguro

Si pides a una IA que reescriba el texto, el estilo puede cambiar.

Pero eso no permite decir que sea seguro. La entrada a la IA incluye el texto original, nombres propios, información interna, relatos de experiencia e información de personas relacionadas. Si introduces el texto en un servicio externo, pasas a confiar en ese servicio.

MétodoQué cambiaProblema que queda
Cambiar terminacionesImpresión superficialQuedan tema, cronología y especialidad
Pedir resumen a IAExtensión y expresiónEntregas el contenido a un externo
Quitar solo nombres propiosMenciones directasLa información alrededor estrecha candidaturas
Traducir y volverParte del estiloQuedan significado y elección de ejemplos

La IA puede ser una ayuda útil.

Sin embargo, hay que pensar con cuidado antes de introducir en un servicio externo de IA textos de alto riesgo, denuncias internas, fuentes, materiales no publicados o información de daños personales. El servicio de destino, su política de almacenamiento, la cuenta y el entorno de uso se convierten en nuevas partes de confianza.

Capas que mirar en la anonimización de textos

En la anonimización de textos se miran varias capas en orden.

No basta con mirar solo palabras, solo estilo o solo cronología.

CapaQué comprobarEjemplo
Identificadores directosNombre, dirección, organizaciónNombre real, escuela, empresa
CuasiidentificadoresRegión, profesión, edad, cargoInformación que reduce a pocas personas
EstiloGiros, estructura, hábitosMisma forma de escribir que el lado de nombre real
ContenidoRelatos, especialidad, interesesSolapamiento con publicaciones pasadas
TiempoÉpoca de hechos, hora de publicaciónSe coteja con registros físicos
Elementos externosImagen, URL, archivoInformación fuera del texto

Mirar en este orden reduce omisiones.

Después de borrar nombres, comprueba profesión y región. Luego mira estilo y cronología. Por último, revisa también imágenes y archivos. La anonimización de textos es un trabajo gradual.

Dónde dejar la concreción

Lo difícil de anonimizar es no volver demasiado débil el texto.

Si escribes todo como "en un lugar, una persona vivió un acontecimiento", el anonimato quizá suba. Pero el lector no entenderá nada.

Lo importante es separar la concreción necesaria para el lector de la concreción que acerca a la persona.

ObjetivoConcreción que se dejaConcreción que se baja
AdvertenciaTipo de fallo, procedimiento de comprobaciónNombre real de organización, fecha
ConsultaProblema, apoyo necesarioNombre de escuela, trabajo, personas relacionadas
Explicación técnicaMecanismo, ejemplo que no permite reproducirURL interna, datos reales
Compartir experienciaProblema sentido, estructuraCronología detallada, cargos con pocas personas

Incluso en la era de la IA, una buena anonimización no es simple eliminación.

Conserva el sentido y baja la precisión que sirve para cotejar.

Pensar en la parte de confianza antes de introducir en IA

En la anonimización de textos en la era de la IA, antes de "pedir a la IA que lo arregle", piensa qué entregarás a ese servicio de IA.

Si el texto introducido contiene nombre del trabajo, nombres de personas relacionadas, asuntos internos, pruebas no publicadas, información de víctimas o fuentes, en ese momento ya estás entregando información a un servicio externo.

Información introducidaQué ocurreQué comprobar
Texto de consulta personalIncluye lugares rutinarios o personas relacionadasSi puedes confiar en el servicio de destino
Borrador de denuncia internaIncluye organización y pruebasPensar el punto de consulta antes de usar IA externa
Notas de coberturaIncluyen fuente y momento de contactoSi no implicas a la fuente
Texto previsto para publicarIncluye estilo y nombres propiosDifuminar lo mínimo antes de introducir

Usar un servicio de IA no es malo en sí.

Pero en textos de alto riesgo, antes de introducirlos en IA elimina localmente nombres propios e información de personas relacionadas. Si aun así queda inquietud, prioriza consultar con una persona confiable o especialista antes que usar una IA externa.

El texto publicado se reutiliza después

Un texto publicado no termina en ese momento.

Lo recoge la búsqueda, se cita, se resume, se captura en pantalla y se redistribuye en otros lugares. Aunque lo elimines después, el texto original puede quedar.

Si después de publicar añades respuestas o complementos, se agregan nuevas pistas.

En textos que necesitan anonimato, gestiona no solo la previa a la publicación, sino también las reacciones posteriores. Respuestas emocionales, relatos adicionales, refutaciones a personas relacionadas y complementos de cronología pueden convertirse en pistas más fuertes que la primera publicación.

Revisión antes de publicar

En la anonimización de textos en la era de la IA, revisa en este orden.

  1. Borrar identificadores directos como nombres, organizaciones y topónimos
  2. Convertir profesión, región, cargo, edad y años de experiencia en expresiones más amplias
  3. Comprobar si el relato saca con demasiado detalle la cronología
  4. Mirar si el estilo o los temas coinciden con la cuenta de nombre real
  5. Comprobar si, combinado con publicaciones pasadas, se construye una figura personal
  6. Revisar también imágenes, archivos, URL y capturas de pantalla

Si quedan elementos sobre los que no puedes decidir, no publiques tal cual.

Lo que no entiendes debe pasar a una de estas opciones: difuminar más, retrasar la publicación, no publicar o consultar con alguien confiable.

Resumen

En la anonimización de textos en la era de la IA, borrar el nombre real o el nombre de la empresa no basta.

Cuando se combinan estilo, temas, especialidad, relatos, cronología, publicaciones pasadas, imágenes, archivos y URL, se acercan a la persona o a quienes la rodean.

La IA y las tecnologías de búsqueda hacen más fácil encontrar estas correlaciones.

En anonimización, conserva el sentido necesario para el lector mientras bajas la precisión que sirve para cotejar.

Es importante revisar no solo el texto, sino también información pasada y todo el material publicado.

Herramientas relacionadas

OSINT directory

OSINT Framework

Recurso externo relacionado con este artículo. Ábrelo solo si encaja con tu situación y tu modelo de amenaza.

Por qué aparece aquí: Puede ayudar con el tema del artículo, pero está fuera de Anonymity Sense y conviene revisarlo antes de usarlo.

URL : https://osintframework.com/

Abrir sitio externo

Artículos relacionados