Textanonymisierung im KI-Zeitalter

Text und Inhalt

Textanonymisierung im KI-Zeitalter

Wenn man anonym schreibt, konnte es früher in manchen Situationen ausreichend wirken, "den bürgerlichen Namen nicht zu schreiben", "den Firmennamen nicht zu schreiben" oder "den Regionsnamen zu verallgemeinern".

Heute reicht das nicht mehr.

Durch Suche, Textanalyse, Zusammenfassungs-KI, Ähnlichkeitssuche für Texte und lange Social-Media-Verläufe werden Schreibgewohnheiten, thematische Schwerpunkte, Zeitlinien von Erfahrungsberichten, Fachgebiete und Überschneidungen mit früheren Beiträgen leichter auffindbar.

Bei Textanonymisierung im KI-Zeitalter reicht es nicht, einzelne Wörter zu entfernen. Man muss prüfen, welche Personendarstellung der ganze Text erzeugt.

Dieser Artikel ordnet, welche Hinweise im KI-Zeitalter aus Text sichtbar werden und wie man vor der Veröffentlichung nacharbeitet.

Auch im KI-Zeitalter bleibt Korrelation die Grundlage

Die Denkweise zu Anonymität hat sich nicht vollständig verändert, nur weil es KI gibt.

Die Grundlage bleibt Korrelation.

Das Problem ist, dass getrennte Informationen mit derselben Person, demselben Arbeitsplatz, derselben Region, demselben früheren Konto oder derselben Aktivität verbunden werden. Durch KI und Suchtechniken ist die Arbeit, solche Korrelationen zu finden, jedoch schneller geworden.

Hinweis im Text	Womit er sich verbindet	Hinweis im KI-Zeitalter
Schreibstil	Frühere Beiträge, anderes Konto	Ähnliche Schreibweisen lassen sich leichter finden
Themen	Beruf, Region, Interessen	Aus Langzeitverläufen entsteht ein Personenbild
Fachbegriffe	Zugehörigkeit, Aufgabenbereich	Branche oder Organisation werden eingegrenzt
Erfahrungsbericht	Zeitlinie, Beteiligte	Reihenfolge der Ereignisse wird abgeglichen
Benannte Entitäten	Personenname, Ort, Organisation	Suche liefert leichter Kandidaten

Textanonymisierung im KI-Zeitalter bedeutet nicht, KI zu fürchten.

Es bedeutet, unter der Annahme zu prüfen, dass Korrelationen, die Menschen bei Handarbeit übersehen hätten, maschinell aufgegriffen werden können.

Auch ohne bürgerlichen Namen bleiben Schreibgewohnheiten

Texte haben Eigenheiten.

Häufig verwendete Wörter, Satzlängen, Verknüpfungen, Überschriften, Wahl der Beispiele, Zeichensetzung, Hervorhebungen, Art der Wut und Reihenfolge der Erklärung. Diese Dinge bleiben oft unbewusst erhalten.

Eigenheit	Beispiel	Hinweis
Formulierung	Immer wieder verwendete feste Wendung	Stark, wenn sie mit der Klarnamen-Seite übereinstimmt
Aufbau	Reihenfolge von Einleitung, Beispiel und Schluss	Ähnelt sich über den ganzen Artikel
Zeichensetzung	Kommasetzung, Zeilenumbrüche	Auch kleine Eigenheiten summieren sich
Wahl der Beispiele	Beispiele aus derselben Branche oder Region	Erfahrung wird sichtbar
Gefühlsausdruck	Wut, Ironie, Zuspitzung	Verbindet sich mit früheren Beiträgen

Die Einzelheiten von Schreibstilkorrelation werden in einem anderen Artikel behandelt.

Hier ist wichtig: "Nur Wörter auszutauschen ändert den Schreibstil nicht." Bei Anonymisierung betrachtet man nicht nur Eigennamen, sondern auch Textstruktur und Auswahl der Beispiele.

KI-Umschreiben macht nicht automatisch sicher

Wenn man einen Text durch KI umschreiben lässt, kann sich der Schreibstil verändern.

Das bedeutet aber nicht, dass er sicher ist. Die Eingabe an KI enthält den ursprünglichen Text, Eigennamen, interne Informationen, Erfahrungsberichte und Informationen über Beteiligte. Wenn man einen externen Dienst verwendet, vertraut man diesem Dienst.

Methode	Was sich ändert	Verbleibendes Problem
Satzenden oder Ton ändern	Oberflächlicher Eindruck	Thema, Zeitlinie und Fachlichkeit bleiben
KI zusammenfassen lassen	Textmenge und Ausdruck	Eingabeinhalt wird nach außen übergeben
Nur Eigennamen entfernen	Direkte Nennung	Umfeldinformationen grenzen Kandidaten ein
Übersetzen und zurückübersetzen	Teil des Schreibstils	Bedeutung und Wahl der Beispiele bleiben

KI kann eine nützliche Unterstützung sein.

Bei Hochrisikotexten, Whistleblowing, Quellen, unveröffentlichten Unterlagen oder persönlichen Schadensinformationen sollte man jedoch vorsichtig überlegen, ob man sie in einen externen KI-Dienst eingibt. Eingabedienst, Speicherregeln, Konto und Nutzungsumgebung werden zu neuen Vertrauensstellen.

Schichten, die man bei Textanonymisierung prüft

Bei Textanonymisierung betrachtet man mehrere Schichten der Reihe nach.

Nur Wörter, nur Schreibstil oder nur Zeitlinie zu prüfen reicht nicht.

Schicht	Was geprüft wird	Beispiel
Direkte Identifikatoren	Name, Adresse, Organisationsname	Bürgerlicher Name, Schulname, Firmenname
Quasi-Identifikatoren	Region, Beruf, Alter, Rolle	Informationen, die auf wenige Menschen eingrenzen
Schreibstil	Formulierungen, Aufbau, Eigenheiten	Gleiche Schreibweise wie auf der Klarnamen-Seite
Inhalt	Erfahrungsbericht, Fachgebiet, Interessen	Überschneidung mit früheren Beiträgen
Zeit	Zeitpunkt von Ereignissen, Veröffentlichungszeit	Abgleich mit realen Aufzeichnungen
Externe Elemente	Bilder, URLs, Dateien	Informationen außerhalb des Texts

Wenn man in dieser Reihenfolge prüft, übersieht man weniger.

Nach dem Entfernen von Namen prüft man Beruf und Region. Danach betrachtet man Schreibstil und Zeitlinie. Zuletzt prüft man auch Bilder und Dateien. Textanonymisierung ist ein schrittweises Vorgehen.

Wo Konkretheit bleiben soll

Schwierig an Anonymisierung ist, den Text nicht zu stark auszudünnen.

Wenn alles nur noch als "an einem Ort erlebte eine Person ein Ereignis" beschrieben wird, kann die Anonymität steigen. Den Lesenden wird dann aber nichts vermittelt.

Wichtig ist, die Konkretheit zu trennen, die Lesende brauchen, von der Konkretheit, die näher an die Person heranführt.

Zweck	Konkretheit, die bleibt	Konkretheit, die gesenkt wird
Warnen	Fehlermuster, Prüfschritte	Reale Organisationsnamen, Datumsangaben
Beratung	Schwierigkeiten, benötigte Unterstützung	Schulname, Arbeitsplatz, Namen Beteiligter
Technische Erklärung	Mechanismus, Beispiel ohne Reproduzierbarkeit	Interne URL, echte Daten
Erfahrung teilen	Wahrgenommenes Problem, Struktur	Detaillierte Zeitlinie, Rollen mit wenigen Personen

Auch im KI-Zeitalter ist gute Anonymisierung kein einfaches Löschen.

Sie erhält Bedeutung und senkt die Genauigkeit, die für Abgleiche genutzt wird.

Vor der Eingabe in KI die Vertrauensstelle bedenken

Bei Textanonymisierung im KI-Zeitalter denkt man vor "KI soll es korrigieren" darüber nach, was man diesem KI-Dienst übergibt.

Wenn der eingegebene Text Arbeitsplatznamen, Namen Beteiligter, interne Umstände, unveröffentlichte Belege, Informationen über Betroffene oder Quellen enthält, werden diese Informationen bereits in diesem Moment an einen externen Dienst übergeben.

Eingegebene Information	Was passiert	Was geprüft wird
Persönlicher Beratungstext	Gewohnte Orte und Beteiligte sind enthalten	Ob man dem Eingabedienst vertrauen kann
Entwurf für Whistleblowing	Organisation und Belege sind enthalten	Vor externer KI über Beratungsstellen nachdenken
Recherchenotizen	Quellen und Kontaktzeitpunkte sind enthalten	Ob Hinweisgebende hineingezogen werden
Text zur Veröffentlichung	Schreibstil und Eigennamen sind enthalten	Vor der Eingabe mindestens grob verallgemeinern

Die Nutzung von KI-Diensten ist nicht an sich schlecht.

Bei Hochrisikotexten entfernt man jedoch vor der Eingabe in KI zunächst lokal Eigennamen und Informationen über Beteiligte. Wenn danach weiter Unsicherheit bleibt, sollte man statt externer KI eher eine vertrauenswürdige Person oder Fachberatung priorisieren.

Veröffentlichte Texte werden weiterverwendet

Ein veröffentlichter Text endet nicht mit der Veröffentlichung.

Er wird von Suchmaschinen erfasst, zitiert, zusammengefasst, als Screenshot gespeichert und an anderen Orten erneut verteilt. Auch nach einer Löschung kann der ursprüngliche Text erhalten bleiben.

Wenn man nach der Veröffentlichung Antworten und Ergänzungen hinzufügt, entstehen neue Hinweise.

Bei Texten, die Anonymität brauchen, verwaltet man nicht nur die Prüfung vor der Veröffentlichung, sondern auch Reaktionen danach. Emotionale Antworten, zusätzliche Erfahrungsberichte, Entgegnungen an Beteiligte und Ergänzungen zur Zeitlinie können stärkere Hinweise werden als der erste Beitrag.

Prüfung vor der Veröffentlichung

Bei Textanonymisierung im KI-Zeitalter prüft man in dieser Reihenfolge.

Direkte Identifikatoren wie Namen, Organisationsnamen und Ortsnamen entfernen
Beruf, Region, Rolle, Alter und Erfahrungsjahre breiter formulieren
Prüfen, ob die Zeitlinie des Erfahrungsberichts zu detailliert ist
Prüfen, ob Schreibstil oder Themen denen des Klarnamenkontos ähneln
Prüfen, ob aus der Kombination mit früheren Beiträgen ein Personenbild entsteht
Auch Bilder, Dateien, URLs und Screenshots prüfen

Wenn unklare Punkte bleiben, veröffentlichen Sie nicht unverändert.

Bei Unklarem geht man zu einer der folgenden Optionen über: weiter verallgemeinern, Veröffentlichung verschieben, nicht veröffentlichen oder eine vertrauenswürdige Person konsultieren.

Zusammenfassung

Bei Textanonymisierung im KI-Zeitalter reicht es nicht, bürgerliche Namen oder Firmennamen zu entfernen.

Wenn Schreibstil, Themen, Fachlichkeit, Erfahrungsberichte, Zeitlinien, frühere Beiträge, Bilder, Dateien und URLs zusammenkommen, führen sie näher an die Person oder Beteiligte heran.

KI und Suchtechniken erleichtern das Auffinden solcher Korrelationen.

Bei Anonymisierung erhält man die für Lesende notwendige Bedeutung, senkt aber die Genauigkeit, die für Abgleiche genutzt wird.

Wichtig ist, nicht nur den Text, sondern auch frühere Informationen und alle Veröffentlichungsgegenstände gemeinsam zu prüfen.

OSINT Framework

Eine externe Ressource zu diesem Artikel. Öffne sie nur, wenn sie zu deiner Situation und deinem Bedrohungsmodell passt.

Warum es hier aufgeführt ist: Sie kann beim Thema des Artikels helfen, liegt aber außerhalb von Anonymity Sense und sollte vor der Nutzung geprüft werden.

URL : https://osintframework.com/

Externe Website öffnen

Learn