Wenn man anonym schreibt, konnte es früher in manchen Situationen ausreichend wirken, "den bürgerlichen Namen nicht zu schreiben", "den Firmennamen nicht zu schreiben" oder "den Regionsnamen zu verallgemeinern".
Heute reicht das nicht mehr.
Durch Suche, Textanalyse, Zusammenfassungs-KI, Ähnlichkeitssuche für Texte und lange Social-Media-Verläufe werden Schreibgewohnheiten, thematische Schwerpunkte, Zeitlinien von Erfahrungsberichten, Fachgebiete und Überschneidungen mit früheren Beiträgen leichter auffindbar.
Bei Textanonymisierung im KI-Zeitalter reicht es nicht, einzelne Wörter zu entfernen. Man muss prüfen, welche Personendarstellung der ganze Text erzeugt.
Dieser Artikel ordnet, welche Hinweise im KI-Zeitalter aus Text sichtbar werden und wie man vor der Veröffentlichung nacharbeitet.
Auch im KI-Zeitalter bleibt Korrelation die Grundlage
Die Denkweise zu Anonymität hat sich nicht vollständig verändert, nur weil es KI gibt.
Die Grundlage bleibt Korrelation.
Das Problem ist, dass getrennte Informationen mit derselben Person, demselben Arbeitsplatz, derselben Region, demselben früheren Konto oder derselben Aktivität verbunden werden. Durch KI und Suchtechniken ist die Arbeit, solche Korrelationen zu finden, jedoch schneller geworden.
Hinweis im Text
Womit er sich verbindet
Hinweis im KI-Zeitalter
Schreibstil
Frühere Beiträge, anderes Konto
Ähnliche Schreibweisen lassen sich leichter finden
Themen
Beruf, Region, Interessen
Aus Langzeitverläufen entsteht ein Personenbild
Fachbegriffe
Zugehörigkeit, Aufgabenbereich
Branche oder Organisation werden eingegrenzt
Erfahrungsbericht
Zeitlinie, Beteiligte
Reihenfolge der Ereignisse wird abgeglichen
Benannte Entitäten
Personenname, Ort, Organisation
Suche liefert leichter Kandidaten
Textanonymisierung im KI-Zeitalter bedeutet nicht, KI zu fürchten.
Es bedeutet, unter der Annahme zu prüfen, dass Korrelationen, die Menschen bei Handarbeit übersehen hätten, maschinell aufgegriffen werden können.
Auch ohne bürgerlichen Namen bleiben Schreibgewohnheiten
Texte haben Eigenheiten.
Häufig verwendete Wörter, Satzlängen, Verknüpfungen, Überschriften, Wahl der Beispiele, Zeichensetzung, Hervorhebungen, Art der Wut und Reihenfolge der Erklärung. Diese Dinge bleiben oft unbewusst erhalten.
Eigenheit
Beispiel
Hinweis
Formulierung
Immer wieder verwendete feste Wendung
Stark, wenn sie mit der Klarnamen-Seite übereinstimmt
Aufbau
Reihenfolge von Einleitung, Beispiel und Schluss
Ähnelt sich über den ganzen Artikel
Zeichensetzung
Kommasetzung, Zeilenumbrüche
Auch kleine Eigenheiten summieren sich
Wahl der Beispiele
Beispiele aus derselben Branche oder Region
Erfahrung wird sichtbar
Gefühlsausdruck
Wut, Ironie, Zuspitzung
Verbindet sich mit früheren Beiträgen
Die Einzelheiten von Schreibstilkorrelation werden in einem anderen Artikel behandelt.
Hier ist wichtig: "Nur Wörter auszutauschen ändert den Schreibstil nicht." Bei Anonymisierung betrachtet man nicht nur Eigennamen, sondern auch Textstruktur und Auswahl der Beispiele.
KI-Umschreiben macht nicht automatisch sicher
Wenn man einen Text durch KI umschreiben lässt, kann sich der Schreibstil verändern.
Das bedeutet aber nicht, dass er sicher ist. Die Eingabe an KI enthält den ursprünglichen Text, Eigennamen, interne Informationen, Erfahrungsberichte und Informationen über Beteiligte. Wenn man einen externen Dienst verwendet, vertraut man diesem Dienst.
Methode
Was sich ändert
Verbleibendes Problem
Satzenden oder Ton ändern
Oberflächlicher Eindruck
Thema, Zeitlinie und Fachlichkeit bleiben
KI zusammenfassen lassen
Textmenge und Ausdruck
Eingabeinhalt wird nach außen übergeben
Nur Eigennamen entfernen
Direkte Nennung
Umfeldinformationen grenzen Kandidaten ein
Übersetzen und zurückübersetzen
Teil des Schreibstils
Bedeutung und Wahl der Beispiele bleiben
KI kann eine nützliche Unterstützung sein.
Bei Hochrisikotexten, Whistleblowing, Quellen, unveröffentlichten Unterlagen oder persönlichen Schadensinformationen sollte man jedoch vorsichtig überlegen, ob man sie in einen externen KI-Dienst eingibt. Eingabedienst, Speicherregeln, Konto und Nutzungsumgebung werden zu neuen Vertrauensstellen.
Schichten, die man bei Textanonymisierung prüft
Bei Textanonymisierung betrachtet man mehrere Schichten der Reihe nach.
Nur Wörter, nur Schreibstil oder nur Zeitlinie zu prüfen reicht nicht.
Schicht
Was geprüft wird
Beispiel
Direkte Identifikatoren
Name, Adresse, Organisationsname
Bürgerlicher Name, Schulname, Firmenname
Quasi-Identifikatoren
Region, Beruf, Alter, Rolle
Informationen, die auf wenige Menschen eingrenzen
Schreibstil
Formulierungen, Aufbau, Eigenheiten
Gleiche Schreibweise wie auf der Klarnamen-Seite
Inhalt
Erfahrungsbericht, Fachgebiet, Interessen
Überschneidung mit früheren Beiträgen
Zeit
Zeitpunkt von Ereignissen, Veröffentlichungszeit
Abgleich mit realen Aufzeichnungen
Externe Elemente
Bilder, URLs, Dateien
Informationen außerhalb des Texts
Wenn man in dieser Reihenfolge prüft, übersieht man weniger.
Nach dem Entfernen von Namen prüft man Beruf und Region. Danach betrachtet man Schreibstil und Zeitlinie. Zuletzt prüft man auch Bilder und Dateien. Textanonymisierung ist ein schrittweises Vorgehen.
Wo Konkretheit bleiben soll
Schwierig an Anonymisierung ist, den Text nicht zu stark auszudünnen.
Wenn alles nur noch als "an einem Ort erlebte eine Person ein Ereignis" beschrieben wird, kann die Anonymität steigen. Den Lesenden wird dann aber nichts vermittelt.
Wichtig ist, die Konkretheit zu trennen, die Lesende brauchen, von der Konkretheit, die näher an die Person heranführt.
Zweck
Konkretheit, die bleibt
Konkretheit, die gesenkt wird
Warnen
Fehlermuster, Prüfschritte
Reale Organisationsnamen, Datumsangaben
Beratung
Schwierigkeiten, benötigte Unterstützung
Schulname, Arbeitsplatz, Namen Beteiligter
Technische Erklärung
Mechanismus, Beispiel ohne Reproduzierbarkeit
Interne URL, echte Daten
Erfahrung teilen
Wahrgenommenes Problem, Struktur
Detaillierte Zeitlinie, Rollen mit wenigen Personen
Auch im KI-Zeitalter ist gute Anonymisierung kein einfaches Löschen.
Sie erhält Bedeutung und senkt die Genauigkeit, die für Abgleiche genutzt wird.
Vor der Eingabe in KI die Vertrauensstelle bedenken
Bei Textanonymisierung im KI-Zeitalter denkt man vor "KI soll es korrigieren" darüber nach, was man diesem KI-Dienst übergibt.
Wenn der eingegebene Text Arbeitsplatznamen, Namen Beteiligter, interne Umstände, unveröffentlichte Belege, Informationen über Betroffene oder Quellen enthält, werden diese Informationen bereits in diesem Moment an einen externen Dienst übergeben.
Eingegebene Information
Was passiert
Was geprüft wird
Persönlicher Beratungstext
Gewohnte Orte und Beteiligte sind enthalten
Ob man dem Eingabedienst vertrauen kann
Entwurf für Whistleblowing
Organisation und Belege sind enthalten
Vor externer KI über Beratungsstellen nachdenken
Recherchenotizen
Quellen und Kontaktzeitpunkte sind enthalten
Ob Hinweisgebende hineingezogen werden
Text zur Veröffentlichung
Schreibstil und Eigennamen sind enthalten
Vor der Eingabe mindestens grob verallgemeinern
Die Nutzung von KI-Diensten ist nicht an sich schlecht.
Bei Hochrisikotexten entfernt man jedoch vor der Eingabe in KI zunächst lokal Eigennamen und Informationen über Beteiligte. Wenn danach weiter Unsicherheit bleibt, sollte man statt externer KI eher eine vertrauenswürdige Person oder Fachberatung priorisieren.
Veröffentlichte Texte werden weiterverwendet
Ein veröffentlichter Text endet nicht mit der Veröffentlichung.
Er wird von Suchmaschinen erfasst, zitiert, zusammengefasst, als Screenshot gespeichert und an anderen Orten erneut verteilt. Auch nach einer Löschung kann der ursprüngliche Text erhalten bleiben.
Wenn man nach der Veröffentlichung Antworten und Ergänzungen hinzufügt, entstehen neue Hinweise.
Bei Texten, die Anonymität brauchen, verwaltet man nicht nur die Prüfung vor der Veröffentlichung, sondern auch Reaktionen danach. Emotionale Antworten, zusätzliche Erfahrungsberichte, Entgegnungen an Beteiligte und Ergänzungen zur Zeitlinie können stärkere Hinweise werden als der erste Beitrag.
Prüfung vor der Veröffentlichung
Bei Textanonymisierung im KI-Zeitalter prüft man in dieser Reihenfolge.
Direkte Identifikatoren wie Namen, Organisationsnamen und Ortsnamen entfernen
Beruf, Region, Rolle, Alter und Erfahrungsjahre breiter formulieren
Prüfen, ob die Zeitlinie des Erfahrungsberichts zu detailliert ist
Prüfen, ob Schreibstil oder Themen denen des Klarnamenkontos ähneln
Prüfen, ob aus der Kombination mit früheren Beiträgen ein Personenbild entsteht
Auch Bilder, Dateien, URLs und Screenshots prüfen
Wenn unklare Punkte bleiben, veröffentlichen Sie nicht unverändert.
Bei Unklarem geht man zu einer der folgenden Optionen über: weiter verallgemeinern, Veröffentlichung verschieben, nicht veröffentlichen oder eine vertrauenswürdige Person konsultieren.
Zusammenfassung
Bei Textanonymisierung im KI-Zeitalter reicht es nicht, bürgerliche Namen oder Firmennamen zu entfernen.
Wenn Schreibstil, Themen, Fachlichkeit, Erfahrungsberichte, Zeitlinien, frühere Beiträge, Bilder, Dateien und URLs zusammenkommen, führen sie näher an die Person oder Beteiligte heran.
KI und Suchtechniken erleichtern das Auffinden solcher Korrelationen.
Bei Anonymisierung erhält man die für Lesende notwendige Bedeutung, senkt aber die Genauigkeit, die für Abgleiche genutzt wird.
Wichtig ist, nicht nur den Text, sondern auch frühere Informationen und alle Veröffentlichungsgegenstände gemeinsam zu prüfen.
Verwandte Werkzeuge
OSINT directory
OSINT Framework
Eine externe Ressource zu diesem Artikel. Öffne sie nur, wenn sie zu deiner Situation und deinem Bedrohungsmodell passt.
Warum es hier aufgeführt ist: Sie kann beim Thema des Artikels helfen, liegt aber außerhalb von Anonymity Sense und sollte vor der Nutzung geprüft werden.
Im KI-Zeitalter müssen neben Namen auch Schreibstil, Themen, Fachlichkeit, Zeitlinien, frühere Beiträge, Bilder, Dateien und URLs gemeinsam geprüft werden.