Learn

284 ArtikelKategorie: Alle
Text und Inhalt

Textanonymisierung im KI-Zeitalter

Wenn man anonym schreibt, konnte es früher in manchen Situationen ausreichend wirken, "den bürgerlichen Namen nicht zu schreiben", "den Firmennamen nicht zu schreiben" oder "den Regionsnamen zu verallgemeinern".

Heute reicht das nicht mehr.

Durch Suche, Textanalyse, Zusammenfassungs-KI, Ähnlichkeitssuche für Texte und lange Social-Media-Verläufe werden Schreibgewohnheiten, thematische Schwerpunkte, Zeitlinien von Erfahrungsberichten, Fachgebiete und Überschneidungen mit früheren Beiträgen leichter auffindbar.

Bei Textanonymisierung im KI-Zeitalter reicht es nicht, einzelne Wörter zu entfernen. Man muss prüfen, welche Personendarstellung der ganze Text erzeugt.

Dieser Artikel ordnet, welche Hinweise im KI-Zeitalter aus Text sichtbar werden und wie man vor der Veröffentlichung nacharbeitet.

Auch im KI-Zeitalter bleibt Korrelation die Grundlage

Die Denkweise zu Anonymität hat sich nicht vollständig verändert, nur weil es KI gibt.

Die Grundlage bleibt Korrelation.

Das Problem ist, dass getrennte Informationen mit derselben Person, demselben Arbeitsplatz, derselben Region, demselben früheren Konto oder derselben Aktivität verbunden werden. Durch KI und Suchtechniken ist die Arbeit, solche Korrelationen zu finden, jedoch schneller geworden.

Hinweis im TextWomit er sich verbindetHinweis im KI-Zeitalter
SchreibstilFrühere Beiträge, anderes KontoÄhnliche Schreibweisen lassen sich leichter finden
ThemenBeruf, Region, InteressenAus Langzeitverläufen entsteht ein Personenbild
FachbegriffeZugehörigkeit, AufgabenbereichBranche oder Organisation werden eingegrenzt
ErfahrungsberichtZeitlinie, BeteiligteReihenfolge der Ereignisse wird abgeglichen
Benannte EntitätenPersonenname, Ort, OrganisationSuche liefert leichter Kandidaten

Textanonymisierung im KI-Zeitalter bedeutet nicht, KI zu fürchten.

Es bedeutet, unter der Annahme zu prüfen, dass Korrelationen, die Menschen bei Handarbeit übersehen hätten, maschinell aufgegriffen werden können.

Auch ohne bürgerlichen Namen bleiben Schreibgewohnheiten

Texte haben Eigenheiten.

Häufig verwendete Wörter, Satzlängen, Verknüpfungen, Überschriften, Wahl der Beispiele, Zeichensetzung, Hervorhebungen, Art der Wut und Reihenfolge der Erklärung. Diese Dinge bleiben oft unbewusst erhalten.

EigenheitBeispielHinweis
FormulierungImmer wieder verwendete feste WendungStark, wenn sie mit der Klarnamen-Seite übereinstimmt
AufbauReihenfolge von Einleitung, Beispiel und SchlussÄhnelt sich über den ganzen Artikel
ZeichensetzungKommasetzung, ZeilenumbrücheAuch kleine Eigenheiten summieren sich
Wahl der BeispieleBeispiele aus derselben Branche oder RegionErfahrung wird sichtbar
GefühlsausdruckWut, Ironie, ZuspitzungVerbindet sich mit früheren Beiträgen

Die Einzelheiten von Schreibstilkorrelation werden in einem anderen Artikel behandelt.

Hier ist wichtig: "Nur Wörter auszutauschen ändert den Schreibstil nicht." Bei Anonymisierung betrachtet man nicht nur Eigennamen, sondern auch Textstruktur und Auswahl der Beispiele.

KI-Umschreiben macht nicht automatisch sicher

Wenn man einen Text durch KI umschreiben lässt, kann sich der Schreibstil verändern.

Das bedeutet aber nicht, dass er sicher ist. Die Eingabe an KI enthält den ursprünglichen Text, Eigennamen, interne Informationen, Erfahrungsberichte und Informationen über Beteiligte. Wenn man einen externen Dienst verwendet, vertraut man diesem Dienst.

MethodeWas sich ändertVerbleibendes Problem
Satzenden oder Ton ändernOberflächlicher EindruckThema, Zeitlinie und Fachlichkeit bleiben
KI zusammenfassen lassenTextmenge und AusdruckEingabeinhalt wird nach außen übergeben
Nur Eigennamen entfernenDirekte NennungUmfeldinformationen grenzen Kandidaten ein
Übersetzen und zurückübersetzenTeil des SchreibstilsBedeutung und Wahl der Beispiele bleiben

KI kann eine nützliche Unterstützung sein.

Bei Hochrisikotexten, Whistleblowing, Quellen, unveröffentlichten Unterlagen oder persönlichen Schadensinformationen sollte man jedoch vorsichtig überlegen, ob man sie in einen externen KI-Dienst eingibt. Eingabedienst, Speicherregeln, Konto und Nutzungsumgebung werden zu neuen Vertrauensstellen.

Schichten, die man bei Textanonymisierung prüft

Bei Textanonymisierung betrachtet man mehrere Schichten der Reihe nach.

Nur Wörter, nur Schreibstil oder nur Zeitlinie zu prüfen reicht nicht.

SchichtWas geprüft wirdBeispiel
Direkte IdentifikatorenName, Adresse, OrganisationsnameBürgerlicher Name, Schulname, Firmenname
Quasi-IdentifikatorenRegion, Beruf, Alter, RolleInformationen, die auf wenige Menschen eingrenzen
SchreibstilFormulierungen, Aufbau, EigenheitenGleiche Schreibweise wie auf der Klarnamen-Seite
InhaltErfahrungsbericht, Fachgebiet, InteressenÜberschneidung mit früheren Beiträgen
ZeitZeitpunkt von Ereignissen, VeröffentlichungszeitAbgleich mit realen Aufzeichnungen
Externe ElementeBilder, URLs, DateienInformationen außerhalb des Texts

Wenn man in dieser Reihenfolge prüft, übersieht man weniger.

Nach dem Entfernen von Namen prüft man Beruf und Region. Danach betrachtet man Schreibstil und Zeitlinie. Zuletzt prüft man auch Bilder und Dateien. Textanonymisierung ist ein schrittweises Vorgehen.

Wo Konkretheit bleiben soll

Schwierig an Anonymisierung ist, den Text nicht zu stark auszudünnen.

Wenn alles nur noch als "an einem Ort erlebte eine Person ein Ereignis" beschrieben wird, kann die Anonymität steigen. Den Lesenden wird dann aber nichts vermittelt.

Wichtig ist, die Konkretheit zu trennen, die Lesende brauchen, von der Konkretheit, die näher an die Person heranführt.

ZweckKonkretheit, die bleibtKonkretheit, die gesenkt wird
WarnenFehlermuster, PrüfschritteReale Organisationsnamen, Datumsangaben
BeratungSchwierigkeiten, benötigte UnterstützungSchulname, Arbeitsplatz, Namen Beteiligter
Technische ErklärungMechanismus, Beispiel ohne ReproduzierbarkeitInterne URL, echte Daten
Erfahrung teilenWahrgenommenes Problem, StrukturDetaillierte Zeitlinie, Rollen mit wenigen Personen

Auch im KI-Zeitalter ist gute Anonymisierung kein einfaches Löschen.

Sie erhält Bedeutung und senkt die Genauigkeit, die für Abgleiche genutzt wird.

Vor der Eingabe in KI die Vertrauensstelle bedenken

Bei Textanonymisierung im KI-Zeitalter denkt man vor "KI soll es korrigieren" darüber nach, was man diesem KI-Dienst übergibt.

Wenn der eingegebene Text Arbeitsplatznamen, Namen Beteiligter, interne Umstände, unveröffentlichte Belege, Informationen über Betroffene oder Quellen enthält, werden diese Informationen bereits in diesem Moment an einen externen Dienst übergeben.

Eingegebene InformationWas passiertWas geprüft wird
Persönlicher BeratungstextGewohnte Orte und Beteiligte sind enthaltenOb man dem Eingabedienst vertrauen kann
Entwurf für WhistleblowingOrganisation und Belege sind enthaltenVor externer KI über Beratungsstellen nachdenken
RecherchenotizenQuellen und Kontaktzeitpunkte sind enthaltenOb Hinweisgebende hineingezogen werden
Text zur VeröffentlichungSchreibstil und Eigennamen sind enthaltenVor der Eingabe mindestens grob verallgemeinern

Die Nutzung von KI-Diensten ist nicht an sich schlecht.

Bei Hochrisikotexten entfernt man jedoch vor der Eingabe in KI zunächst lokal Eigennamen und Informationen über Beteiligte. Wenn danach weiter Unsicherheit bleibt, sollte man statt externer KI eher eine vertrauenswürdige Person oder Fachberatung priorisieren.

Veröffentlichte Texte werden weiterverwendet

Ein veröffentlichter Text endet nicht mit der Veröffentlichung.

Er wird von Suchmaschinen erfasst, zitiert, zusammengefasst, als Screenshot gespeichert und an anderen Orten erneut verteilt. Auch nach einer Löschung kann der ursprüngliche Text erhalten bleiben.

Wenn man nach der Veröffentlichung Antworten und Ergänzungen hinzufügt, entstehen neue Hinweise.

Bei Texten, die Anonymität brauchen, verwaltet man nicht nur die Prüfung vor der Veröffentlichung, sondern auch Reaktionen danach. Emotionale Antworten, zusätzliche Erfahrungsberichte, Entgegnungen an Beteiligte und Ergänzungen zur Zeitlinie können stärkere Hinweise werden als der erste Beitrag.

Prüfung vor der Veröffentlichung

Bei Textanonymisierung im KI-Zeitalter prüft man in dieser Reihenfolge.

  1. Direkte Identifikatoren wie Namen, Organisationsnamen und Ortsnamen entfernen
  2. Beruf, Region, Rolle, Alter und Erfahrungsjahre breiter formulieren
  3. Prüfen, ob die Zeitlinie des Erfahrungsberichts zu detailliert ist
  4. Prüfen, ob Schreibstil oder Themen denen des Klarnamenkontos ähneln
  5. Prüfen, ob aus der Kombination mit früheren Beiträgen ein Personenbild entsteht
  6. Auch Bilder, Dateien, URLs und Screenshots prüfen

Wenn unklare Punkte bleiben, veröffentlichen Sie nicht unverändert.

Bei Unklarem geht man zu einer der folgenden Optionen über: weiter verallgemeinern, Veröffentlichung verschieben, nicht veröffentlichen oder eine vertrauenswürdige Person konsultieren.

Zusammenfassung

Bei Textanonymisierung im KI-Zeitalter reicht es nicht, bürgerliche Namen oder Firmennamen zu entfernen.

Wenn Schreibstil, Themen, Fachlichkeit, Erfahrungsberichte, Zeitlinien, frühere Beiträge, Bilder, Dateien und URLs zusammenkommen, führen sie näher an die Person oder Beteiligte heran.

KI und Suchtechniken erleichtern das Auffinden solcher Korrelationen.

Bei Anonymisierung erhält man die für Lesende notwendige Bedeutung, senkt aber die Genauigkeit, die für Abgleiche genutzt wird.

Wichtig ist, nicht nur den Text, sondern auch frühere Informationen und alle Veröffentlichungsgegenstände gemeinsam zu prüfen.

Verwandte Werkzeuge

OSINT directory

OSINT Framework

Eine externe Ressource zu diesem Artikel. Öffne sie nur, wenn sie zu deiner Situation und deinem Bedrohungsmodell passt.

Warum es hier aufgeführt ist: Sie kann beim Thema des Artikels helfen, liegt aber außerhalb von Anonymity Sense und sollte vor der Nutzung geprüft werden.

URL : https://osintframework.com/

Externe Website öffnen

Verwandte Artikel