Learn

284 статейКатегория: Все
Текст и содержание

Анонимизация текста в эпоху AI

Когда человек писал анонимно, раньше иногда казалось, что достаточно «не писать настоящее имя», «не писать название компании» и «обобщить регион».

Сейчас этого недостаточно.

Поиск, анализ текста, AI-суммаризация, поиск похожих текстов и долгие истории в соцсетях упрощают обнаружение особенностей письма, перекоса тем, хронологии личного опыта, экспертной области и совпадений с прошлыми публикациями.

В эпоху AI анонимизация текста требует не только удалять слова, но и проверять, «какой образ человека создает весь текст».

В этой статье разобрано, какие признаки видны из текста в эпоху AI и как готовить текст перед публикацией.

В эпоху AI основа все равно корреляция

Наличие AI не означает, что подход к анонимности полностью изменился.

Основа — корреляция.

Проблема в том, что разные сведения связываются с одним человеком, одной работой, одним регионом, одним прошлым аккаунтом или одной активностью. Но AI и поисковые технологии ускорили работу по поиску таких корреляций.

Признак в текстеС чем связываетсяОсторожность эпохи AI
Стиль письмаПрошлые публикации, другой аккаунтЛегче находить похожую манеру письма
ТемаПрофессия, регион, интересыПо долгой истории строится образ человека
Специальные терминыПринадлежность, область ответственностиСужаются отрасль или организация
Личный опытХронология, связанные людиСверяется порядок событий
Имена собственныеИмена людей, места, организацииПоиск легче выдает кандидатов

Анонимизация текста в эпоху AI — это не страх перед AI.

Это проверка с предположением, что корреляции, которые человек вручную мог пропустить, будут собираться механически.

Даже после удаления настоящего имени остается стиль

У текста есть привычки.

Часто используемые слова, длина фраз, способ связывать мысли, заголовки, выбор примеров, пунктуация, акценты, манера злиться, порядок объяснения. Все это остается, даже если человек не осознает.

ПривычкаПримерОсторожность
ОборотыПостоянно используемые фразыСильны при совпадении со стороной настоящего имени
СтруктураПорядок введения, примера и выводаПохожа на уровне всего текста
ПунктуацияРасстановка точек, переносы строкДаже мелкие привычки накапливаются
Выбор примеровПримеры из той же отрасли или регионаВыходит опыт
Эмоциональные выраженияЗлость, ирония, категоричностьСвязываются с прошлыми публикациями

Подробно о стилевой корреляции говорится в другой статье.

Здесь важно то, что простая замена слов не меняет стиль письма. При анонимизации смотрят не только имена собственные, но и структуру текста и выбор примеров.

Переписать через AI не значит сделать безопасным

Если попросить AI переписать текст, стиль может измениться.

Но одного этого недостаточно для безопасности. В вводе для AI содержатся исходный текст, имена собственные, внутренняя информация, личный опыт и сведения о связанных людях. Если это внешний сервис, вы начинаете доверять этому сервису.

СпособЧто меняетсяЧто остается проблемой
Поменять окончанияПоверхностное впечатлениеТема, хронология и экспертность остаются
Попросить AI сократитьОбъем и выраженияСодержание ввода передается наружу
Удалить только имена собственныеПрямое называниеКандидаты сужаются по окружающей информации
Перевести и вернуть обратноЧасть стиляСмысл и выбор примеров остаются

AI может быть удобной помощью.

Но высокорисковые тексты, сообщения о нарушениях, сведения об источнике, неопубликованные материалы и персональные сведения о вреде стоит очень осторожно вводить во внешний AI-сервис. Сервис ввода, политика хранения, аккаунт и среда использования становятся новой доверенной стороной.

Слои, которые нужно смотреть при анонимизации текста

При анонимизации текста смотрят несколько слоев по порядку.

Недостаточно проверять только слова, только стиль или только хронологию.

СлойЧто проверятьПример
Прямые идентификаторыИмя, адрес, название организацииНастоящее имя, школа, компания
КвазиидентификаторыРегион, профессия, возраст, должностьИнформация, сужающая до малого числа людей
СтильОбороты, структура, привычкиТа же манера, что на стороне настоящего имени
СодержаниеЛичный опыт, экспертная область, интересыСовпадение с прошлыми публикациями
ВремяПериод события, время публикацииСверяется с записями реального мира
Внешние элементыИзображения, URL, файлыИнформация вне текста

Такой порядок уменьшает пропуски.

После удаления имен проверяют профессию и регион. Затем смотрят стиль и хронологию. В конце проверяют изображения и файлы. Анонимизация текста — поэтапная работа.

Где оставлять конкретность

Сложность анонимизации в том, чтобы не сделать текст слишком пустым.

Если написать все как «в одном месте один человек пережил одно событие», анонимность может усилиться. Но читатель ничего не поймет.

Важно разделять конкретность, нужную читателю, и конкретность, приближающую к человеку.

ЦельКакую конкретность оставитьКакую конкретность убрать
ПредупреждениеТип ошибки, порядок проверкиРеальные названия организаций, даты
КонсультацияТрудность, нужная поддержкаНазвание школы, работы, имена связанных людей
Техническое объяснениеМеханизм, пример без воспроизведенияВнутренние URL, реальные данные
Обмен опытомОщущаемая проблема, структураДетальная хронология, малочисленные должности

Даже в эпоху AI хорошая анонимизация — не простое удаление.

Она сохраняет смысл и снижает точность, используемую для сверки.

Подумать о доверенной стороне перед вводом в AI

В эпоху AI перед фразой «пусть AI исправит» сначала думают, что будет передано этому AI-сервису.

Если в тексте есть название работы, имена связанных людей, внутренние обстоятельства, неопубликованные доказательства, сведения о пострадавших или об источнике, уже сам ввод передает эту информацию внешнему сервису.

Вводимая информацияЧто происходитЧто проверять
Личный текст консультацииСодержит привычные места и связанных людейМожно ли доверять сервису ввода
Черновик сообщения о нарушенияхСодержит организацию и доказательстваПодумать о консультации до внешнего AI
Журналистские заметкиСодержат источник и время контактаНе вовлекает ли это информатора
Текст перед публикациейСодержит стиль и имена собственныеМинимально обобщить до ввода

Само использование AI-сервиса не обязательно плохо.

Но в высокорисковых текстах перед вводом в AI сначала локально удаляют имена собственные и сведения о связанных людях. Если тревога остается, предпочтите не внешний AI, а консультацию с надежным человеком или специалистом.

После публикации текст тоже переиспользуется

Опубликованный текст не заканчивается в момент публикации.

Он попадает в поиск, цитируется, суммаризируется, превращается в скриншоты и распространяется в других местах. Даже после удаления исходный текст может остаться.

Если после публикации добавлять ответы и уточнения, появляются новые признаки.

Для текста, которому нужна анонимность, управляют не только состоянием до публикации, но и реакциями после нее. Эмоциональные ответы, дополнительные личные истории, возражения связанным людям и уточнения хронологии иногда становятся более сильными признаками, чем первая публикация.

Проверка перед публикацией

В эпоху AI текстовую анонимизацию проверяют в таком порядке.

  1. Удалить прямые идентификаторы: имена, названия организаций, топонимы
  2. Сделать более широкими профессию, регион, должность, возраст, стаж
  3. Проверить, не слишком ли детальна хронология личного опыта
  4. Посмотреть, не совпадает ли стиль и тема с аккаунтом настоящего имени
  5. Проверить, не создается ли образ человека в сочетании с прошлыми публикациями
  6. Проверить также изображения, файлы, URL и скриншоты

Если остаются пункты без ясного решения, не публикуйте как есть.

С непонятным переходят к одному из вариантов: дополнительно обобщить, отложить публикацию, не публиковать, посоветоваться с надежной стороной.

Итоги

В эпоху AI недостаточно удалить настоящее имя или название компании.

Когда стиль письма, темы, экспертность, личный опыт, хронология, прошлые публикации, изображения, файлы и URL складываются вместе, они приближают к человеку или связанным людям.

AI и поисковые технологии упрощают поиск таких корреляций.

При анонимизации сохраняют смысл, нужный читателю, и одновременно снижают точность, используемую для сверки.

Важно проверять не только текст, но и прошлую информацию и все опубликованные материалы вместе.

Связанные инструменты

OSINT directory

OSINT Framework

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://osintframework.com/

Открыть внешний сайт

Связанные статьи