Признаки в тексте, по которым можно предположить личность
Когда люди публикуют что-то анонимно, многие убирают имя и адрес.
Но сам текст тоже содержит признаки личности. Стиль, обороты, профессиональные термины, региональные выражения, личные истории, хронология, проявление эмоций, часто используемые слова. Такая информация может связываться с прошлыми аккаунтами или средой настоящего имени.
В анонимности текст смотрят с двух сторон: "содержание" и "способ письма".
В этой статье разбираются признаки, по которым личность может предполагаться по тексту.
Признаки в содержании
В содержание текста легко попадает информация, которая сужает круг самого человека или связанных с ним людей.
Признак
Пример
Риск для анонимности
Регион
станция, магазин, погода, диалект
Видны привычные места
Профессия
отраслевые термины, формат работы
Сужаются возможные места работы
Школа
класс, мероприятия, учитель
Сужается круг самого человека или семьи
Семья
ребенок, супруг или супруга, сожитель
Вовлекаются не только сам человек
Хронология
что произошло в конкретный день
Сверяется с записями
Даже без настоящего имени сочетание деталей в содержании сужает круг кандидатов.
Признаки в способе письма
Способ письма тоже становится признаком.
Одни и те же обороты, пунктуация, окончания фраз, переносы строк, выбор профессиональных терминов и привычные ошибки становятся корреляцией с прошлыми публикациями.
Способ письма
Что видно
На что обратить внимание
Речевые привычки
Похожесть на того же автора
Не слишком ли похоже на соцсети с настоящим именем
Профессиональные термины
Профессия или опыт
Не делать их конкретнее необходимого
Диалект
Регион или происхождение
Становится сильнее вместе с топонимами
Переносы строк и знаки
Привычки стиля
Накапливаются в долгосрочной перспективе
Привычные ошибки
Признак одного человека
Одинаковые ошибки становятся заметными
Один только стиль не всегда позволяет установить человека.
Но вместе с прошлыми аккаунтами, временем публикаций и темами он становится сильным признаком.
Информация, понятная только связанным людям
В тексте особенно опасна информация, понятная только связанным людям.
Даже если обычный читатель ее не поймет, она может быть понятна на работе, в школе, семье или организации другой стороны.
Информация
Как выглядит извне
Как выглядит для связанных людей
Ход совещания
Обычная рабочая история
Можно понять отдел
Слова учителя
История о школе
Можно понять конкретного учителя или класс
Семейное событие
Личная история
Семья узнает человека
Закулисье события
История участника
Люди на месте узнают, кто был там
Особенности документа
Обычный документ
Можно понять конкретное дело
Перед публикацией проверяют не только "поймет ли незнакомый человек", но и "поймет ли человек, который знает контекст".
Как думать о переписывании
Чтобы уменьшить признаки в тексте, сохраняют смысл и снижают степень детализации.
Исходная информация
Пример переписывания
Сохраняемый смысл
Рядом со станцией Сибуя
В районе городской станции
Характер места
Бухгалтер на третьем году работы
Сотрудник административного подразделения с несколькими годами опыта
Роль и опыт
Совещание 12 мая
Недавнее внутреннее совещание
Ход события
Сын во втором классе средней школы
Ребенок
Семейный контекст
Настоящее имя начальника отдела
Руководитель
Отношение
Однако в сообщении о нарушении или консультации иногда нужна точная информация.
Можно разделять: в тексте для публикации обобщать, а надежному адресату консультации передавать точные сведения.
Текстовая корреляция в эпоху AI
Корреляция текста возникает не только из человеческой памяти.
Поиск, резюмирование, перевод и сравнение текстов облегчают поиск связи между прошлыми и текущими публикациями. Когда снижается труд чтения большого числа публикаций, легче найти совпадения стиля, тем и профессиональной лексики.
Материал
Пример корреляции
На что обратить внимание
Стиль
Похожесть на того же автора
Проверить, не слишком ли похоже на сторону настоящего имени
Профессиональные термины
Профессия или принадлежность
Ограничить необходимым диапазоном
Сочетание тем
хобби, регион, профессия
Образ человека становится более плотным
Прошлые публикации
старый ID или блог
Находятся через поиск
Перевод
публикации на другом языке
Зарубежные публикации тоже не отделяются автоматически
Не нужно полностью писать как другой человек.
Но в высокорисковых публикациях важно не выводить слишком много тех же привычек, что и в текстах со стороны настоящего имени.
Порядок чтения перед публикацией
При проверке текста смотрят сначала содержание, затем связанных людей, затем способ письма.
Порядок
Что смотреть
Причина
1
Настоящие имена, топонимы, названия организаций
Это прямые признаки
2
Работа, школа, семья
Они сужают круг кандидатов
3
Даты, число людей, должности
Их сверяют с записями
4
Истории, понятные только связанным людям
Они ведут к внутреннему установлению личности
5
Стиль и речевые привычки
Они коррелируют с прошлыми аккаунтами
Не начинайте сразу с исправления стиля: сначала убирают сильные признаки.
После этого пересматривают привычки текста и тематические перекосы.
Короткий текст не обязательно безопасен
Даже короткая публикация опасна, если в ней есть конкретные признаки.
Фразы вроде "сейчас в магазине у станции", "сегодня в нашем отделе", "только что в школе ребенка" выглядят короткими, но в них сильно проявлены место, время и связанные люди.
Короткое выражение
Какая информация выходит
Сейчас в магазине у станции
Место и текущее время
Сегодня в нашем отделе
Работа и дата
В школе ребенка
Семья и школа
После ночной смены
Формат работы
В привычной больнице
Привычные места и сведения о здоровье
Смотрят не на объем текста, а на то, что с чем связывается.
Диапазон просмотра
Что проверять
Недавние публикации
Конкретные признаки, которые выходят сейчас
Прошлые публикации
Повторение тех же тем или регионов
Ответы
Дополнительная информация, вышедшая эмоционально
Профиль
Атрибуты, которые сочетаются с текстом
Другие аккаунты
Совпадение того же стиля или тем
Текст проверяют не только как отдельную публикацию, но и на уровне всего аккаунта.
Не становиться другим человеком, а уменьшать корреляцию
В анонимной публикации не нужно думать, что нужно писать "совсем как другой человек".
Важно уменьшать сильную корреляцию со стороной настоящего имени или прошлыми аккаунтами. Если совпадают одни и те же характерные обороты, наборы профессиональных терминов, разговоры о том же регионе, тот же способ злиться, те же метафоры, текст получает узнаваемость автора.
Корреляция, которой стоит избегать
Пример корректировки
Причина
Одна и та же устойчивая фраза
Заменить на более обычное выражение
Уменьшить совпадение с прошлыми публикациями
Слишком точные профессиональные термины
Свести к диапазону, нужному читателю
Расширить круг возможных принадлежностей
Региональные выражения
Перейти к нейтральному выражению
Ослабить корреляцию с привычными местами
Одинаковый способ злиться
Разделить факты и последствия
Ослабить эмоциональную привычку
Одинаковая личная история
Обобщить период и детали
Не связывать с историей со стороны настоящего имени
Безопасность текста совместима с читабельностью.
Если убрать так много информации, что смысл исчезнет, читатель ничего не поймет. В тексте, который защищает анонимность, убирают детали, пригодные для идентификации, но оставляют структуру и фон, необходимые для понимания.
В конце проверяют, будет ли человеку, который знает вас со стороны настоящего имени, трудно почувствовать, что это тот же человек.
Итоги
В тексте признаки личности содержатся и в содержании, и в способе письма.
Когда регион, профессия, школа, семья, хронология, профессиональные термины, стиль, речевые привычки и информация, понятная только связанным людям, накладываются друг на друга, сужается круг самого человека и связанных людей.
Для анонимности недостаточно убрать имя.
Нужно перечитать текст и проверить, что связывается с прошлой информацией или средой настоящего имени.
Важно сохранять нужный смысл и уменьшать детали, которые можно использовать для идентификации.
Связанные инструменты
OSINT directory
OSINT Framework
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.