Что такое корреляция контента
Анонимность не определяется только средой связи.
Опубликованный текст. Фон на изображении. Содержимое файла. Выбор тем. Личный опыт. Профессиональная область.
Сам такой контент тоже становится материалом для предположения личности.
Корреляция контента — это связь опубликованного содержания с прошлой информацией, аккаунтами под настоящим именем, принадлежностью, привычными местами и памятью связанных людей.
Контент говорит о человеке
В том, что человек пишет, проявляется его опыт.
Регион проживания. Отрасль работы. Школа или вуз, где он учился. Пережитые проблемы. Места, куда он часто ходит. Интересующие темы. Обстоятельства, известные только людям внутри.
Даже если имя не написано, содержание сужает круг кандидатов.
| Содержание | Что видно |
|---|---|
| Личный опыт | Кандидаты среди самого человека и связанных людей |
| Профессиональные термины | Профессия, отрасль, область принадлежности |
| Разговор о регионе | Привычные места, радиус перемещений |
| Внутренние обстоятельства | Организация или связанные люди |
| Фон изображения | Место, школа, рабочее место |
| Содержимое файла | Автор, организация, рабочие материалы |
Корреляция контента отличается от технического отслеживания. Она происходит в форме «кто знает, тот поймет».
Личный опыт становится сильным признаком
Личный опыт убедителен. Но с точки зрения анонимности он становится довольно сильным признаком.
Особенно опасны события, о которых знает только небольшое число людей.
«Проблема, которая произошла в отделе в прошлом году» «История, известная только части людей внутри школы» «То, что я видел на конкретном мероприятии» «Хронология, известная только связанным людям»
Такое содержание может быть непонятно посторонним, но понятно связанным людям.
Даже если анонимная публикация не распространится широко, попадание на глаза связанным людям сужает круг кандидатов.
При описании личного опыта отделяйте факты, необходимые читателю, от деталей, сужающих круг до конкретного человека.
Для рассказа «на работе была травля» не всегда нужны точное название отдела, дата совещания, любимые выражения начальника, число участников и название внутренней системы. С другой стороны, чтобы передать структуру проблемы, иногда нужно в определенной степени показать отрасль или позицию.
| Деталь | Как обращаться |
|---|---|
| Дата и время | Указывать период, а не точную дату |
| Место | Давать широкую категорию вместо конкретного названия |
| Число людей | Размывать, если людей мало |
| Должность | Обобщать, если она сужает круг кандидатов |
| Разговор | Избегать выражений, характерных для конкретного человека |
В анонимности нужно сохранять убедительность, одновременно снижая степень детализации, необходимую для идентификации.
Смотреть нужно также на изображения и файлы
Корреляция контента касается не только текста.
На фоне изображения видны место и принадлежность. В PDF и документах Office в тексте могут остаться внутренние термины, названия отделов, названия дел и комментарии. На скриншотах видны уведомления, названия вкладок, имена аккаунтов и закладки.
Даже если удалить метаданные, это не поможет, если остается видимое содержание.
| Тип | Пример | На что обратить внимание |
|---|---|---|
| Метаданные | Автор, дата и время, геолокация | Их легче проверить инструментами |
| Содержание текста | Внутренняя информация, личный опыт, имена собственные | Человек читает и делает вывод |
| Содержание изображения | Фон, отражения, вывески, форма | Нужно проверять с увеличением |
| Скриншот | Уведомления, вкладки, имя аккаунта | Информацию по краям легко пропустить |
В анонимности проверяют и скрытую или внутреннюю сторону файла, и то, что видно глазами.
Связь с прошлыми публикациями
Даже если в текущей публикации нет настоящего имени, связь с прошлыми публикациями ослабляет анонимность.
Тот же личный опыт раньше был описан в блоге. То же изображение использовалось в прошлых соцсетях. По той же профессиональной области человек выступал под настоящим именем. Одна и та же позиция была изложена в том же порядке.
Такие совпадения находятся поиском или по памяти.
Когда вы думаете об анонимности, недостаточно смотреть только на текущую публикацию. Нужно проверить, не выдавали ли ваши прошлые публикации те же сведения.
Неправильное размывание бесполезно
При размывании контента недостаточно просто убрать имена собственные.
Даже если удалить название места, местное событие может показать локацию. Даже если удалить название компании, отрасль, должность, число людей и период могут сузить круг кандидатов. Даже если удалить название школы, совпадение класса, мероприятия, кружка и региона может сделать ее понятной.
| Опасная формулировка | Более безопасный подход | Причина |
|---|---|---|
| Удалить только название компании | Сделать грубее также отрасль, число людей и период | Принадлежность видна по сочетанию |
| Удалить только название станции | Пересмотреть также линию и привычные места | Остается радиус перемещений |
| Скрыть только имя | Размыть также отношения и роль | Связанным людям понятно |
| Удалить только дату | Смотреть также на события до и после | Круг сужается по хронологии |
Цель размывания не в том, чтобы сделать текст расплывчатым. Цель — снизить степень детализации, необходимую для идентификации.
Что проверить перед публикацией
Чтобы избегать корреляции контента, перед публикацией проверьте следующие пункты.
- Не описано ли событие, известное только вам или связанным людям
- Не видны ли регион, рабочее место, школа или привычные места
- Не используется ли тот же личный опыт, что и в прошлых публикациях
- Нет ли признаков на фоне или в отражениях изображения
- Нет ли на скриншоте уведомлений или имени аккаунта
- Не остались ли во внутреннем тексте файла внутренние термины или комментарии
- Нельзя ли идентифицировать человека по сочетанию размытых сведений
При проверке думайте не о том, как это видите вы, а о том, как это увидит «человек, который вас знает».
В анонимности близкие связанные люди иногда опаснее, чем незнакомые внешние читатели.
Есть информация, понятная только связанным людям
Даже если внешним читателям текст кажется абстрактным, связанным людям он может выглядеть конкретным.
Даже без названия компании внутренние термины, собственные названия процедур, способ называть совещания и сроки проекта могут быть понятны людям внутри организации. Даже без названия школы многое может быть понятно по названию мероприятия, обращению к учителю и достижениям кружка.
В корреляции контента критерий не «поймет ли обычный публичный читатель», а «поймет ли человек, который был на этом месте».
Выбирать, где оставить конкретику
Если ради анонимности сделать все расплывчатым, текст станет трудным для чтения. Чтобы читатель понял проблему, некоторая конкретика нужна.
Важно выбирать, где размещать конкретику.
Например, если нужно передать проблему системы, подробно описывают не имена людей или отделов, а сам механизм. Если нужно передать опасность в регионе, объясняют не ближайшую станцию, а широкий район или ситуацию.
| Что нужно передать | Какую конкретику оставить | Какую конкретику убрать |
|---|---|---|
| Проблема на работе | Механизм, влияние, условия повторения | Название отдела, дата совещания, высказывания малой группы |
| Проблема района | Структура транспорта или среды | Ближайшая станция, магазин рядом с домом |
| Проблема школы | Система и ход реакции | Класс, имя классного руководителя, дата мероприятия |
| Личный вред | Тип вреда и реакция | Детали, ведущие к идентификации другой стороны |
Текст, защищающий анонимность, — это не просто обедненный текст. Это текст, который оставляет нужную читателю информацию и убирает сведения, используемые для идентификации.
Итоги
Корреляция контента — это связь опубликованного содержания с прошлой информацией, аккаунтами под настоящим именем, принадлежностью, привычными местами и памятью связанных людей.
Содержание текста, изображений, скриншотов, PDF, документов Office, видео и аудио становится признаком.
Даже если удалить имена и географические названия, личный опыт, профессиональные термины, хронология, фон и сведения, известные только связанным людям, сужают круг кандидатов.
В анонимности нужно проверять не только маршрут связи и метаданные, но и само публикуемое содержание. Важно не удалить информацию как таковую, а снизить степень детализации, необходимую для идентификации.
Связанные инструменты
OSINT Framework
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.
Google Lens
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.
URL : https://lens.google/
ExifTool
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.
URL : https://exiftool.org/
MAT2
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.
FFmpeg
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.
URL : https://ffmpeg.org/