Learn

96 статейКатегория: Все
Текст и содержание

Что такое корреляция контента

Анонимность не определяется только средой связи.

Опубликованный текст. Фон на изображении. Содержимое файла. Выбор тем. Личный опыт. Профессиональная область.

Сам такой контент тоже становится материалом для предположения личности.

Корреляция контента — это связь опубликованного содержания с прошлой информацией, аккаунтами под настоящим именем, принадлежностью, привычными местами и памятью связанных людей.

Контент говорит о человеке

В том, что человек пишет, проявляется его опыт.

Регион проживания. Отрасль работы. Школа или вуз, где он учился. Пережитые проблемы. Места, куда он часто ходит. Интересующие темы. Обстоятельства, известные только людям внутри.

Даже если имя не написано, содержание сужает круг кандидатов.

СодержаниеЧто видно
Личный опытКандидаты среди самого человека и связанных людей
Профессиональные терминыПрофессия, отрасль, область принадлежности
Разговор о регионеПривычные места, радиус перемещений
Внутренние обстоятельстваОрганизация или связанные люди
Фон изображенияМесто, школа, рабочее место
Содержимое файлаАвтор, организация, рабочие материалы

Корреляция контента отличается от технического отслеживания. Она происходит в форме «кто знает, тот поймет».

Личный опыт становится сильным признаком

Личный опыт убедителен. Но с точки зрения анонимности он становится довольно сильным признаком.

Особенно опасны события, о которых знает только небольшое число людей.

«Проблема, которая произошла в отделе в прошлом году» «История, известная только части людей внутри школы» «То, что я видел на конкретном мероприятии» «Хронология, известная только связанным людям»

Такое содержание может быть непонятно посторонним, но понятно связанным людям.

Даже если анонимная публикация не распространится широко, попадание на глаза связанным людям сужает круг кандидатов.

При описании личного опыта отделяйте факты, необходимые читателю, от деталей, сужающих круг до конкретного человека.

Для рассказа «на работе была травля» не всегда нужны точное название отдела, дата совещания, любимые выражения начальника, число участников и название внутренней системы. С другой стороны, чтобы передать структуру проблемы, иногда нужно в определенной степени показать отрасль или позицию.

ДетальКак обращаться
Дата и времяУказывать период, а не точную дату
МестоДавать широкую категорию вместо конкретного названия
Число людейРазмывать, если людей мало
ДолжностьОбобщать, если она сужает круг кандидатов
РазговорИзбегать выражений, характерных для конкретного человека

В анонимности нужно сохранять убедительность, одновременно снижая степень детализации, необходимую для идентификации.

Смотреть нужно также на изображения и файлы

Корреляция контента касается не только текста.

На фоне изображения видны место и принадлежность. В PDF и документах Office в тексте могут остаться внутренние термины, названия отделов, названия дел и комментарии. На скриншотах видны уведомления, названия вкладок, имена аккаунтов и закладки.

Даже если удалить метаданные, это не поможет, если остается видимое содержание.

ТипПримерНа что обратить внимание
МетаданныеАвтор, дата и время, геолокацияИх легче проверить инструментами
Содержание текстаВнутренняя информация, личный опыт, имена собственныеЧеловек читает и делает вывод
Содержание изображенияФон, отражения, вывески, формаНужно проверять с увеличением
СкриншотУведомления, вкладки, имя аккаунтаИнформацию по краям легко пропустить

В анонимности проверяют и скрытую или внутреннюю сторону файла, и то, что видно глазами.

Связь с прошлыми публикациями

Даже если в текущей публикации нет настоящего имени, связь с прошлыми публикациями ослабляет анонимность.

Тот же личный опыт раньше был описан в блоге. То же изображение использовалось в прошлых соцсетях. По той же профессиональной области человек выступал под настоящим именем. Одна и та же позиция была изложена в том же порядке.

Такие совпадения находятся поиском или по памяти.

Когда вы думаете об анонимности, недостаточно смотреть только на текущую публикацию. Нужно проверить, не выдавали ли ваши прошлые публикации те же сведения.

Неправильное размывание бесполезно

При размывании контента недостаточно просто убрать имена собственные.

Даже если удалить название места, местное событие может показать локацию. Даже если удалить название компании, отрасль, должность, число людей и период могут сузить круг кандидатов. Даже если удалить название школы, совпадение класса, мероприятия, кружка и региона может сделать ее понятной.

Опасная формулировкаБолее безопасный подходПричина
Удалить только название компанииСделать грубее также отрасль, число людей и периодПринадлежность видна по сочетанию
Удалить только название станцииПересмотреть также линию и привычные местаОстается радиус перемещений
Скрыть только имяРазмыть также отношения и рольСвязанным людям понятно
Удалить только датуСмотреть также на события до и послеКруг сужается по хронологии

Цель размывания не в том, чтобы сделать текст расплывчатым. Цель — снизить степень детализации, необходимую для идентификации.

Что проверить перед публикацией

Чтобы избегать корреляции контента, перед публикацией проверьте следующие пункты.

  • Не описано ли событие, известное только вам или связанным людям
  • Не видны ли регион, рабочее место, школа или привычные места
  • Не используется ли тот же личный опыт, что и в прошлых публикациях
  • Нет ли признаков на фоне или в отражениях изображения
  • Нет ли на скриншоте уведомлений или имени аккаунта
  • Не остались ли во внутреннем тексте файла внутренние термины или комментарии
  • Нельзя ли идентифицировать человека по сочетанию размытых сведений

При проверке думайте не о том, как это видите вы, а о том, как это увидит «человек, который вас знает».

В анонимности близкие связанные люди иногда опаснее, чем незнакомые внешние читатели.

Есть информация, понятная только связанным людям

Даже если внешним читателям текст кажется абстрактным, связанным людям он может выглядеть конкретным.

Даже без названия компании внутренние термины, собственные названия процедур, способ называть совещания и сроки проекта могут быть понятны людям внутри организации. Даже без названия школы многое может быть понятно по названию мероприятия, обращению к учителю и достижениям кружка.

В корреляции контента критерий не «поймет ли обычный публичный читатель», а «поймет ли человек, который был на этом месте».

Выбирать, где оставить конкретику

Если ради анонимности сделать все расплывчатым, текст станет трудным для чтения. Чтобы читатель понял проблему, некоторая конкретика нужна.

Важно выбирать, где размещать конкретику.

Например, если нужно передать проблему системы, подробно описывают не имена людей или отделов, а сам механизм. Если нужно передать опасность в регионе, объясняют не ближайшую станцию, а широкий район или ситуацию.

Что нужно передатьКакую конкретику оставитьКакую конкретику убрать
Проблема на работеМеханизм, влияние, условия повторенияНазвание отдела, дата совещания, высказывания малой группы
Проблема районаСтруктура транспорта или средыБлижайшая станция, магазин рядом с домом
Проблема школыСистема и ход реакцииКласс, имя классного руководителя, дата мероприятия
Личный вредТип вреда и реакцияДетали, ведущие к идентификации другой стороны

Текст, защищающий анонимность, — это не просто обедненный текст. Это текст, который оставляет нужную читателю информацию и убирает сведения, используемые для идентификации.

Итоги

Корреляция контента — это связь опубликованного содержания с прошлой информацией, аккаунтами под настоящим именем, принадлежностью, привычными местами и памятью связанных людей.

Содержание текста, изображений, скриншотов, PDF, документов Office, видео и аудио становится признаком.

Даже если удалить имена и географические названия, личный опыт, профессиональные термины, хронология, фон и сведения, известные только связанным людям, сужают круг кандидатов.

В анонимности нужно проверять не только маршрут связи и метаданные, но и само публикуемое содержание. Важно не удалить информацию как таковую, а снизить степень детализации, необходимую для идентификации.

Связанные инструменты

OSINT directory

OSINT Framework

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://osintframework.com/

Открыть внешний сайт
Reverse image search

Google Lens

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://lens.google/

Открыть внешний сайт
Metadata inspection

ExifTool

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://exiftool.org/

Открыть внешний сайт
Metadata removal

MAT2

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://0xacab.org/jvoisin/mat2

Открыть внешний сайт
Audio and video

FFmpeg

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://ffmpeg.org/

Открыть внешний сайт

Связанные статьи