В файлах документов могут оставаться не только основной текст, но и комментарии, история изменений, имена редакторов и время работы.
Особенно внимательно нужно относиться к Office-документам, PDF и совместно редактируемым документам.
Если при анонимном обмене документом из текста убрать имя, но оно останется в комментариях или истории изменений вместе с автором, редактором, названием организации и следами переписки, это не помогает.
В этой статье разбирается, как комментарии и история изменений связаны с анонимностью и что проверять перед публикацией.
Что такое комментарии и история изменений
Комментарии - это заметки и замечания, прикрепленные к определенным местам документа.
История изменений - функция, записывающая, кто, какую часть и когда изменил.
Вид
Остающаяся информация
На что обратить внимание для анонимности
Комментарии
Текст комментария, имя автора, дата и время
Видны редакторы и связанные люди
История изменений
Добавленное, удаленное, исправленное
Видны процесс работы и исходный текст
Информация автора
Имя пользователя, название организации
Приближает к человеку или принадлежности
Аннотации
Заметки и выделения в PDF
Видно прохождение ревью
История совместного редактирования
Участники, время правок
Понятны связанные люди и рабочая среда
Эта информация может оставаться в файле, даже если не показывается на экране.
"Не видно" и "удалено" - разные вещи.
Почему это связано с анонимностью
Комментарии и история изменений показывают, как создавался документ.
Для анонимности этот процесс становится сильным признаком.
Например, при анонимном обмене внутренним документом даже удаление названия отдела из текста не поможет, если в комментариях осталось имя начальника или название команды. Круг возможных источников сузится.
В журналистских материалах по комментариям и истории исправлений иногда можно предположить источник, редактора и переписку до публикации.
Ситуация
Что видно
Документ внутреннего сообщения
Автор, редактор, отдел, время изменения
Журналистские материалы
Источник, редакционный процесс, проверявший
Совместно редактируемый документ
Участники, комментарии, исправления
Школьные или рабочие материалы
Название организации, шаблон, имя пользователя
Аннотации PDF
Заметки и выделения во время ревью
Комментарии и история - места, которые легче пропустить, чем основной текст.
Именно поэтому их обязательно проверяют перед публикацией.
В истории изменений остается исходная информация
Особенно опасно, что история изменений сохраняет информацию, которую будто бы удалили.
Даже если имя удалено из основного текста, при показе истории изменений исходное имя может быть видно.
То же касается адреса, отдела, имен связанных людей, последовательности событий и внутренних терминов.
Состояние в тексте
Что может остаться в истории
Имя удалено
Имя до удаления остается в истории
Географическое название размыто
Исходное географическое название остается
Текст обобщен
Исходное специализированное выражение остается
Комментарии скрыты
Текст комментариев остается внутри файла
Преобразовано в PDF
Могут остаться аннотации и сведения автора
Документы, редактированные для анонимизации, требуют особого внимания к истории изменений.
Потому что сам процесс редактирования содержит информацию, которую хотели скрыть.
Что проверить перед публикацией
Перед публикацией документа проверяют следующие пункты.
Пункт проверки
Зачем смотреть
Комментарии
Не остались ли имена связанных людей и внутренние заметки
История изменений
Не осталась ли информация до удаления
Автор
Не выходит ли имя пользователя или организации
Аннотации
Не осталась ли информация PDF или ревью
Скрытые элементы
Проверить скрытый текст, скрытые листы, встроенную информацию
В Office-документах иногда можно использовать функцию проверки документа.
Но даже после проверки нельзя считать, что все полностью решено.
После удаления проверяйте другим способом.
Осторожность с совместно редактируемыми документами
В совместно редактируемых документах важен не только сам файл, но и история на стороне сервиса.
Сервис может хранить, кто редактировал, кто комментировал, кому был открыт доступ и с какого аккаунта файл открывали.
Информация
На что обратить внимание для анонимности
Список редакторов
Видны связанные люди и имена аккаунтов
История комментариев
Остаются переписка и процесс решений
Права общего доступа
Понятно, кому был открыт доступ
История доступа
Иногда записывается, кто и когда открывал
Почтовые уведомления
Связываются с почтой с настоящим именем или организационным аккаунтом
Экспорт файла из сервиса совместного редактирования не удаляет историю на стороне сервиса.
При оценке анонимности отдельно смотрят содержимое файла и историю, оставшуюся в облаке.
Одного удаления комментариев недостаточно
Даже после удаления комментариев могут остаться история изменений, информация автора, имя файла и облачная история.
Что удалено
Что еще может остаться
Текст комментария
Имя автора комментария и история
История изменений
Текст до удаления и редактор
Информация автора
Имя в свойствах документа
Аннотации после PDF-экспорта
Заметки и сведения создания на стороне PDF
Облачная история
Пользователи общего доступа, читатели, время обновления
Удаление комментариев - нужная работа.
Но анонимизация документа - это проверка нескольких слоев.
Нужно думать не "комментарии удалены, значит нормально", а "документ заново подготовлен как файл для публикации".
Проверять даже после PDF-экспорта
Иногда документ экспортируют в PDF, чтобы убрать комментарии и историю изменений.
PDF-экспорт бывает полезен, но он не универсален.
В PDF могут остаться аннотации, информация автора, скрытый текст и встроенные файлы.
Кроме того, в процессе PDF-экспорта могут заново добавиться имя приложения и дата создания.
Поэтому после преобразования Office-документа в PDF файл снова проверяют уже как PDF.
В высокорисковых документах пересматривать и содержание
Даже если удалить комментарии и историю изменений, само содержание может указывать на источник.
История, которую могли знать только участники конкретного совещания, сокращения отдельного отдела, материалы, разосланные только малой группе, и точная хронология являются признаками отдельно от метаданных.
Для внутренних сообщений и журналистских материалов одного удаления метаданных из документа недостаточно.
Проверьте со стороны третьего лица, нельзя ли по содержанию предположить, кто мог знать эту информацию.
Подход с созданием файла для публикации
Если в документе много комментариев и истории изменений, иногда безопаснее не очищать исходный файл напрямую, а создать отдельный файл для публикации.
Например, перенести только нужный текст в новый документ, обобщить имена собственные и сделать PDF для публикации без комментариев и истории.
Но в новом документе тоже появятся имя автора и дата создания.
Поэтому после создания заново снова проверяют метаданные и имя файла.
В анонимности легче проверять, если разделить работу с исходником и создание файла для публикации.
Итоги
Комментарии и история изменений - информация о процессе создания документа.
Даже если из текста убрать имена и географические названия, анонимность ослабнет, если они остаются в комментариях, истории изменений, аннотациях и информации автора.
Особенно в внутренних сообщениях, журналистских материалах и совместно редактируемых документах редакторы, отделы, время работы и исходный текст становятся сильными признаками.
Перед публикацией проверяйте комментарии, историю изменений, автора, аннотации и скрытые элементы.
PDF-экспорт не завершает проверку. После экспорта PDF тоже нужно перепроверить и по метаданным, и по внешнему виду.
Связанные инструменты
Anonymous communication
Tor Project
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.
Комментарии, история изменений, авторы, аннотации и история совместного редактирования могут раскрывать исходный текст, редакторов, отделы и время работы.