Перед публикацией документа проверяют не только основной текст, но и внутреннее содержимое файла, имя файла, комментарии, историю изменений, историю общего доступа и состояние после преобразования в PDF.
В анонимности опасно не только то, что в тексте остается настоящее имя.
Имя автора, название организации, комментарии, история изменений, скрытые листы, аннотации, имя файла и облачная ссылка общего доступа тоже могут стать признаками, по которым предполагают человека или связанных лиц.
В этой статье разбирается порядок проверки документа перед публикацией.
Что проверять
При проверке документа отдельно смотрят видимую поверхность и внутренние сведения.
Объект
Что проверять
Текст
Имена, географические названия, принадлежность, хронология, внутренние термины
Комментарии
Имена связанных людей, редакторские заметки, содержание проверки
История изменений
Информация до удаления, редакторы, время правок
Метаданные
Автор, время создания, имя приложения, название компании
Имя файла
Настоящее имя, отдел, название проекта, дата
Способ передачи
Облачная ссылка, права, получатели, состояние входа
Документ нельзя оценивать только по внешнему виду.
Перед публикацией отдельно проверяйте текст, внутреннюю информацию и способ передачи.
Основной порядок проверки
Проверка перед публикацией проводится в заданном порядке.
Порядок
Действие
Причина
1
Скопировать оригинал
Не смешивать оригинал и копию для публикации
2
Прочитать текст
Проверить прямые идентификаторы и имена собственные
3
Посмотреть комментарии и историю изменений
Проверить сведения процесса редактирования
4
Посмотреть метаданные
Проверить автора и сведения приложения
5
Изменить имя файла
Уменьшить внешнюю персональную информацию
6
Преобразовать в формат для публикации
При необходимости создать PDF или новый файл
7
Повторно проверить после преобразования
Посмотреть, не остались ли сведения в новом файле
Этот порядок важен, потому что при создании нового файла в процессе могут добавиться другие метаданные.
Проверка включает и повторную проверку после преобразования.
Проверка текста
Сначала проверьте основной текст.
В тексте есть не только прямая персональная информация, но и сведения, сужающие круг кандидатов.
Тип
Пример
Прямые идентификаторы
Настоящее имя, почта, телефон, адрес
Сведения о принадлежности
Компания, школа, отдел, должность
Хронология
Дата, время, описание сразу после события
Внутренние термины
Внутренние сокращения, названия проектов, уникальные названия
Сведения о связанных людях
Семья, коллеги, источники, участники
При анонимизации недостаточно удалить имена собственные.
События, известные малому числу людей, и выражения, используемые только конкретным отделом, тоже становятся признаками.
Проверка имени файла и места хранения
Имя файла — персональная информация, которую легко пропустить.
Даже если текст и метаданные очищены, а в имени файла остались настоящее имя, отдел, название проекта или дата, анонимность ослабевает.
Что проверить
Пример
Настоящее имя
yamada_report.pdf, 田中_資料.pdf
Название отдела
sales_internal.pdf, hr_case.docx
Название проекта
project_x_final.pdf
Дата
2026-06-12_meeting.pdf
Путь сохранения
/Users/name/Company/ и т. п.
Также учитывайте место хранения.
При работе в папке облачной синхронизации могут оставаться история файла и история общего доступа.
Если работа идет на рабочем или школьном устройстве, могут иметь значение журналы управления устройством и антивирусного ПО.
Информация, добавляющаяся после преобразования
При преобразовании документа в PDF, изображение или другой формат могут добавиться новые метаданные.
Преобразование
Информация, которая может добавиться
Office в PDF
Приложение создания, время создания, создатель PDF
PDF в изображение
Время создания изображения, имя программы преобразования
Повторное сохранение изображения
Имя редактора, время обновления
Повторное кодирование аудио или видео
Сведения кодировщика, приложение создания
Скачивание из облака
Имя файла или время скачивания
Преобразование иногда делают, чтобы уменьшить информацию.
Но файл после преобразования становится новым объектом проверки.
После преобразования обязательно проверьте его еще раз.
Проверка внутренней информации
Затем проверьте сведения внутри документа.
В документах Office смотрят комментарии, историю изменений, автора и скрытые листы.
В PDF смотрят автора, аннотации, вложения и скрытый текст.
Если документ содержит изображения или сканы, проверьте текст и фон внутри изображений.
Формат
Что проверять
Office
Комментарии, история изменений, автор, название компании, скрытые листы
PDF
Автор, аннотации, вложения, закрашивание, скрытый текст
Документ с изображениями
, фон, отражения, текст, имя файла
Документ совместного редактирования
История общего доступа, редакторы, комментарии, права
Даже после преобразования документа в PDF проверьте его как PDF.
Преобразование — это не конец проверки, а создание нового объекта проверки.
Полезные инструменты и ограничения
Для проверки метаданных иногда используют ExifTool.
Перед использованием инструментов вроде MAT2 проверяйте источник распространения, состояние поддержки и поддерживаемые форматы. После обработки не доверяйте только результату того же инструмента; перепроверяйте другим способом.
Эти инструменты полезны, но они не решают, безопасно ли содержание документа.
Даже если инструмент удалил метаданные, в тексте могут остаться внутренние термины, на изображении — вывески, в имени файла — сведения, а в способе передачи — следы.
Когда стоит остановиться перед публикацией
Если в ходе проверки остаются неясные пункты, лучше не спешить с публикацией.
Признак, что нужно остановиться
Причина
Нельзя проверить, исчезло ли имя автора
Можно приблизиться к человеку или организации
Осталась история изменений
Может быть видна информация до удаления
Неясно, правильно ли сделано закрашивание
Нижний текст может остаться
Есть только облачная ссылка общего доступа
Имеют значение владелец и права
Содержится высокорисковая информация
Может понадобиться специалист или надежное место консультации
В анонимности неясные пункты нельзя считать безопасными.
Выберите одно из действий: проверить, задержать публикацию, удалить информацию, проконсультироваться или не публиковать.
Способ передачи после проверки
Даже после проверки файла анонимность может сломаться способом передачи.
Электронная почта, облачный общий доступ, DM в соцсети, форма загрузки и анонимный инструмент отправки оставляют разные записи.
Способ передачи
На что обратить внимание
Электронная почта
Остаются отправитель, получатель, время, имя вложения
Облачный общий доступ
Остаются владелец, права общего доступа, история доступа
DM в соцсети
Связывается с аккаунтом, временем отправки, сведениями устройства
Форма загрузки
Могут записываться IP, User-Agent, время отправки
Анонимный инструмент отправки
Проверять модель доверия инструмента и содержание файла
Даже проверенный файл разрушит анонимность, если отправить его из аккаунта с настоящим именем.
Проверку документа нужно рассматривать вместе с проверкой способа передачи.
Итоги
Перед публикацией документа отдельно проверяйте текст, комментарии, историю изменений, метаданные, имя файла и способ передачи.
По внешнему виду документа нельзя судить о безопасности.
Даже после преобразования в PDF могут оставаться автор, аннотации, вложения и скрытый текст.
Инструменты вроде ExifTool, qpdf и MAT2 полезны, но сами по себе не завершают анонимность.
Перед публикацией разделяйте оригинал и копию для публикации, повторно проверяйте после удаления сведений и смотрите не только текст, но и путь передачи.
Связанные инструменты
Metadata inspection
ExifTool
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.