Удаление метаданных PDF
Замечания при удалении метаданных PDF
Недостаточно считать, что PDF безопасен, если удалить его метаданные.
Удаление метаданных важно. Однако PDF содержит не только метаданные, но и текст, изображения, аннотации, ссылки, редактирование/закрашивание, встроенные файлы, имя файла и настройки совместного доступа. Даже если удалить только метаданные, в других местах может остаться информация, ведущая обратно к человеку или организации.
В этой статье разобрано, как думать об удалении метаданных PDF и что проверять после удаления.
Создайте копию перед удалением
Первое, что нужно сделать, — не трогать исходный файл напрямую.
Создайте копию для публикации и выполняйте удаление или конвертацию с этой копией. Исходному файлу может понадобиться сохранить историю редактирования или доказательственную ценность. Особенно при консультациях, внутреннем информировании или юридических процедурах нужно тщательно думать о том, как обращаться с исходным файлом.
| Объект | Как обращаться | Причина |
|---|---|---|
| Исходный файл | Хранить в безопасном месте | Для доказательственной ценности и повторной проверки |
| Копия для публикации | Удалить метаданные или конвертировать | Чтобы подготовить к публикации |
| Рабочая папка | Избегать имен людей и названий дел | Уменьшает утечку через пути файлов |
| Адресат совместного доступа | Ограничить необходимым минимумом | Избегает ненужного распространения |
| Запись | Сохранить, что было удалено | Чтобы можно было проверить позже |
Удаление метаданных — это часть работы.
Думайте о нем вместе с управлением исходным файлом, копией для публикации и проверкой адресата совместного доступа.
Информация, которую нужно удалить
В PDF есть несколько видов информации, которые нужно удалить или проверить.
| Информация | Риск | Метод проверки |
|---|---|---|
| Автор | Появляется имя человека или имя пользователя ОС | Посмотреть свойства документа |
| Название компании | Видна связанная организация | Проверить свойства и исходный Office-файл |
| Время создания | Связывается со временем активности | Посмотреть свойства |
| Аннотации | Появляются комментарии и внутренние разговоры | Посмотреть список аннотаций |
| Встроенные файлы | Смешиваются исходные материалы | Проверить вложения и структуру |
| Формы | Остается введенная информация | Проверить поля форм |
Если PDF создан из документа Office, нужно также обратить внимание на исходную сторону Office.
Даже если смотреть только PDF, информация об авторе или история изменений может оставаться в исходном файле.
Проверьте снова после удаления
После использования инструмента удаления всегда проверяйте снова.
Даже если вы намеревались удалить метаданные, информация может остаться в аннотациях, ссылках, изображениях, тексте или закрашенных областях.
| Что проверить | Причина |
|---|---|
| Свойства документа | Посмотреть, исчезли ли автор и заголовок |
| Поиск по тексту | Посмотреть, появляются ли скрытые слова в поиске |
| Операция копирования | Проверить, можно ли скопировать закрашенный текст |
| Список аннотаций | Проверить, не остались ли комментарии |
| Ссылки | Проверить, не остались ли личные IDs или внутренние URLs |
| Имя файла | Проверить, не содержит ли настоящее имя или название организации |
Важно не чувствовать себя в безопасности только потому, что удаление было выполнено.
Откройте файл для публикации заново в другой среде и проверьте его.
Инструменты — это вспомогательные средства
Для проверки и конвертации PDF иногда используются локальные инструменты, такие как ExifTool.
ExifTool — типичный инструмент, используемый для проверки метаданных в разных форматах.
URL : https://exiftool.org/
Однако инструменты не всемогущи.
Инструменты помогают проверять и удалять внутреннюю информацию, но сведения, написанные в тексте, фоны на изображениях, уведомления на скриншотах и имена владельцев в ссылках совместного доступа нужно проверять отдельно.
| Что могут инструменты | Что одних инструментов недостаточно покрывает |
|---|---|
| Проверка метаданных | Собственные имена в тексте |
| Удаление части метаданных | Безопасность закрашивания |
| Проверка структуры файла | Фоны и отражения на изображениях |
| Конвертация формата | Журналы и отображение владельца у адресата совместного доступа |
| Автоматическая обработка | Юридическое решение высокого риска |
Для документов высокого риска не принимайте решение о публикации только по результату работы инструмента.
Есть информация, которую не следует удалять
Если смотреть только на анонимность, может захотеться удалить всю информацию.
Однако при консультациях пострадавших, внутреннем информировании и юридических консультациях часть информации следует сохранять как доказательство. Время создания исходного файла, история редактирования и маршрут отправки могут позже стать важными.
| Информация | В копии для публикации | В консультации/доказательстве |
|---|---|---|
| Время создания | Рассмотреть размывание или удаление | Может стать необходимой записью |
| Автор | Удалить перед публикацией | Может сохраняться в оригинале |
| История изменений | Удалить из копии для публикации | Может быть нужна для объяснения последовательности |
| Аннотации | Удалить из копии для публикации | Могут стать записью внутренней проверки |
| Исходный файл | Не публиковать | Хранить в безопасном месте |
Именно поэтому файл для публикации и хранимый оригинал разделяют.
Удаление, необходимое для защиты анонимности, и сохранение, необходимое для защиты доказательств, нужно рассматривать одновременно.
Имя и место хранения после удаления
Даже если метаданные удалены, имя файла и место хранения могут раскрывать информацию.
Например, имя файла может содержать настоящее имя, название компании или название дела. Облачная ссылка совместного доступа может показывать имя владельца аккаунта с реальным именем. Название рабочей папки может попасть на скриншот. Такую информацию проверяют отдельно от удаления метаданных.
| Что проверить | Причина |
|---|---|
| Имя файла | Избегать настоящих имен, названий организаций и названий дел |
| Имя папки | Может появиться при демонстрации экрана или сжатии |
| Владелец облака | Связывается с аккаунтом с реальным именем |
| URL совместного доступа | Может содержать личный ID или отслеживание |
| Время отправки | Сопоставляется с записями активности |
В конце работы по удалению проверьте состояние с точки зрения третьей стороны.
Даже если на вашем устройстве все выглядит безопасно, получатель может увидеть имя владельца, предпросмотр, карточку ссылки или имя файла. Если возможно, проверьте итоговое публичное состояние в другом браузере или другой среде.
При проверке после удаления важно смотреть не только на метаданные.
Также проверьте собственные имена в тексте, фоны изображений, адреса ссылок, имена файлов и отображаемое имя места загрузки. Работа по удалению должна идти вместе с проверкой всего итогового публикуемого объекта.
Записывайте работу по удалению
Для документов высокого риска запись того, что было удалено и что оставлено, упрощает последующую проверку.
Однако сама эта запись тоже требует осторожности. Если сохранить ее в облаке с реальным именем или на рабочем устройстве, она станет подсказкой, связывающей вас с очищаемыми материалами.
| Что записывать | На что обратить внимание |
|---|---|
| Удаленные элементы | Не включать в файл для публикации |
| Оставленные элементы | Быть готовым объяснить, почему они оставлены |
| Место хранения исходного файла | Ограничить безопасным местом |
| Имя файла для публикации | Не включать персональную информацию |
| Время проверки | Осторожно с корреляцией с записями активности |
Работа по удалению — часть решения о публикации.
После удаления проверяйте другим методом
Удаление метаданных не заканчивается только потому, что оно было выполнено.
Проверяйте методом, отличным от инструмента, использованного для удаления. Посмотрите свойства документа, выделите и скопируйте текст, откройте в другом PDF-просмотрщике, попробуйте скачать в другой среде. Несколько точек зрения помогают легче заметить пропущенное удаление или различия отображения.
| Метод проверки | Проблемы, которые легче найти |
|---|---|
| Посмотреть свойства документа | Автор, заголовок, программа создания |
| Выделить и скопировать текст | Текст под закрашиванием, скрытый текст |
| Открыть в другом просмотрщике | Оставшиеся аннотации или формы |
| Проверить в другой среде | Имена владельцев и отображение совместного доступа |
| Перечитать текст | Собственные имена и контекстные утечки |
В работе по удалению важнее итоговое состояние, которое будет опубликовано, чем сообщение инструмента об успехе.
В анонимности «я думал, что удалил» — самое опасное состояние. После удаления проверьте, как файл выглядит в среде получающей стороны.
Итог
Удаление метаданных PDF важно, но само по себе не делает файл безопасным.
Не публикуйте исходный файл напрямую. Создайте копию для публикации и проверьте автора, название компании, время создания, аннотации, встроенные элементы, формы и ссылки.
После удаления снова проверьте свойства документа, поиск, копирование, аннотации и имя файла.
Инструменты — это вспомогательные средства.
Текст, изображения, закрашивание, адресаты совместного доступа и юридические риски нужно проверять отдельно.
Связанные инструменты
Wayback Machine
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.
URL : https://web.archive.org/
ExifTool
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.
URL : https://exiftool.org/
MAT2
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.
qpdf
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.