Learn

38 статейКатегория: Все
Метаданные

Удаление метаданных PDF

Замечания при удалении метаданных PDF

Недостаточно считать, что PDF безопасен, если удалить его метаданные.

Удаление метаданных важно. Однако PDF содержит не только метаданные, но и текст, изображения, аннотации, ссылки, редактирование/закрашивание, встроенные файлы, имя файла и настройки совместного доступа. Даже если удалить только метаданные, в других местах может остаться информация, ведущая обратно к человеку или организации.

В этой статье разобрано, как думать об удалении метаданных PDF и что проверять после удаления.

Создайте копию перед удалением

Первое, что нужно сделать, — не трогать исходный файл напрямую.

Создайте копию для публикации и выполняйте удаление или конвертацию с этой копией. Исходному файлу может понадобиться сохранить историю редактирования или доказательственную ценность. Особенно при консультациях, внутреннем информировании или юридических процедурах нужно тщательно думать о том, как обращаться с исходным файлом.

ОбъектКак обращатьсяПричина
Исходный файлХранить в безопасном местеДля доказательственной ценности и повторной проверки
Копия для публикацииУдалить метаданные или конвертироватьЧтобы подготовить к публикации
Рабочая папкаИзбегать имен людей и названий делУменьшает утечку через пути файлов
Адресат совместного доступаОграничить необходимым минимумомИзбегает ненужного распространения
ЗаписьСохранить, что было удаленоЧтобы можно было проверить позже

Удаление метаданных — это часть работы.

Думайте о нем вместе с управлением исходным файлом, копией для публикации и проверкой адресата совместного доступа.

Информация, которую нужно удалить

В PDF есть несколько видов информации, которые нужно удалить или проверить.

ИнформацияРискМетод проверки
АвторПоявляется имя человека или имя пользователя ОСПосмотреть свойства документа
Название компанииВидна связанная организацияПроверить свойства и исходный Office-файл
Время созданияСвязывается со временем активностиПосмотреть свойства
АннотацииПоявляются комментарии и внутренние разговорыПосмотреть список аннотаций
Встроенные файлыСмешиваются исходные материалыПроверить вложения и структуру
ФормыОстается введенная информацияПроверить поля форм

Если PDF создан из документа Office, нужно также обратить внимание на исходную сторону Office.

Даже если смотреть только PDF, информация об авторе или история изменений может оставаться в исходном файле.

Проверьте снова после удаления

После использования инструмента удаления всегда проверяйте снова.

Даже если вы намеревались удалить метаданные, информация может остаться в аннотациях, ссылках, изображениях, тексте или закрашенных областях.

Что проверитьПричина
Свойства документаПосмотреть, исчезли ли автор и заголовок
Поиск по текстуПосмотреть, появляются ли скрытые слова в поиске
Операция копированияПроверить, можно ли скопировать закрашенный текст
Список аннотацийПроверить, не остались ли комментарии
СсылкиПроверить, не остались ли личные IDs или внутренние URLs
Имя файлаПроверить, не содержит ли настоящее имя или название организации

Важно не чувствовать себя в безопасности только потому, что удаление было выполнено.

Откройте файл для публикации заново в другой среде и проверьте его.

Инструменты — это вспомогательные средства

Для проверки и конвертации PDF иногда используются локальные инструменты, такие как ExifTool.

ExifTool — типичный инструмент, используемый для проверки метаданных в разных форматах.

URL : https://exiftool.org/

Однако инструменты не всемогущи.

Инструменты помогают проверять и удалять внутреннюю информацию, но сведения, написанные в тексте, фоны на изображениях, уведомления на скриншотах и имена владельцев в ссылках совместного доступа нужно проверять отдельно.

Что могут инструментыЧто одних инструментов недостаточно покрывает
Проверка метаданныхСобственные имена в тексте
Удаление части метаданныхБезопасность закрашивания
Проверка структуры файлаФоны и отражения на изображениях
Конвертация форматаЖурналы и отображение владельца у адресата совместного доступа
Автоматическая обработкаЮридическое решение высокого риска

Для документов высокого риска не принимайте решение о публикации только по результату работы инструмента.

Есть информация, которую не следует удалять

Если смотреть только на анонимность, может захотеться удалить всю информацию.

Однако при консультациях пострадавших, внутреннем информировании и юридических консультациях часть информации следует сохранять как доказательство. Время создания исходного файла, история редактирования и маршрут отправки могут позже стать важными.

ИнформацияВ копии для публикацииВ консультации/доказательстве
Время созданияРассмотреть размывание или удалениеМожет стать необходимой записью
АвторУдалить перед публикациейМожет сохраняться в оригинале
История измененийУдалить из копии для публикацииМожет быть нужна для объяснения последовательности
АннотацииУдалить из копии для публикацииМогут стать записью внутренней проверки
Исходный файлНе публиковатьХранить в безопасном месте

Именно поэтому файл для публикации и хранимый оригинал разделяют.

Удаление, необходимое для защиты анонимности, и сохранение, необходимое для защиты доказательств, нужно рассматривать одновременно.

Имя и место хранения после удаления

Даже если метаданные удалены, имя файла и место хранения могут раскрывать информацию.

Например, имя файла может содержать настоящее имя, название компании или название дела. Облачная ссылка совместного доступа может показывать имя владельца аккаунта с реальным именем. Название рабочей папки может попасть на скриншот. Такую информацию проверяют отдельно от удаления метаданных.

Что проверитьПричина
Имя файлаИзбегать настоящих имен, названий организаций и названий дел
Имя папкиМожет появиться при демонстрации экрана или сжатии
Владелец облакаСвязывается с аккаунтом с реальным именем
URL совместного доступаМожет содержать личный ID или отслеживание
Время отправкиСопоставляется с записями активности

В конце работы по удалению проверьте состояние с точки зрения третьей стороны.

Даже если на вашем устройстве все выглядит безопасно, получатель может увидеть имя владельца, предпросмотр, карточку ссылки или имя файла. Если возможно, проверьте итоговое публичное состояние в другом браузере или другой среде.

При проверке после удаления важно смотреть не только на метаданные.

Также проверьте собственные имена в тексте, фоны изображений, адреса ссылок, имена файлов и отображаемое имя места загрузки. Работа по удалению должна идти вместе с проверкой всего итогового публикуемого объекта.

Записывайте работу по удалению

Для документов высокого риска запись того, что было удалено и что оставлено, упрощает последующую проверку.

Однако сама эта запись тоже требует осторожности. Если сохранить ее в облаке с реальным именем или на рабочем устройстве, она станет подсказкой, связывающей вас с очищаемыми материалами.

Что записыватьНа что обратить внимание
Удаленные элементыНе включать в файл для публикации
Оставленные элементыБыть готовым объяснить, почему они оставлены
Место хранения исходного файлаОграничить безопасным местом
Имя файла для публикацииНе включать персональную информацию
Время проверкиОсторожно с корреляцией с записями активности

Работа по удалению — часть решения о публикации.

После удаления проверяйте другим методом

Удаление метаданных не заканчивается только потому, что оно было выполнено.

Проверяйте методом, отличным от инструмента, использованного для удаления. Посмотрите свойства документа, выделите и скопируйте текст, откройте в другом PDF-просмотрщике, попробуйте скачать в другой среде. Несколько точек зрения помогают легче заметить пропущенное удаление или различия отображения.

Метод проверкиПроблемы, которые легче найти
Посмотреть свойства документаАвтор, заголовок, программа создания
Выделить и скопировать текстТекст под закрашиванием, скрытый текст
Открыть в другом просмотрщикеОставшиеся аннотации или формы
Проверить в другой средеИмена владельцев и отображение совместного доступа
Перечитать текстСобственные имена и контекстные утечки

В работе по удалению важнее итоговое состояние, которое будет опубликовано, чем сообщение инструмента об успехе.

В анонимности «я думал, что удалил» — самое опасное состояние. После удаления проверьте, как файл выглядит в среде получающей стороны.

Итог

Удаление метаданных PDF важно, но само по себе не делает файл безопасным.

Не публикуйте исходный файл напрямую. Создайте копию для публикации и проверьте автора, название компании, время создания, аннотации, встроенные элементы, формы и ссылки.

После удаления снова проверьте свойства документа, поиск, копирование, аннотации и имя файла.

Инструменты — это вспомогательные средства.

Текст, изображения, закрашивание, адресаты совместного доступа и юридические риски нужно проверять отдельно.

Связанные инструменты

Archive check

Wayback Machine

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://web.archive.org/

Открыть внешний сайт
Metadata inspection

ExifTool

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://exiftool.org/

Открыть внешний сайт
Metadata removal

MAT2

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://0xacab.org/jvoisin/mat2

Открыть внешний сайт
PDF inspection

qpdf

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://qpdf.readthedocs.io/

Открыть внешний сайт

Связанные статьи