Руководство по qpdf / MAT2
Когда нужно проверить или удалить метаданные в PDF и документных файлах, возможными вариантами становятся локальные инструменты вроде qpdf и MAT2.
Однако одно запоминание названий инструментов не защищает анонимность.
Важно понимать, какой инструмент с чем работает, а с чем не работает.
В этой статье систематизированы роли qpdf и MAT2, их место в контексте анонимности и ограничения при использовании.
Что такое qpdf
qpdf — это инструмент, используемый для проверки структуры PDF-файлов и преобразования.
Поскольку он работает с внутренней структурой PDF, он появляется в процессах проверки и повторного создания PDF.
В официальной документации можно проверить функции и способы использования.
URL : https://qpdf.readthedocs.io/
В контексте анонимности qpdf не является инструментом, который автоматически делает PDF безопасным.
Это инструмент для работы со структурой PDF.
Его используют вместе с проверкой создателей, примечаний, встроенных объектов, скрытого текста и похожих элементов.
Что такое MAT2
MAT2 — это инструмент удаления метаданных, опубликованный как Metadata Anonymisation Toolkit. Официальный репозиторий сейчас архивирован и доступен только для чтения.
Он используется для совместной обработки удаления метаданных в нескольких форматах, таких как изображения, документы и аудио.
В официальном репозитории можно проверить поддерживаемые форматы и способы использования.
URL : https://0xacab.org/jvoisin/mat2
MAT2 удобен тем, что может работать сразу с несколькими форматами, но перед использованием нужно проверить состояние сопровождения и источник распространения.
Однако то, что файл прошел через MAT2, не означает, что признаки в содержимом или внешнем виде файла исчезают.
Различие между qpdf и MAT2
qpdf и MAT2 — это не инструменты для одной и той же цели.
| Пункт | qpdf | MAT2 |
|---|---|---|
| Основная цель | Удаление метаданных в нескольких форматах | |
| Сильная сторона | Обработка и преобразование структуры PDF | Автоматизация удаления метаданных |
| Роль для анонимности | Помощь в проверке и повторном создании с учетом внутренней структуры PDF | Помощь в удалении метаданных из файлов для публикации |
| На что обратить внимание | Содержимое PDF нужно оценивать отдельно | После удаления нужна повторная проверка |
Ни один из них сам по себе не гарантирует анонимность.
Для анонимности проверка до удаления, обработка, повторная проверка после удаления и визуальная проверка выполняются как единый набор действий.
Что использовать
qpdf и MAT2 выбирают исходя из цели.
| Цель | Кандидат | Причина |
|---|---|---|
| Проверить структуру PDF | qpdf | Подходит для работы с внутренней структурой PDF |
| Повторно создать PDF | qpdf | Может выполнять обработку PDF, например преобразование и линеаризацию |
| Удалить метаданные из нескольких форматов | MAT2 | Может работать вместе с изображениями, документами и похожими файлами |
| Проверить, что осталось после удаления | Использовать также ExifTool и подобные инструменты | Чтобы проверить с другой точки зрения |
| Работать с документами высокого риска | Проверять несколькими способами | Чтобы не переоценивать один инструмент |
Первое, о чем должен думать начинающий, — не название инструмента.
Это формат файла и то, какую информацию нужно удалить.
Если нужно посмотреть структуру PDF, выбирают qpdf; если нужно удалить метаданные из нескольких форматов, выбирают MAT2, то есть исходят из цели.
Модель доверия, важная при представлении инструментов
Преимущество локальных инструментов в том, что файлы можно обрабатывать, не передавая их внешним веб-сервисам.
Однако у локальных инструментов тоже есть модель доверия.
| Чему доверяют | На что обратить внимание |
|---|---|
| Сам инструмент | Проверять официальный сайт и источник распространения |
| Устройство выполнения | На рабочих устройствах, общих ПК и управляемых устройствах могут оставаться журналы |
| Место хранения | Если это папка с облачной синхронизацией, остается история |
| Результат обработки | Нужно повторно проверить, удалось ли удалить |
| Рабочие записи | Снимки экрана и заметки сами могут стать следами |
Избежать внешних сервисов не значит, что собственная среда устройства безопасна.
Для анонимности учитывают и то, где, с какими файлами и в каком месте хранения используется инструмент.
Что обдумать перед использованием
Перед использованием инструмента решите, что вы хотите защитить.
| Проверка | Причина |
|---|---|
| Какой это формат файла? | Для PDF, изображения, Office и аудио различаются элементы проверки |
| Что вы хотите удалить? | Разделять автора, GPS, дату и время, примечания и подобную информацию |
| Оставлять ли оригинал? | Чтобы не смешать его с копией для публикации |
| На каком устройстве работать? | Чтобы избегать рабочих устройств и облачной синхронизации |
| Чем проверять после удаления? | Чтобы проверить результат обработки |
Если сразу запустить инструмент удаления, станет непонятно, что исчезло.
Сначала проверяйте, затем обрабатывайте, а в конце проверяйте повторно.
Что инструменты не могут удалить
Даже при использовании qpdf или MAT2 есть вещи, которые не исчезают.
| Что остается | Пример |
|---|---|
| Содержимое основного текста | Имена собственные, хронология, внутренние термины |
| Внешний вид изображения | Фон, отражения, вывески, лица |
| Содержимое аудио или видео | Голоса, окружающие звуки, объявления |
| Имя файла | Настоящее имя, название отдела, название дела |
| Канал передачи | Время загрузки, IP, аккаунт |
Инструменты удаления метаданных — это инструменты для уменьшения части информации внутри файлов.
Они не оценивают за вас содержимое документа или способ публикации.
Повторная проверка после обработки
После использования qpdf или MAT2 обязательно проверяйте повторно.
При повторной проверке используйте не только тот же инструмент, но и другие точки зрения.
| Проверка | Причина |
|---|---|
| Посмотреть через ExifTool | Проверить метаданные в пределах того, что видит ExifTool |
| Открыть файл | Посмотреть сбои отображения и оставшийся текст |
| Попробовать поиск и копирование | Проверить, не остался ли текст под закрашиванием |
| Посмотреть имя файла | Проверить, не остались ли имена или названия дел |
| Открыть в другой среде | Проверить, не скрыто ли это только в вашей среде |
Момент, когда кажется, что удаление удалось, — это момент, когда легче всего что-то пропустить.
Считайте повторную проверку после обработки частью той же работы.
Не добавлять слишком много инструментов
Когда анонимность кажется неопределенной, хочется использовать много инструментов один за другим.
Однако чем больше инструментов, тем больше рабочих ошибок и смешивания файлов.
Сначала важно разделить исходный файл, копию для публикации и обработанный файл.
После этого используйте инструменты с разными ролями, такие как qpdf, MAT2 и ExifTool, только в необходимом объеме.
Нужно прийти к состоянию, в котором можно объяснить не «какой инструмент использовался», а «какой файл был проверен и чего в нем не осталось».
Осторожность с документами высокого риска
Для документов, связанных с сообщениями информаторов, материалами журналистской работы, записями активности или персональными данными, важна не только работа с инструментами, но и рабочая среда.
Если обрабатывать их на рабочем устройстве, могут остаться журналы устройства и история доступа к файлам.
Если работать в личной папке с облачной синхронизацией, будут иметь значение история синхронизации и данные аккаунта.
Если сохранить результаты проверки как снимки экрана, в этих снимках тоже могут попасть пути к файлам или имена пользователей.
Перед использованием инструментов отдельно продумайте рабочую среду, место хранения, место публикации и канал консультации.
Итоги
qpdf — это инструмент для проверки структуры PDF и преобразования.
MAT2 — это инструмент, работающий с удалением метаданных в нескольких форматах.
Оба помогают при проверке анонимности, но ни один сам по себе не гарантирует безопасность.
Перед использованием инструментов решите, что хотите удалить.
После обработки повторно проверьте другим способом, например ExifTool, а также проверьте основной текст, фон, имена файлов и канал передачи.
Для анонимности важнее не использование инструмента, а соблюдение процесса проверки, обработки, повторной проверки и решения о публикации.
Связанные инструменты
ExifTool
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.
URL : https://exiftool.org/
MAT2
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.
qpdf
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.