Learn

38 статейКатегория: Все
Метаданные

Руководство по qpdf / MAT2

Когда нужно проверить или удалить метаданные в PDF и документных файлах, возможными вариантами становятся локальные инструменты вроде qpdf и MAT2.

Однако одно запоминание названий инструментов не защищает анонимность.

Важно понимать, какой инструмент с чем работает, а с чем не работает.

В этой статье систематизированы роли qpdf и MAT2, их место в контексте анонимности и ограничения при использовании.

Что такое qpdf

qpdf — это инструмент, используемый для проверки структуры PDF-файлов и преобразования.

Поскольку он работает с внутренней структурой PDF, он появляется в процессах проверки и повторного создания PDF.

В официальной документации можно проверить функции и способы использования.

URL : https://qpdf.readthedocs.io/

В контексте анонимности qpdf не является инструментом, который автоматически делает PDF безопасным.

Это инструмент для работы со структурой PDF.

Его используют вместе с проверкой создателей, примечаний, встроенных объектов, скрытого текста и похожих элементов.

Что такое MAT2

MAT2 — это инструмент удаления метаданных, опубликованный как Metadata Anonymisation Toolkit. Официальный репозиторий сейчас архивирован и доступен только для чтения.

Он используется для совместной обработки удаления метаданных в нескольких форматах, таких как изображения, документы и аудио.

В официальном репозитории можно проверить поддерживаемые форматы и способы использования.

URL : https://0xacab.org/jvoisin/mat2

MAT2 удобен тем, что может работать сразу с несколькими форматами, но перед использованием нужно проверить состояние сопровождения и источник распространения.

Однако то, что файл прошел через MAT2, не означает, что признаки в содержимом или внешнем виде файла исчезают.

Различие между qpdf и MAT2

qpdf и MAT2 — это не инструменты для одной и той же цели.

ПунктqpdfMAT2
Основная цельPDFУдаление метаданных в нескольких форматах
Сильная сторонаОбработка и преобразование структуры PDFАвтоматизация удаления метаданных
Роль для анонимностиПомощь в проверке и повторном создании с учетом внутренней структуры PDFПомощь в удалении метаданных из файлов для публикации
На что обратить вниманиеСодержимое PDF нужно оценивать отдельноПосле удаления нужна повторная проверка

Ни один из них сам по себе не гарантирует анонимность.

Для анонимности проверка до удаления, обработка, повторная проверка после удаления и визуальная проверка выполняются как единый набор действий.

Что использовать

qpdf и MAT2 выбирают исходя из цели.

ЦельКандидатПричина
Проверить структуру PDFqpdfПодходит для работы с внутренней структурой PDF
Повторно создать PDFqpdfМожет выполнять обработку PDF, например преобразование и линеаризацию
Удалить метаданные из нескольких форматовMAT2Может работать вместе с изображениями, документами и похожими файлами
Проверить, что осталось после удаленияИспользовать также ExifTool и подобные инструментыЧтобы проверить с другой точки зрения
Работать с документами высокого рискаПроверять несколькими способамиЧтобы не переоценивать один инструмент

Первое, о чем должен думать начинающий, — не название инструмента.

Это формат файла и то, какую информацию нужно удалить.

Если нужно посмотреть структуру PDF, выбирают qpdf; если нужно удалить метаданные из нескольких форматов, выбирают MAT2, то есть исходят из цели.

Модель доверия, важная при представлении инструментов

Преимущество локальных инструментов в том, что файлы можно обрабатывать, не передавая их внешним веб-сервисам.

Однако у локальных инструментов тоже есть модель доверия.

Чему доверяютНа что обратить внимание
Сам инструментПроверять официальный сайт и источник распространения
Устройство выполненияНа рабочих устройствах, общих ПК и управляемых устройствах могут оставаться журналы
Место храненияЕсли это папка с облачной синхронизацией, остается история
Результат обработкиНужно повторно проверить, удалось ли удалить
Рабочие записиСнимки экрана и заметки сами могут стать следами

Избежать внешних сервисов не значит, что собственная среда устройства безопасна.

Для анонимности учитывают и то, где, с какими файлами и в каком месте хранения используется инструмент.

Что обдумать перед использованием

Перед использованием инструмента решите, что вы хотите защитить.

ПроверкаПричина
Какой это формат файла?Для PDF, изображения, Office и аудио различаются элементы проверки
Что вы хотите удалить?Разделять автора, GPS, дату и время, примечания и подобную информацию
Оставлять ли оригинал?Чтобы не смешать его с копией для публикации
На каком устройстве работать?Чтобы избегать рабочих устройств и облачной синхронизации
Чем проверять после удаления?Чтобы проверить результат обработки

Если сразу запустить инструмент удаления, станет непонятно, что исчезло.

Сначала проверяйте, затем обрабатывайте, а в конце проверяйте повторно.

Что инструменты не могут удалить

Даже при использовании qpdf или MAT2 есть вещи, которые не исчезают.

Что остаетсяПример
Содержимое основного текстаИмена собственные, хронология, внутренние термины
Внешний вид изображенияФон, отражения, вывески, лица
Содержимое аудио или видеоГолоса, окружающие звуки, объявления
Имя файлаНастоящее имя, название отдела, название дела
Канал передачиВремя загрузки, IP, аккаунт

Инструменты удаления метаданных — это инструменты для уменьшения части информации внутри файлов.

Они не оценивают за вас содержимое документа или способ публикации.

Повторная проверка после обработки

После использования qpdf или MAT2 обязательно проверяйте повторно.

При повторной проверке используйте не только тот же инструмент, но и другие точки зрения.

ПроверкаПричина
Посмотреть через ExifToolПроверить метаданные в пределах того, что видит ExifTool
Открыть файлПосмотреть сбои отображения и оставшийся текст
Попробовать поиск и копированиеПроверить, не остался ли текст под закрашиванием
Посмотреть имя файлаПроверить, не остались ли имена или названия дел
Открыть в другой средеПроверить, не скрыто ли это только в вашей среде

Момент, когда кажется, что удаление удалось, — это момент, когда легче всего что-то пропустить.

Считайте повторную проверку после обработки частью той же работы.

Не добавлять слишком много инструментов

Когда анонимность кажется неопределенной, хочется использовать много инструментов один за другим.

Однако чем больше инструментов, тем больше рабочих ошибок и смешивания файлов.

Сначала важно разделить исходный файл, копию для публикации и обработанный файл.

После этого используйте инструменты с разными ролями, такие как qpdf, MAT2 и ExifTool, только в необходимом объеме.

Нужно прийти к состоянию, в котором можно объяснить не «какой инструмент использовался», а «какой файл был проверен и чего в нем не осталось».

Осторожность с документами высокого риска

Для документов, связанных с сообщениями информаторов, материалами журналистской работы, записями активности или персональными данными, важна не только работа с инструментами, но и рабочая среда.

Если обрабатывать их на рабочем устройстве, могут остаться журналы устройства и история доступа к файлам.

Если работать в личной папке с облачной синхронизацией, будут иметь значение история синхронизации и данные аккаунта.

Если сохранить результаты проверки как снимки экрана, в этих снимках тоже могут попасть пути к файлам или имена пользователей.

Перед использованием инструментов отдельно продумайте рабочую среду, место хранения, место публикации и канал консультации.

Итоги

qpdf — это инструмент для проверки структуры PDF и преобразования.

MAT2 — это инструмент, работающий с удалением метаданных в нескольких форматах.

Оба помогают при проверке анонимности, но ни один сам по себе не гарантирует безопасность.

Перед использованием инструментов решите, что хотите удалить.

После обработки повторно проверьте другим способом, например ExifTool, а также проверьте основной текст, фон, имена файлов и канал передачи.

Для анонимности важнее не использование инструмента, а соблюдение процесса проверки, обработки, повторной проверки и решения о публикации.

Связанные инструменты

Metadata inspection

ExifTool

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://exiftool.org/

Открыть внешний сайт
Metadata removal

MAT2

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://0xacab.org/jvoisin/mat2

Открыть внешний сайт
PDF inspection

qpdf

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://qpdf.readthedocs.io/

Открыть внешний сайт

Связанные статьи