Learn

38 статейКатегория: Все
Метаданные

Метаданные в PDF-, Office-, видео- и аудиофайлах

Информация в изображениях хорошо известна. Однако метаданные, на которые нужно обращать внимание для анонимности, не ограничиваются изображениями.

В PDF, документах Office, видео, аудиофайлах и сжатых файлах тоже могут оставаться имена авторов, история редактирования, использованное программное обеспечение, дата и время съемки или записи, информация тегов, комментарии, внутренние имена файлов и похожие сведения.

Даже если визуально кажется, что вы что-то удалили, внутри файла может оставаться другая информация. Кроме того, даже если удалить метаданные, личность или принадлежность могут быть выведены из текста, фона, аудио, текста на экране или имени файла.

В этой статье систематизировано, какие сведения часто остаются в разных форматах файлов и что нужно проверять перед публикацией.

Метаданные — это сопутствующая информация файла

Метаданные — это информация, связанная с самим файлом.

Отдельно от текста документа или самого изображения они могут включать автора, дату и время создания, программу редактирования, данные о местоположении, историю изменений, комментарии и похожие сведения.

Для анонимности метаданные становятся сильными признаками. Причина в том, что даже если имя не написано в тексте, внутри файла может остаться имя автора или название организации.

ФорматСведения, которые часто остаютсяВнимание
PDFАвтор, программа создания, примечания, встроенные файлыВажно обращать внимание на обработку закрашивания и примечаний
Документы OfficeАвтор, название компании, история изменений, комментарииОстаются скрытые листы и сведения рецензирования
ВидеоДата и время съемки, сведения об устройстве, данные о местоположении, программа редактированияАудио и фон тоже становятся признаками
АудиоID3-теги, дата и время записи, сведения о приложенииПроверять также голоса и фоновые звуки
Сжатые файлыВнутренние имена файлов, имена папок, ненужные файлыМогут смешаться рабочие данные

Метаданные выглядят по-разному в зависимости от формата файла. Поэтому не стоит решать, что все безопасно, на основании одного способа проверки.

Сведения, на которые нужно обращать внимание в PDF

PDF — это формат, удобный для распространения документов. Однако при анонимной публикации материалов нужна осторожность.

В PDF могут оставаться имена авторов, даты и время создания, программа создания, заголовки, примечания, встроенные файлы, данные форм и похожие сведения.

Кроме того, даже если визуально кажется, что текст закрашен, исходная текстовая информация может оставаться внутри. Если просто наложить черный прямоугольник как изображение, исходный текст иногда можно извлечь копированием или поиском.

Что проверятьПричина
Свойства документаОстаются имя автора и программа создания
ПримечанияВидны комментарии и редакторские заметки
Встроенные файлыВключены исходные материалы или ненужные данные
Обработка закрашиванияПроверить, не остается ли исходный текст внутри
Имя файлаМогут входить названия дел, организаций или настоящие имена

PDF выглядит как файл для публикации, но его внутренняя структура не обязательно безопасна. Для материалов высокого риска проверяйте локальными инструментами и при необходимости создавайте заново в более безопасной форме.

Сведения, на которые нужно обращать внимание в документах Office

Документы Office, такие как Word, Excel и PowerPoint, — это форматы, в которых часто остается история работы.

Они могут содержать имена авторов, названия компаний, историю изменений, комментарии, скрытые листы, шаблоны, ссылки, историю совместного редактирования и похожие сведения.

В случае материалов для внутреннего разоблачения или журналистских материалов передача документов Office как есть требует особой осторожности. Причина в том, что может остаться не только содержимое документа, но и сведения о том, кто его создал и в какой организационной среде он редактировался.

Что проверятьВидимые сведения
АвторЛичное имя или имя аккаунта
Название компанииОрганизация или настройки устройства
История измененийКто какую часть редактировал
КомментарииВнутренние разговоры или следы решений
Скрытые листыДанные, которые не отображаются
СсылкиВнутренние пути или облачные URL

Для документов Office важно не судить только по видимой странице. При подготовке версии для публикации удаляйте ненужную историю, экспортируйте в другой формат, а затем проверяйте снова.

Сведения, на которые нужно обращать внимание в видео

В видео нужно обращать внимание и на метаданные, и на содержимое.

Внутри файла могут оставаться дата и время съемки, сведения об устройстве, данные о местоположении, программа редактирования и сведения о кодировании. Кроме того, само видео может показывать лица, фон, вывески, униформу, транспорт, отражения в окнах, уведомления и имена аккаунтов на экране.

Поскольку видео содержит больше информации, чем неподвижные изображения, проверять анонимность также сложнее.

Что проверятьПричина
Дата и время съемкиСвязывается со временем действий или участием на месте
Данные о местоположенииСтановится понятно место съемки
Сведения об устройствеВидна модель устройства или среда редактирования
ФонЗдания, вывески и пейзаж раскрывают место
АудиоГолоса, окружающие звуки и разговоры становятся признаками
УведомленияМогут быть видны имена аккаунтов или контакты

В видео проверка содержимого остается необходимой даже после удаления метаданных. Даже в коротком видео несколько секунд фона или звука могут позволить предположить место или человека.

Сведения, на которые нужно обращать внимание в аудио

У аудиофайлов тоже есть метаданные.

MP3 и похожие файлы могут содержать информацию тегов, такую как название, исполнитель, альбом, программа создания и комментарии. Также могут оставаться сведения о приложении записи или программе редактирования.

Кроме того, в аудио само содержимое является сильным признаком. Человека или место могут предположить по голосу, манере речи, диалекту, фоновым звукам, звукам уведомлений, объявлениям на станции, звукам машин, эху помещения и похожим деталям.

Что проверятьПричина
ID3-тегиОстаются название или сведения об авторе
Дата и время записиМожет сопоставляться со временем действий
Приложение созданияСтановится признаком среды использования
ГолосРаскрывает самого человека или связанных людей
Фоновые звукиРаскрывают место или ситуацию

При анонимной публикации аудио удаления метаданных недостаточно. Проверяйте также тембр голоса, манеру речи и фоновые звуки.

Сведения, на которые нужно обращать внимание в сжатых файлах

Сжатые файлы, такие как ZIP, используются, когда несколько файлов передаются вместе.

В сжатых файлах обращайте внимание на внутренние имена файлов, имена папок, ненужные файлы и рабочие данные.

Например, даже если вы собирались положить только PDF для публикации, в той же папке могут оказаться исходный документ Office, заметки, снимки экрана или скрытые файлы. Имена папок тоже могут содержать настоящее имя, название дела или название компании.

Всегда проверяйте содержимое сжатого файла, когда открываете его.

Базовый порядок проверки

Порядок проверки общий независимо от формата файла.

ЭтапЧто проверять
1Не публиковать исходный файл напрямую
2Создать копию для публикации
3Проверить имя файла
4Проверить метаданные
5Проверить текст, изображения, аудио и фон
6После удаления или преобразования проверить снова
7Проверить, как место загрузки покажет файл другой стороне

Инструменты вроде ExifTool используются для проверки метаданных в нескольких форматах.

ExifTool — распространенный локальный инструмент, который позволяет проверять и редактировать метаданные в нескольких форматах, включая изображения, видео и документы. При изучении различий между форматами файлов он также становится отправной точкой для проверки того, какие сведения действительно находятся внутри. URL : https://exiftool.org/

Однако не останавливайтесь только на результатах инструмента. Инструменты помогают проверять внутреннюю информацию, но фон изображения, текст документа, содержимое аудио и отображение владельца в месте загрузки нужно проверять отдельно.

Итоги

Метаданные — это проблема не только изображений.

В PDF, документах Office, видео, аудиофайлах и сжатых файлах также могут оставаться автор, история редактирования, программа создания, теги, данные о местоположении, внутренние имена файлов и похожие сведения.

Для анонимности проверяйте содержимое файла и метаданные отдельно. Даже если удалить метаданные, личность или принадлежность могут быть выведены из текста, фона, аудио, отражений, имени файла и настроек общего доступа.

Перед публикацией не передавайте исходный файл напрямую: создайте копию для публикации, проверьте по формату и после удаления проверьте снова. Нужно считать, что передача файла может передавать не только текст, но и среду создания и путь передачи.

Связанные инструменты

Archive check

Wayback Machine

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://web.archive.org/

Открыть внешний сайт
Metadata inspection

ExifTool

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://exiftool.org/

Открыть внешний сайт
Metadata removal

MAT2

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://0xacab.org/jvoisin/mat2

Открыть внешний сайт
PDF inspection

qpdf

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://qpdf.readthedocs.io/

Открыть внешний сайт
Audio and video

FFmpeg

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://ffmpeg.org/

Открыть внешний сайт

Связанные статьи