Learn

284 статейКатегория: Все
Метаданные

Риски ID3-тегов

В аудиофайлах, помимо самого звука, может сохраняться теговая информация.

ID3-теги, часто используемые в MP3, могут содержать название, имя исполнителя, название альбома, автора, комментарии, изображения и сведения, связанные с записью или редактированием.

Если вы публикуете аудио анонимно, но в ID3-тегах остаются настоящее имя, имя аккаунта, среда создания или исходное имя файла, анонимность ослабевает даже при обработанном голосе.

В этой статье разбирается, что такое ID3-теги, какая информация создает риск и что проверять перед публикацией.

Что такое ID3-теги

ID3-теги — это метаданные, которые в основном добавляются к MP3-файлам.

Музыкальные проигрыватели показывают название трека, имя исполнителя и обложку альбома именно благодаря такой теговой информации.

Теговая информацияСодержаниеНа что обратить внимание для анонимности
TitleНазваниеМожет раскрыть исходное имя записи или содержание
ArtistИмя исполнителяМожет сохранить настоящее имя или имя аккаунта
AlbumНазвание альбомаМожет сохранить название проекта или категорию
CommentКомментарийМожет сохранить заметки редактирования или внутреннюю информацию
Cover ArtВстроенное изображениеУчитывать информацию внутри изображения и его метаданные
SoftwareПрограмма создания или редактированияМожет стать признаком рабочей среды

Теговую информацию аудиофайла нельзя полностью проверить только по экрану воспроизведения.

Поэтому теги легко пропустить.

Почему ID3-теги связаны с анонимностью

При анонимной публикации аудио многие обращают внимание на голос и содержание.

Однако информация остается и в тегах внутри файла.

Например, приложение записи может автоматически присвоить название, редактор может вставить имя автора, а в изображении обложки может быть встроена другая информация.

СитуацияКакая информация может остаться
Запись на смартфонВремя записи, имя приложения, исходное имя файла
АудиоредакторАвтор, название проекта, имя программы
Экспорт подкастаНазвание, имя автора, название передачи
Передача голосовой заметкиКомментарий, имя записи, сведения об устройстве
Аудио с обложкойМетаданные изображения и видимая информация

Одни ID3-теги не всегда позволяют установить человека.

Но вместе с голосом, манерой речи, содержанием, временем публикации, аккаунтом и прошлыми аудио они становятся материалом для корреляции.

ID3-теги и встроенные изображения

В аудиофайл может быть встроена обложка.

Это изображение тоже требует внимания.

На обложке могут быть лицо, логотип, место или имя автора. Кроме того, само изображение может содержать метаданные.

Информация встроенного изображенияРиск
Фотография лицаМожно узнать самого человека или связанных людей
ЛоготипВидна принадлежность, организация или проект
МестоВидно место съемки или привычные места
ТекстОстаются имя, название события, дата
Метаданные изображенияМогут оставаться время создания и сведения редактирования

При проверке аудиофайла смотрите не только звук, но и встроенные изображения.

Даже если проигрыватель не показывает изображение визуально, оно может оставаться внутри тегов.

Голос и теги проверяются отдельно

Даже если удалить ID3-теги, голос и фоновые звуки останутся.

И наоборот, даже при обработанном голосе в тегах может остаться имя автора.

Объект проверкиЧто смотреть
Теговая информацияНазвание, автор, комментарии, изображения, имя программы
ГолосТембр, манера речи, диалект, привычки
СодержаниеИмена собственные, хронология, места, связанные люди
Фоновые звукиСтанция, магазин, рабочее место, школа, домашние звуки
Имя файлаИмя, дата, место, название проекта

Анонимность аудиофайла не определяется только удалением тегов.

Проверяйте отдельно внутреннюю информацию файла, содержание аудио, имя файла и среду публикации.

Проверка перед публикацией

Перед публикацией аудиофайла проверьте его в следующем порядке.

ПорядокПроверкаПричина
1Посмотреть ID3-тегиПроверить, не остались ли название, автор, комментарии
2Посмотреть встроенные изображенияПроверить обложку и метаданные изображения
3Посмотреть имя файлаПроверить, не содержит ли оно настоящее имя, дату, место
4Прослушать аудио до концаПроверить голос, разговоры, фоновые звуки
5Проверить повторно после обработкиУбедиться, что удаление или преобразование сработало

Даже короткий аудиофайл содержит много информации.

Мгновенные детали тоже остаются: кто-то на фоне называет имя, звучит название станции, слышен звук уведомления.

Повторная проверка после удаления тегов

После удаления ID3-тегов обязательно проверьте файл повторно.

В зависимости от инструмента удаления или преобразования часть тегов может исчезнуть, а другие теги остаться.

ПроверкаПричина
Исчезли ли название и авторПроверить прямую идентифицирующую информацию
Не остались ли комментарииНайти заметки редактирования и внутреннюю информацию
Исчезло ли встроенное изображениеПроверить, не осталась ли обложка
Не добавилось ли новое имя программы созданияПроверить информацию после преобразования
Нет ли проблемы в имени файлаИзбежать утечки внешней информации

После преобразования аудиофайла могут появиться новые метаданные.

Поэтому проверку после обработки нужно включать в проверку перед публикацией.

Инструменты для проверки

Для проверки метаданных иногда используют ExifTool.

URL : https://exiftool.org/

Для преобразования и повторного кодирования аудио используют FFmpeg.

URL : https://ffmpeg.org/

При высокорисковом аудио не загружайте файл на сайты онлайн-конвертации или онлайн-редактирования тегов; по возможности проверяйте и обрабатывайте его локально. Внешним сервисам могут передаваться содержание файла, исходный IP-адрес, время проверки и сведения браузера.

Однако инструменты не понимают смысл аудио.

Даже после удаления ID3-тегов признаки, оставшиеся в голосе и фоновых звуках, должен проверять человек.

Для высокорискового аудио подумайте о формате публикации

В высокорисковых случаях можно решить не публиковать аудио как есть.

Возможны варианты: расшифровать голос и опубликовать только содержание, обобщить имена собственные, не публиковать звук и дать краткое изложение, попросить доверенного человека проверить материал с пониманием рисков передачи.

Однако даже расшифровка сохраняет признаки стиля и содержания.

Изменение формата не делает материал безопасным само по себе; важно выбрать, какая информация остается.

ID3-теги остаются и при повторном распространении

Аудиофайл могут скачать и повторно загрузить в другое место.

Если в опубликованном файле остались теги, они продолжат жить в копиях, даже если позже вы удалите их у себя.

Проверка перед публикацией особенно важна для аудио, которое склонны сохранять: подкастов, звуковых материалов, записанных заметок, записей активности.

Надежнее проверить теги перед публикацией, чем заметить их после публикации и удалять файл.

Корреляция с другой информацией

ID3-теги становятся сильнее, когда связываются с другой информацией.

СочетаниеЧто происходит
Artist + голосИмя в теге и голос создают похожесть на одного человека
Время создания + время публикацииМожно предположить публикацию сразу после записи
Комментарий + содержаниеЗаметка редактирования связывается с высказыванием
Обложка + прошлые изображенияСвязывает с другим аккаунтом
Имя файла + тегиНакладывается информация вне основного текста

В анонимности ID3-теги не рассматривают отдельно.

Проверяйте их вместе с содержанием аудио, аккаунтом, временем публикации и прошлыми опубликованными материалами.

Итоги

ID3-теги — это метаданные, сохраняемые в аудиофайле.

В них могут оставаться название, автор, комментарии, встроенные изображения, программа создания и другие сведения.

При анонимной публикации аудио нужно проверять не только голос и содержание, но и теговую информацию.

Даже после удаления тегов остаются голос, манера речи, фоновые звуки, имя файла и время публикации.

Для аудиофайлов проверяйте метаданные, само аудио, имя файла и результат после обработки как единый набор действий.

Связанные инструменты

Metadata inspection

ExifTool

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://exiftool.org/

Открыть внешний сайт
Metadata removal

MAT2

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://0xacab.org/jvoisin/mat2

Открыть внешний сайт
Audio and video

FFmpeg

Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.

Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.

URL : https://ffmpeg.org/

Открыть внешний сайт

Связанные статьи