В аудиофайлах, помимо самого звука, может сохраняться теговая информация.
ID3-теги, часто используемые в MP3, могут содержать название, имя исполнителя, название альбома, автора, комментарии, изображения и сведения, связанные с записью или редактированием.
Если вы публикуете аудио анонимно, но в ID3-тегах остаются настоящее имя, имя аккаунта, среда создания или исходное имя файла, анонимность ослабевает даже при обработанном голосе.
В этой статье разбирается, что такое ID3-теги, какая информация создает риск и что проверять перед публикацией.
Что такое ID3-теги
ID3-теги — это метаданные, которые в основном добавляются к MP3-файлам.
Музыкальные проигрыватели показывают название трека, имя исполнителя и обложку альбома именно благодаря такой теговой информации.
Теговая информация
Содержание
На что обратить внимание для анонимности
Title
Название
Может раскрыть исходное имя записи или содержание
Artist
Имя исполнителя
Может сохранить настоящее имя или имя аккаунта
Album
Название альбома
Может сохранить название проекта или категорию
Comment
Комментарий
Может сохранить заметки редактирования или внутреннюю информацию
Cover Art
Встроенное изображение
Учитывать информацию внутри изображения и его метаданные
Software
Программа создания или редактирования
Может стать признаком рабочей среды
Теговую информацию аудиофайла нельзя полностью проверить только по экрану воспроизведения.
Поэтому теги легко пропустить.
Почему ID3-теги связаны с анонимностью
При анонимной публикации аудио многие обращают внимание на голос и содержание.
Однако информация остается и в тегах внутри файла.
Например, приложение записи может автоматически присвоить название, редактор может вставить имя автора, а в изображении обложки может быть встроена другая информация.
Ситуация
Какая информация может остаться
Запись на смартфон
Время записи, имя приложения, исходное имя файла
Аудиоредактор
Автор, название проекта, имя программы
Экспорт подкаста
Название, имя автора, название передачи
Передача голосовой заметки
Комментарий, имя записи, сведения об устройстве
Аудио с обложкой
Метаданные изображения и видимая информация
Одни ID3-теги не всегда позволяют установить человека.
Но вместе с голосом, манерой речи, содержанием, временем публикации, аккаунтом и прошлыми аудио они становятся материалом для корреляции.
ID3-теги и встроенные изображения
В аудиофайл может быть встроена обложка.
Это изображение тоже требует внимания.
На обложке могут быть лицо, логотип, место или имя автора. Кроме того, само изображение может содержать метаданные.
Информация встроенного изображения
Риск
Фотография лица
Можно узнать самого человека или связанных людей
Логотип
Видна принадлежность, организация или проект
Место
Видно место съемки или привычные места
Текст
Остаются имя, название события, дата
Метаданные изображения
Могут оставаться время создания и сведения редактирования
При проверке аудиофайла смотрите не только звук, но и встроенные изображения.
Даже если проигрыватель не показывает изображение визуально, оно может оставаться внутри тегов.
Голос и теги проверяются отдельно
Даже если удалить ID3-теги, голос и фоновые звуки останутся.
И наоборот, даже при обработанном голосе в тегах может остаться имя автора.
Объект проверки
Что смотреть
Теговая информация
Название, автор, комментарии, изображения, имя программы
Голос
Тембр, манера речи, диалект, привычки
Содержание
Имена собственные, хронология, места, связанные люди
Фоновые звуки
Станция, магазин, рабочее место, школа, домашние звуки
Имя файла
Имя, дата, место, название проекта
Анонимность аудиофайла не определяется только удалением тегов.
Проверяйте отдельно внутреннюю информацию файла, содержание аудио, имя файла и среду публикации.
Проверка перед публикацией
Перед публикацией аудиофайла проверьте его в следующем порядке.
Порядок
Проверка
Причина
1
Посмотреть ID3-теги
Проверить, не остались ли название, автор, комментарии
2
Посмотреть встроенные изображения
Проверить обложку и метаданные изображения
3
Посмотреть имя файла
Проверить, не содержит ли оно настоящее имя, дату, место
4
Прослушать аудио до конца
Проверить голос, разговоры, фоновые звуки
5
Проверить повторно после обработки
Убедиться, что удаление или преобразование сработало
Даже короткий аудиофайл содержит много информации.
Мгновенные детали тоже остаются: кто-то на фоне называет имя, звучит название станции, слышен звук уведомления.
Повторная проверка после удаления тегов
После удаления ID3-тегов обязательно проверьте файл повторно.
В зависимости от инструмента удаления или преобразования часть тегов может исчезнуть, а другие теги остаться.
Проверка
Причина
Исчезли ли название и автор
Проверить прямую идентифицирующую информацию
Не остались ли комментарии
Найти заметки редактирования и внутреннюю информацию
Исчезло ли встроенное изображение
Проверить, не осталась ли обложка
Не добавилось ли новое имя программы создания
Проверить информацию после преобразования
Нет ли проблемы в имени файла
Избежать утечки внешней информации
После преобразования аудиофайла могут появиться новые метаданные.
Поэтому проверку после обработки нужно включать в проверку перед публикацией.
Инструменты для проверки
Для проверки метаданных иногда используют ExifTool.
При высокорисковом аудио не загружайте файл на сайты онлайн-конвертации или онлайн-редактирования тегов; по возможности проверяйте и обрабатывайте его локально. Внешним сервисам могут передаваться содержание файла, исходный IP-адрес, время проверки и сведения браузера.
Однако инструменты не понимают смысл аудио.
Даже после удаления ID3-тегов признаки, оставшиеся в голосе и фоновых звуках, должен проверять человек.
Для высокорискового аудио подумайте о формате публикации
В высокорисковых случаях можно решить не публиковать аудио как есть.
Возможны варианты: расшифровать голос и опубликовать только содержание, обобщить имена собственные, не публиковать звук и дать краткое изложение, попросить доверенного человека проверить материал с пониманием рисков передачи.
Однако даже расшифровка сохраняет признаки стиля и содержания.
Изменение формата не делает материал безопасным само по себе; важно выбрать, какая информация остается.
ID3-теги остаются и при повторном распространении
Аудиофайл могут скачать и повторно загрузить в другое место.
Если в опубликованном файле остались теги, они продолжат жить в копиях, даже если позже вы удалите их у себя.
Проверка перед публикацией особенно важна для аудио, которое склонны сохранять: подкастов, звуковых материалов, записанных заметок, записей активности.
Надежнее проверить теги перед публикацией, чем заметить их после публикации и удалять файл.
Корреляция с другой информацией
ID3-теги становятся сильнее, когда связываются с другой информацией.
Сочетание
Что происходит
Artist + голос
Имя в теге и голос создают похожесть на одного человека
Время создания + время публикации
Можно предположить публикацию сразу после записи
Комментарий + содержание
Заметка редактирования связывается с высказыванием
Обложка + прошлые изображения
Связывает с другим аккаунтом
Имя файла + теги
Накладывается информация вне основного текста
В анонимности ID3-теги не рассматривают отдельно.
Проверяйте их вместе с содержанием аудио, аккаунтом, временем публикации и прошлыми опубликованными материалами.
Итоги
ID3-теги — это метаданные, сохраняемые в аудиофайле.
В них могут оставаться название, автор, комментарии, встроенные изображения, программа создания и другие сведения.
При анонимной публикации аудио нужно проверять не только голос и содержание, но и теговую информацию.
Даже после удаления тегов остаются голос, манера речи, фоновые звуки, имя файла и время публикации.
Для аудиофайлов проверяйте метаданные, само аудио, имя файла и результат после обработки как единый набор действий.
Связанные инструменты
Metadata inspection
ExifTool
Внешний ресурс, связанный с этой статьей. Открывайте его только если он подходит вашей ситуации и модели угроз.
Почему указано здесь: Он может помочь с темой статьи, но находится вне Anonymity Sense, поэтому перед использованием его нужно проверить.