Learn

38 篇文章分类:全部
元数据

用 FFmpeg 思考元数据删除

FFmpeg 是广泛用于音频和视频转换、重新编码、元数据处理的工具。

在匿名性的语境中,它可以作为发布前重新生成视频或音频、减少不必要元数据的一种选择。

但是,使用 FFmpeg 并不会自动让文件变得安全。

即使删除了元数据,声音、背景音、视频中的文字、脸、反射、发布时间仍然会留下。

本文整理使用 FFmpeg 时的思考方式,以及删除元数据后应该确认什么。

什么是 FFmpeg

FFmpeg 是用于音频和视频转换及处理的项目。

可以在官方网站确认项目信息、文档和下载信息。

URL : https://ffmpeg.org/

它用于视频和音频格式转换、重新编码、音频提取、元数据处理等。

之所以在匿名性中介绍它,是因为它可以在本地处理。

无需把文件上传到外部转换网站,就可以在自己的设备上处理。

FFmpeg 能处理的范围

FFmpeg 可以处理音频和视频的容器与流。

但是,它不会判断所有与匿名性相关的信息。

能处理的事不能处理的事
重新编码判断视频内的含义
更改容器信息检测招牌、反射、脸、文字
删除或提取音频判断声音识别风险
处理元数据删除发布时间或通信日志
格式转换分离账号或云端历史

FFmpeg 是强大的处理工具。

但是,匿名性的判断由人来做。

元数据删除和重新编码的目的不同

在 FFmpeg 中,有时会组合减少元数据的处理,以及重新编码视频或音频的处理。

但是,这两者并不是同一件事。

处理目的注意点
元数据删除减少标题、创建信息、标签等重新确认想删除的信息和新附加的信息
重新编码重新生成视频、音频可能附加新的编码信息
音频删除删除声音和环境音视频内的信息仍然会留下
截取只保留需要的部分截取部分中也会留下背景和声音
格式转换转为其他格式即使格式改变,内容风险仍会留下

不能说“重新编码了所以安全”。

重新编码后,也要确认元数据和内容。

处理前要确认的事项

用 FFmpeg 处理前,要确认原始文件。

确认理由
复制原始文件不要混淆原本和发布用文件
确认元数据掌握自己想删除什么
确认视频查看背景、反射、文字、脸
确认音频听声音、对话、环境音
查看文件名确认日期、地点、姓名是否残留

如果不知道处理前文件中有什么,就无法判断处理后消失了什么。

用 ExifTool 等确认元数据,根据需要用 FFmpeg 重新生成,然后再次确认。

ExifTool 官方网站:

URL : https://exiftool.org/

重新编码后确认

用 FFmpeg 重新编码后,一定要重新确认。

重新编码有时会减少旧元数据,但也可能附加新的编码信息或创建日期和时间。

确认理由
元数据是否残留旧信息或新信息
视频处理后背景和文字是否仍然残留
音频静音或替换是否正确完成
文件名是否残留包含原始信息的名称
播放确认是否有损坏或意外内容

“处理过”和“变安全了”是不同的。

只有确认处理结果之后,才能做出发布判断。

是否删除音频

在视频的匿名性中,是否保留音频很重要。

声音、对话、环境音、广播会成为有力线索。

音频状态判断
包含本人的声音考虑变声、删除或不发布的判断
包含周围人的对话会牵连相关人员,因此要注意
包含车站或店铺的声音有时会推测出地点
包含通知音有时会暴露应用或设备环境
不需要的音频有时可以删除

即使删除音频,视频中可见的信息仍会留下。

视频和音频要分开确认。

避免处理后文件混淆

视频处理会增加原始文件、处理中间文件、发布用文件。

如果在这里混淆,就有可能把原始文件原样发布。

文件处理方式
原始文件作为原本保管,不发布
作业用文件作为处理过程中的文件管理
发布用文件只使用已经确认元数据和内容的文件
确认结果不要超过必要程度留在实名环境中
不需要的文件不要随意留在云同步中

文件名也要注意。

home_near_station_original.mov 这样的名称,即使删除了元数据,也会泄露信息。

发布用文件应使用不过度关联内容的名称。

不使用外部转换网站的理由

视频和音频转换网站很方便。

但是,如果把匿名性重要的文件上传到外部网站,文件、访问来源 IP、时间、浏览器信息都会交给该网站。

对于高风险文件,应优先本地处理。

即使是本地处理,也要另行考虑设备和保存位置的安全性。

如果在工作设备、学校设备、共享 PC、云同步文件夹中作业,可能会留下其他痕迹。

仅靠 FFmpeg 无法解决的场景

以下情况,仅用 FFmpeg 处理并不充分。

  • 视频中拍到很多脸或名牌
  • 音频中反复出现姓名或地点
  • 拍摄地点很容易从背景判断出来
  • 内部资料或画面通知入镜
  • 发布时间本身显示参与或行动

在这些情况下,需要的不是单纯重新编码,而是不发布、重新制作内容、改用静止图像、用文字说明、隔一段时间再发布等判断。

在匿名性方面,要区分工具能处理的问题,以及只能通过发布判断解决的问题。

在哪里确认处理后的视频

也要注意确认处理后视频的环境。

如果上传到已用实名账号登录的云端或视频服务上确认,那么账号和文件会在那一刻关联起来。

尽量在本地确认。

即使有必要使用外部服务确认,也要先理解会把什么交给服务端之后再使用。

总结

FFmpeg 是用于音频和视频转换、重新编码的强大工具。

在匿名性方面,它有助于在本地处理视频和音频,减少不需要的元数据和音频。

但是,FFmpeg 不会自动判断匿名性。

即使删除了元数据,视频中的背景、反射、文字、脸、声音、环境音、发布时间仍会留下。

处理前确认,处理后重新确认,最后判断内容是否可以发布。

相关工具

Archive check

Wayback Machine

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://web.archive.org/

打开外部网站
Metadata inspection

ExifTool

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://exiftool.org/

打开外部网站
Metadata removal

MAT2

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://0xacab.org/jvoisin/mat2

打开外部网站
Audio and video

FFmpeg

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://ffmpeg.org/

打开外部网站

相关文章