用 FFmpeg 思考元数据删除
FFmpeg 是广泛用于音频和视频转换、重新编码、元数据处理的工具。
在匿名性的语境中,它可以作为发布前重新生成视频或音频、减少不必要元数据的一种选择。
但是,使用 FFmpeg 并不会自动让文件变得安全。
即使删除了元数据,声音、背景音、视频中的文字、脸、反射、发布时间仍然会留下。
本文整理使用 FFmpeg 时的思考方式,以及删除元数据后应该确认什么。
什么是 FFmpeg
FFmpeg 是用于音频和视频转换及处理的项目。
可以在官方网站确认项目信息、文档和下载信息。
URL : https://ffmpeg.org/
它用于视频和音频格式转换、重新编码、音频提取、元数据处理等。
之所以在匿名性中介绍它,是因为它可以在本地处理。
无需把文件上传到外部转换网站,就可以在自己的设备上处理。
FFmpeg 能处理的范围
FFmpeg 可以处理音频和视频的容器与流。
但是,它不会判断所有与匿名性相关的信息。
| 能处理的事 | 不能处理的事 |
|---|---|
| 重新编码 | 判断视频内的含义 |
| 更改容器信息 | 检测招牌、反射、脸、文字 |
| 删除或提取音频 | 判断声音识别风险 |
| 处理元数据 | 删除发布时间或通信日志 |
| 格式转换 | 分离账号或云端历史 |
FFmpeg 是强大的处理工具。
但是,匿名性的判断由人来做。
元数据删除和重新编码的目的不同
在 FFmpeg 中,有时会组合减少元数据的处理,以及重新编码视频或音频的处理。
但是,这两者并不是同一件事。
| 处理 | 目的 | 注意点 |
|---|---|---|
| 元数据删除 | 减少标题、创建信息、标签等 | 重新确认想删除的信息和新附加的信息 |
| 重新编码 | 重新生成视频、音频 | 可能附加新的编码信息 |
| 音频删除 | 删除声音和环境音 | 视频内的信息仍然会留下 |
| 截取 | 只保留需要的部分 | 截取部分中也会留下背景和声音 |
| 格式转换 | 转为其他格式 | 即使格式改变,内容风险仍会留下 |
不能说“重新编码了所以安全”。
重新编码后,也要确认元数据和内容。
处理前要确认的事项
用 FFmpeg 处理前,要确认原始文件。
| 确认 | 理由 |
|---|---|
| 复制原始文件 | 不要混淆原本和发布用文件 |
| 确认元数据 | 掌握自己想删除什么 |
| 确认视频 | 查看背景、反射、文字、脸 |
| 确认音频 | 听声音、对话、环境音 |
| 查看文件名 | 确认日期、地点、姓名是否残留 |
如果不知道处理前文件中有什么,就无法判断处理后消失了什么。
用 ExifTool 等确认元数据,根据需要用 FFmpeg 重新生成,然后再次确认。
ExifTool 官方网站:
URL : https://exiftool.org/
重新编码后确认
用 FFmpeg 重新编码后,一定要重新确认。
重新编码有时会减少旧元数据,但也可能附加新的编码信息或创建日期和时间。
| 确认 | 理由 |
|---|---|
| 元数据 | 是否残留旧信息或新信息 |
| 视频 | 处理后背景和文字是否仍然残留 |
| 音频 | 静音或替换是否正确完成 |
| 文件名 | 是否残留包含原始信息的名称 |
| 播放确认 | 是否有损坏或意外内容 |
“处理过”和“变安全了”是不同的。
只有确认处理结果之后,才能做出发布判断。
是否删除音频
在视频的匿名性中,是否保留音频很重要。
声音、对话、环境音、广播会成为有力线索。
| 音频状态 | 判断 |
|---|---|
| 包含本人的声音 | 考虑变声、删除或不发布的判断 |
| 包含周围人的对话 | 会牵连相关人员,因此要注意 |
| 包含车站或店铺的声音 | 有时会推测出地点 |
| 包含通知音 | 有时会暴露应用或设备环境 |
| 不需要的音频 | 有时可以删除 |
即使删除音频,视频中可见的信息仍会留下。
视频和音频要分开确认。
避免处理后文件混淆
视频处理会增加原始文件、处理中间文件、发布用文件。
如果在这里混淆,就有可能把原始文件原样发布。
| 文件 | 处理方式 |
|---|---|
| 原始文件 | 作为原本保管,不发布 |
| 作业用文件 | 作为处理过程中的文件管理 |
| 发布用文件 | 只使用已经确认元数据和内容的文件 |
| 确认结果 | 不要超过必要程度留在实名环境中 |
| 不需要的文件 | 不要随意留在云同步中 |
文件名也要注意。
home_near_station_original.mov 这样的名称,即使删除了元数据,也会泄露信息。
发布用文件应使用不过度关联内容的名称。
不使用外部转换网站的理由
视频和音频转换网站很方便。
但是,如果把匿名性重要的文件上传到外部网站,文件、访问来源 IP、时间、浏览器信息都会交给该网站。
对于高风险文件,应优先本地处理。
即使是本地处理,也要另行考虑设备和保存位置的安全性。
如果在工作设备、学校设备、共享 PC、云同步文件夹中作业,可能会留下其他痕迹。
仅靠 FFmpeg 无法解决的场景
以下情况,仅用 FFmpeg 处理并不充分。
- 视频中拍到很多脸或名牌
- 音频中反复出现姓名或地点
- 拍摄地点很容易从背景判断出来
- 内部资料或画面通知入镜
- 发布时间本身显示参与或行动
在这些情况下,需要的不是单纯重新编码,而是不发布、重新制作内容、改用静止图像、用文字说明、隔一段时间再发布等判断。
在匿名性方面,要区分工具能处理的问题,以及只能通过发布判断解决的问题。
在哪里确认处理后的视频
也要注意确认处理后视频的环境。
如果上传到已用实名账号登录的云端或视频服务上确认,那么账号和文件会在那一刻关联起来。
尽量在本地确认。
即使有必要使用外部服务确认,也要先理解会把什么交给服务端之后再使用。
总结
FFmpeg 是用于音频和视频转换、重新编码的强大工具。
在匿名性方面,它有助于在本地处理视频和音频,减少不需要的元数据和音频。
但是,FFmpeg 不会自动判断匿名性。
即使删除了元数据,视频中的背景、反射、文字、脸、声音、环境音、发布时间仍会留下。
处理前确认,处理后重新确认,最后判断内容是否可以发布。
相关工具
Wayback Machine
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://web.archive.org/
ExifTool
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://exiftool.org/
MAT2
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
FFmpeg
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://ffmpeg.org/