声音、环境音和背景音的风险
音频中包含的信息比本人想象的更多。
声质、说话方式、方言、呼吸声、周围对话、车站或店铺广播、职场或学校声音、家人声音、通知音等都会进入。
匿名公开音频或视频时,即使删除元数据,只要声音本身残留线索,匿名性就会变弱。
本文整理声音、环境音、背景音如何与匿名性相关。
声音会成为识别线索
声音带有本人特征。
不只是声质,说话方式、句尾、停顿方式、方言、常用词也会成为线索。
| 线索 | 内容 | 匿名性中的注意点 |
|---|---|---|
| 声质 | 高低、响度、习惯 | 熟人可能听出来 |
| 说话方式 | 速度、停顿、句尾 | 与其他直播或通话连接 |
| 方言 | 地域表达 | 成为出身地或日常活动范围线索 |
| 专业术语 | 职场或行业词语 | 接近所属或职业 |
| 口头禅 | 常用表达 | 像一样产生关联 |
即使稍微加工声音,如果说话方式和内容残留,也可能被关联。
在匿名性中,要同时确认声音本身和说的内容。
只有熟人才懂的信息
声音风险不只是被陌生人识别。
熟人、同事、家人、同学校或职场的人,可能只凭声音和说话方式就看出来。
| 对象 | 容易看出的线索 |
|---|---|
| 家人 | 声音、说话方式、房间声音、家人称呼 |
| 同事 | 业务用语、职场声音、会议说法 |
| 学校相关人员 | 铃声、老师或朋友称呼、学校活动 |
| 地区的人 | 方言、店内广播、车站名、地区声音 |
| 过去观众 | 直播时的口头禅、话题、笑声 |
匿名性破裂不只是世界上某个人知道本名。
也包括身边的人觉得“这个声音是不是那个人”。
环境音会显示地点
音频中也会进入周围声音。
本人没注意到的声音,反而会显示地点或状况。
| 声音 | 能知道什么 |
|---|---|
| 车站广播 | 车站名、路线、地区 |
| 店内广播 | 店铺、时间段、地点 |
| 学校铃声 | 学校或时间段 |
| 职场声音 | 行业、作业环境 |
| 家人声音 | 家庭构成或相关人员 |
| 通知音 | 应用或终端环境 |
视频中,即使影像被模糊,也可能通过声音看出地点。
即使是纯音频投稿,也可能从背景音推测日常活动范围。
对话入镜
音频中特别危险的是周围对话。
即使自己没有说话,附近人的声音也可能进入。
如果包含姓名、职场名、学校名、计划、地名、相关人员称呼,就会卷入本人以外的人。
| 进入的信息 | 风险 |
|---|---|
| 姓名 | 直接显示本人或相关人员 |
| 计划 | 可看出行动时刻或地点 |
| 职场・学校 | 所属会被推测 |
| 家人称呼 | 家庭构成显现 |
| 内部用语 | 组织或活动被推测 |
音频即使一瞬间也会留下。
要以公开后会被反复听、裁切、转写为前提确认。
转写后可见的信息
音频之后可能被转写。
自动转写精度提高后,音频内的固有名词、地名、组织名、对话内容更容易被搜索。
| 音频内信息 | 转写后的风险 |
|---|---|
| 姓名 | 通过搜索或引用残留 |
| 地名 | 日常活动范围或移动目的地可见 |
| 组织名 | 所属或关系对象可见 |
| 日期 | 与时间线连接 |
| 专业术语 | 职业或行业被推测 |
“因为是声音所以不容易被读到”的感觉很危险。
公开音频要以前提是会被转写、搜索、引用来确认。
音频加工的限制
加工声音不一定安全。
即使用变调或降噪改变声质,说话方式、内容、环境音、发帖时间仍会留下。
| 加工 | 残留内容 |
|---|---|
| 改变音高 | 说话方式、句尾、内容 |
| 降噪 | 对话和背景音不一定完全消失 |
| 静音 | 影像线索仍残留 |
| 字幕化 | 文体和内容残留 |
| 重新录音 | 可能附上新的环境音或创建信息 |
加工是降低风险的手段。
但是,不要把“已经加工”当成安全证明。
发布前确认
公开音频或视频前,必须听到最后。
只快进会漏掉一瞬间的姓名或地名。
| 确认 | 理由 |
|---|---|
| 本人声音 | 是否有熟人能听出的特征 |
| 周围对话 | 是否进入姓名、地点、计划 |
| 环境音 | 是否看得出车站、店铺、职场、学校 |
| 通知音 | 是否暴露应用或终端环境 |
| 元数据 | 是否残留 ID3 标签、创建日期、应用名 |
必要时,选择消音、替换音频、改成文章或不公开。
不发出音频的选择
匿名性重要时,也可以选择不公开声音。
可以把内容改成文章、只整理要点、制作无声视频、使用另一个旁白等。
不过,改成文章并不意味着一切解决。
文章中会残留文体、时间线、固有名词、专业知识。
即使避免声音,也要确认以其他形式出现的线索。
高风险录音中不要卷入第三者
音频容易包含本人以外的信息。
家人、同事、信源、参加者、路人的声音进入后,那些人也会被卷入风险。
匿名性不是只属于自己的问题。
如果公开音频中包含第三者声音或对话,应优先删除、加工或不公开。
特别是采访、内部举报、活动记录中,要从保护相关人员的角度慎重处理音频公开。
音频与其他线索的关联
音频不只会被单独判断。
它会与发帖时间、账号、图片、视频、过去直播、文体组合。
| 组合 | 会发生什么 |
|---|---|
| 声音 + 发帖时间 | 显示生活节奏或活动时间 |
| 声音 + 方言 | 推测地区或出身 |
| 环境音 + 影像 | 地点推测变强 |
| 口头禅 + 文章 | 与其他账号文体连接 |
| 通知音 + 屏幕共享 | 应用或真实身份环境显现 |
因此,确认音频时,不只听声音,也要看它在整个投稿中会与什么连接。
即使改变声音,如果发帖语境相同,关联仍会残留。
总结
声音、环境音、背景音与匿名性强相关。
声质、说话方式、方言、周围对话、车站或店铺声音、通知音,会成为推测本人或地点的线索。
即使删除元数据,声音本身残留的信息也不会消失。
即使做音频加工,说话方式、内容、背景音、发帖时间仍可能残留。
公开音频或视频前,要听到最后,并分开确认声音、对话、环境音、元数据。
高风险内容中,不公开音频也是重要判断。
相关工具
Google Lens
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://lens.google/
ExifTool
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://exiftool.org/
MAT2
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
FFmpeg
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://ffmpeg.org/