采访笔记、录音、照片的元数据确认
采访资料不能只凭正文判断。
笔记、录音、照片、视频、PDF、截图中,会残留采访日期时间、地点、终端、创建者、编辑历史、文件名、背景音、拍入内容。
即使在正文中隐去信源姓名,也可能从资料的元数据和周边信息推测信源或现场。
对记者来说,元数据确认不是技术细节。
它是为了保护信源的公开前作业。
本文整理公开、共享采访笔记、录音、照片前应确认的信息。
采访笔记中残留的信息
采访笔记不只是文章。
数字笔记、共同编辑文档、云端笔记、手机笔记中,可能残留创建者、编辑者、创建日期时间、更新历史、共享历史。
| 笔记中残留的信息 | 对信源保护的影响 |
|---|---|
| 创建者名 | 记者或编辑的实名、组织名可见 |
| 创建日期时间 | 与采访日期或接触时刻连接 |
| 编辑历史 | 可知道谁读过、修改了哪里 |
| 评论 | 残留信源名或内部对话 |
| 云端共享 | 查看者、所有者、共享范围可见 |
公开用笔记要与原本分开。
原本有时作为采访记录是必要的。另一方面,外部共享或公开资料中,不要残留不必要的创建者信息和评论。
录音包含声音以外的信息
录音文件中,不仅讲话内容,背景音和文件信息也会成为线索。
车站广播、店内 BGM、职场机器声、救护车、学校铃声、周围对话。这些会成为推测地点和时间的材料。
| 录音中残留的东西 | 可知道的事 |
|---|---|
| 背景音 | 地点、时间段、设施、地区 |
| 声音特征 | 信源或相关人员的识别 |
| 录音日期时间 | 采访时刻或接触时机 |
| 终端信息 | 用于录音的设备或应用 |
| 文件名 | 采访对象、案件名、日期 |
公开音频时,只加工声音未必充分。
也要确认背景音、说法、对话语境、录音长度。
高风险采访中,也可以判断不直接公开音频,而改为文字转写或摘要。
照片和视频要看背景
照片和视频中,不只确认脸,也要确认背景。
采访地点的招牌、窗外、桌面文件、名牌、制服、反射、墙上公告、终端画面。这些会显示信源或现场。
| 拍进去的东西 | 风险 |
|---|---|
| 脸、名牌 | 本人或相关人员可被看出 |
| 背景招牌 | 地点或设施被识别 |
| 反射 | 拍摄者或周围的人被拍到 |
| 文件 | 内部信息、姓名、管理编号可见 |
| GPS、拍摄日期时间 | 采访地点和时刻可知 |
加工照片时,不要过信模糊和裁剪。
弱模糊下文字仍可能可读。裁剪前的信息也可能残留在其他图层或预览中。
要制作公开用副本,并用其他应用打开确认。
用 ExifTool 等确认
图片、音频、视频的元数据确认中,有时会使用 ExifTool。
ExifTool 是可以确认、编辑 、GPS、XMP、IPTC 等多种元数据的工具。它不仅用于照片,也用于视频和音频等广泛文件的信息确认。
URL : https://exiftool.org/
介绍 ExifTool 的理由,是它在采访资料元数据确认中实用性较高。
不过,工具可见的信息并不是全部。背景音、图片拍入内容、正文固有表达、公开时刻、云端共享历史都要另行确认。
制作公开用副本
采访资料要分成原本、确认用、公开用。
| 文件 | 作用 |
|---|---|
| 原本 | 作为证据价值或采访记录保存 |
| 确认用 | 检查元数据和内容 |
| 公开用 | 删除不必要信息后对外公开 |
不要直接公开原本,这一点很重要。
不过,证据价值重要的资料,随意加工会带来其他问题。涉及法律判断或公益举报的资料,应与编辑部、律师、专家商量推进。
查看保存位置和共享方法
即使确认了元数据,如果保存位置或共享方法薄弱,信源保护也会崩塌。
放在个人云端、实名账号、职场共享文件夹、共同编辑工具、消息应用中,可能残留所有者、查看者、编辑者、访问时刻。
| 保存、共享位置 | 注意点 |
|---|---|
| 个人云端 | 实名、邮箱地址、共享历史可见 |
| 编辑部共享文件夹 | 查看者和编辑历史会残留 |
| 共同编辑工具 | 评论、修改历史、编辑者名会残留 |
| 消息应用 | 转发、备份、通知中会残留 |
| 外接介质 | 注意遗失、加密、管理记录 |
采访资料要先决定谁能查看再保存。
保持只有必要人员可访问,不要随意扩大共享链接。
文字转写也会残留线索
把录音转写成文字,并不等于安全。
文字转写中会残留说话方式、口头禅、方言、专业术语、周围人物名、时间流动。使用 AI 转写服务时,意味着把音频数据和转写内容交给外部服务。
| 文字转写中残留的东西 | 风险 |
|---|---|
| 口头禅、方言 | 信源或地区被推测 |
| 专业术语 | 职场或部门可知 |
| 周围对话 | 相关人员被卷入 |
| 时间戳 | 采访时间或对话流向可见 |
| 使用外部服务 | 把音频和文本交给另一个信任对象 |
公开文字转写时,也需要对内容匿名化。
使用外部转写服务时,音频和转写内容会交给另一个信任对象。高风险采访、未公开资料、可能识别信源的音频中,应优先选择不发送给外部服务的运营;即使用,也要确认使用条款、保存期间、共享范围、机密信息处理。
分开检查负责人
制作采访资料的人本人容易漏看。
背景中的名牌、音频中的地名、PDF 创建者、截图通知等,第三方查看时可能更容易注意到。
在编辑部内分开正文确认、文件确认、信源保护确认,可以提高安全性。
| 负责人 | 查看内容 |
|---|---|
| 正文确认 | 固有名词、引用、时间线 |
| 文件确认 | 元数据、文件名、创建者 |
| 图片、音频确认 | 背景、反射、背景音、脸 |
| 信源保护确认 | 候选人是否不会被缩小 |
| 公开判断 | 法律和安全风险 |
高风险采访中,最好不要由一个人完成所有资料确认。
总结
采访笔记、录音、照片、视频中会残留正文以外的信息。
创建者、编辑历史、录音日期时间、背景音、GPS、拍摄日期时间、文件名、拍入内容,都会成为显示信源或现场的线索。
公开前,要分开原本、确认用、公开用,同时确认元数据和内容。
ExifTool 这类工具有助于元数据确认,但不会自动保护背景音、拍入内容、正文固有表达、公开后关联。
采访资料确认是保护信源的重要流程。
相关工具
Google Lens
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://lens.google/
ExifTool
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://exiftool.org/
MAT2
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
FFmpeg
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://ffmpeg.org/
SecureDrop
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://securedrop.org/
GlobaLeaks
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://globaleaks.org/