Learn

284 篇文章分类:全部
记者

采访笔记、录音、照片的元数据确认

采访资料不能只凭正文判断。

笔记、录音、照片、视频、PDF、截图中,会残留采访日期时间、地点、终端、创建者、编辑历史、文件名、背景音、拍入内容。

即使在正文中隐去信源姓名,也可能从资料的元数据和周边信息推测信源或现场。

对记者来说,元数据确认不是技术细节。

它是为了保护信源的公开前作业。

本文整理公开、共享采访笔记、录音、照片前应确认的信息。

采访笔记中残留的信息

采访笔记不只是文章。

数字笔记、共同编辑文档、云端笔记、手机笔记中,可能残留创建者、编辑者、创建日期时间、更新历史、共享历史。

笔记中残留的信息对信源保护的影响
创建者名记者或编辑的实名、组织名可见
创建日期时间与采访日期或接触时刻连接
编辑历史可知道谁读过、修改了哪里
评论残留信源名或内部对话
云端共享查看者、所有者、共享范围可见

公开用笔记要与原本分开。

原本有时作为采访记录是必要的。另一方面,外部共享或公开资料中,不要残留不必要的创建者信息和评论。

录音包含声音以外的信息

录音文件中,不仅讲话内容,背景音和文件信息也会成为线索。

车站广播、店内 BGM、职场机器声、救护车、学校铃声、周围对话。这些会成为推测地点和时间的材料。

录音中残留的东西可知道的事
背景音地点、时间段、设施、地区
声音特征信源或相关人员的识别
录音日期时间采访时刻或接触时机
终端信息用于录音的设备或应用
文件名采访对象、案件名、日期

公开音频时,只加工声音未必充分。

也要确认背景音、说法、对话语境、录音长度。

高风险采访中,也可以判断不直接公开音频,而改为文字转写或摘要。

照片和视频要看背景

照片和视频中,不只确认脸,也要确认背景。

采访地点的招牌、窗外、桌面文件、名牌、制服、反射、墙上公告、终端画面。这些会显示信源或现场。

拍进去的东西风险
脸、名牌本人或相关人员可被看出
背景招牌地点或设施被识别
反射拍摄者或周围的人被拍到
文件内部信息、姓名、管理编号可见
GPS、拍摄日期时间采访地点和时刻可知

加工照片时,不要过信模糊和裁剪。

弱模糊下文字仍可能可读。裁剪前的信息也可能残留在其他图层或预览中。

要制作公开用副本,并用其他应用打开确认。

用 ExifTool 等确认

图片、音频、视频的元数据确认中,有时会使用 ExifTool。

ExifTool 是可以确认、编辑 、GPS、XMP、IPTC 等多种元数据的工具。它不仅用于照片,也用于视频和音频等广泛文件的信息确认。

URL : https://exiftool.org/

介绍 ExifTool 的理由,是它在采访资料元数据确认中实用性较高。

不过,工具可见的信息并不是全部。背景音、图片拍入内容、正文固有表达、公开时刻、云端共享历史都要另行确认。

制作公开用副本

采访资料要分成原本、确认用、公开用。

文件作用
原本作为证据价值或采访记录保存
确认用检查元数据和内容
公开用删除不必要信息后对外公开

不要直接公开原本,这一点很重要。

不过,证据价值重要的资料,随意加工会带来其他问题。涉及法律判断或公益举报的资料,应与编辑部、律师、专家商量推进。

查看保存位置和共享方法

即使确认了元数据,如果保存位置或共享方法薄弱,信源保护也会崩塌。

放在个人云端、实名账号、职场共享文件夹、共同编辑工具、消息应用中,可能残留所有者、查看者、编辑者、访问时刻。

保存、共享位置注意点
个人云端实名、邮箱地址、共享历史可见
编辑部共享文件夹查看者和编辑历史会残留
共同编辑工具评论、修改历史、编辑者名会残留
消息应用转发、备份、通知中会残留
外接介质注意遗失、加密、管理记录

采访资料要先决定谁能查看再保存。

保持只有必要人员可访问,不要随意扩大共享链接。

文字转写也会残留线索

把录音转写成文字,并不等于安全。

文字转写中会残留说话方式、口头禅、方言、专业术语、周围人物名、时间流动。使用 AI 转写服务时,意味着把音频数据和转写内容交给外部服务。

文字转写中残留的东西风险
口头禅、方言信源或地区被推测
专业术语职场或部门可知
周围对话相关人员被卷入
时间戳采访时间或对话流向可见
使用外部服务把音频和文本交给另一个信任对象

公开文字转写时,也需要对内容匿名化。

使用外部转写服务时,音频和转写内容会交给另一个信任对象。高风险采访、未公开资料、可能识别信源的音频中,应优先选择不发送给外部服务的运营;即使用,也要确认使用条款、保存期间、共享范围、机密信息处理。

分开检查负责人

制作采访资料的人本人容易漏看。

背景中的名牌、音频中的地名、PDF 创建者、截图通知等,第三方查看时可能更容易注意到。

在编辑部内分开正文确认、文件确认、信源保护确认,可以提高安全性。

负责人查看内容
正文确认固有名词、引用、时间线
文件确认元数据、文件名、创建者
图片、音频确认背景、反射、背景音、脸
信源保护确认候选人是否不会被缩小
公开判断法律和安全风险

高风险采访中,最好不要由一个人完成所有资料确认。

总结

采访笔记、录音、照片、视频中会残留正文以外的信息。

创建者、编辑历史、录音日期时间、背景音、GPS、拍摄日期时间、文件名、拍入内容,都会成为显示信源或现场的线索。

公开前,要分开原本、确认用、公开用,同时确认元数据和内容。

ExifTool 这类工具有助于元数据确认,但不会自动保护背景音、拍入内容、正文固有表达、公开后关联。

采访资料确认是保护信源的重要流程。

相关工具

Reverse image search

Google Lens

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://lens.google/

打开外部网站
Metadata inspection

ExifTool

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://exiftool.org/

打开外部网站
Metadata removal

MAT2

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://0xacab.org/jvoisin/mat2

打开外部网站
Audio and video

FFmpeg

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://ffmpeg.org/

打开外部网站
Whistleblower submission

SecureDrop

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://securedrop.org/

打开外部网站
Whistleblower platform

GlobaLeaks

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://globaleaks.org/

打开外部网站

相关文章