什么是内容关联
匿名性不是只由通信环境决定的。
发布的文章。 图片中拍到的背景。 文件内容。 话题的选择方式。 亲身经历。 专业领域。
这些内容本身也会成为推测身份的材料。
内容关联,是指公开的内容与过去信息、实名账号、所属、日常活动范围、关系人的记忆连接起来。
内容会讲述本人
一个人的经历会从所写内容中显露出来。
居住地区。 工作的行业。 上过的学校。 经历过的纠纷。 常去的地点。 感兴趣的话题。 只有内部人员才知道的情况。
即使没有写名字,候选范围也会从内容中缩小。
| 内容 | 能看到什么 |
|---|---|
| 亲身经历 | 本人或关系人的候选 |
| 专业术语 | 职业、行业、所属领域 |
| 地区话题 | 日常活动范围、移动范围 |
| 内部情况 | 所属组织或关系人 |
| 图片背景 | 地点、学校、职场 |
| 文件内容 | 作者、组织、业务内容 |
内容关联不同于技术追踪。 它会以“读得懂的人就会看出来”的形式发生。
亲身经历会成为强线索
亲身经历有说服力。 但是在匿名性中,它会成为相当强的线索。
尤其危险的是,只有少数人知道的事件。
“去年部门里发生的纠纷” “学校内只有一部分人知道的事” “自己在某个特定活动中看到的事” “只有关系人知道的时间顺序”
这些内容即使外部的人不知道,关系人也会知道。
即使匿名发帖没有广泛传播,只要进入关系人的视野,候选范围就会缩小。
写亲身经历时,要把读者需要的事实与缩小本人范围的细节分开。
对于“职场发生了骚扰”这样的内容,并不一定需要写准确的部门名、会议日期、上司的口头禅、参加人数、内部系统名。 另一方面,为了传达问题结构,有时也需要在一定程度上说明行业和立场。
| 细节 | 处理方式 |
|---|---|
| 日期时间 | 不写具体日期,改为时期 |
| 地点 | 不写具体名称,改为宽泛分类 |
| 人数 | 如果人数很少就模糊化 |
| 职位 | 如果候选会缩小,就泛化 |
| 对话 | 避免本人特有的说法 |
在匿名性中,要在保留说服力的同时,降低识别所需的粒度。
也要看图片和文件内容
内容关联不只存在于文章。
图片背景会拍到地点或所属。 PDF 和 Office 文档的正文中,可能会残留内部术语、部门名、案件名、评论。 截图中可能拍到通知、标签页名称、账号名、书签。
即使删除元数据,只要可见内容仍然存在,就没有意义。
| 类型 | 例子 | 注意点 |
|---|---|---|
| 元数据 | 作者、日期时间、位置信息 | 容易用工具确认 |
| 正文内容 | 内部信息、亲身经历、专有名词 | 人会阅读并推测 |
| 图片内容 | 背景、反射、招牌、制服 | 需要放大确认 |
| 截图 | 通知、标签页、账号名 | 容易漏看边缘信息 |
在匿名性中,要同时确认文件背后的信息和表面可见的内容。
会与过去发帖连接
即使现在的发帖没有本名,只要与过去发帖连接起来,匿名性就会变弱。
同一个亲身经历以前也写在博客上。 同一张图片曾经在过去的社交媒体上使用过。 曾经用实名谈论过同一个专业领域。 以同样顺序写过同样主张。
这种重叠会被搜索或记忆找到。
思考匿名性时,只看现在的发帖是不够的。 需要确认过去的自己是否已经发布过同样信息。
模糊化方法错误就没有意义
模糊化内容时,并不是只删除专有名词就可以。
即使删除地名,只要写到地区活动,地点仍会暴露。 即使删除公司名,如果行业、职位、人数、时期很细,候选仍会缩小。 即使删除学校名,如果年级、活动、社团、地区重叠,也会被看出。
| 危险写法 | 更安全的思路 | 理由 |
|---|---|---|
| 只删除公司名 | 行业、人数、时期也变粗 | 所属会通过组合显现 |
| 只删除车站名 | 也重新审视线路和日常活动范围 | 移动范围会留下 |
| 只隐去姓名 | 也模糊关系和角色 | 关系人会看出来 |
| 只删除日期 | 也查看前后事件 | 会被时间线缩小范围 |
模糊化的目的不是让文章变得含糊。 而是降低识别所需的粒度。
发布前要确认的事
为了避免内容关联,发布前要确认以下几点。
- 是否写了只有自己或关系人才知道的事件
- 是否会显示地区、职场、学校、日常活动范围
- 是否使用了与过去发帖相同的亲身经历
- 图片背景或反射中是否有线索
- 截图中是否有通知或账号名
- 文件正文中是否残留内部术语或评论
- 即使组合模糊化后的信息,是否仍会被识别
确认时,要思考不是自己,而是“认识自己的人”读到后会怎样看。
在匿名性中,相比外部陌生人,近距离关系人有时更危险。
存在只有关系人才懂的信息
即使外部读者觉得文章很抽象,关系人也可能看得很具体。
即使没有写公司名,只要出现内部术语、独有制度名、会议叫法、项目时期,公司内部的人就会看出来。 即使没有写学校名,也可能从活动名、老师的称呼、社团成绩中看出来。
在内容关联中,标准不是“一般公开读者是否看得懂”,而是“当时在场的人读了是否看得出来”。
选择保留具体性的地方
为了匿名性把所有内容都写得含糊,文章会变得难读。 要让读者理解问题,需要一定程度的具体性。
重要的是选择把具体性放在哪里。
例如,如果想传达制度问题,就不要具体写个人名或部门名,而要具体写机制。 如果想传达地区风险,就不要写最近车站,而要说明更宽泛的地区或状况。
| 想传达的事 | 保留的具体性 | 删去的具体性 |
|---|---|---|
| 职场问题 | 机制、影响、复发条件 | 部门名、会议日、少数人的发言 |
| 地区问题 | 交通和环境的结构 | 最近车站、家附近的店 |
| 学校问题 | 制度和应对流程 | 班级、班主任姓名、活动日 |
| 个人受害 | 受害类型和应对 | 会指向对方特定身份的细节 |
保护匿名性的文章,并不只是把内容写得含糊。 它是保留读者需要的信息、削掉会被用于识别的信息的文章。
总结
内容关联,是指公开的内容与过去信息、实名账号、所属、日常活动范围、关系人的记忆连接起来。
文章、图片、截图、PDF、Office 文档、视频、音频的内容都会成为线索。
即使删除姓名和地名,如果仍然留下亲身经历、专业术语、时间线、背景、只有关系人才知道的信息,候选范围就会缩小。
在匿名性中,不仅要确认通信路径和元数据,也需要确认公开内容本身。 重要的不是删除信息,而是降低识别所需的粒度。
相关工具
OSINT Framework
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
Google Lens
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://lens.google/
ExifTool
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://exiftool.org/
MAT2
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
FFmpeg
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://ffmpeg.org/