Learn

96 篇文章分类:全部
文本与内容

什么是内容关联

匿名性不是只由通信环境决定的。

发布的文章。 图片中拍到的背景。 文件内容。 话题的选择方式。 亲身经历。 专业领域。

这些内容本身也会成为推测身份的材料。

内容关联,是指公开的内容与过去信息、实名账号、所属、日常活动范围、关系人的记忆连接起来。

内容会讲述本人

一个人的经历会从所写内容中显露出来。

居住地区。 工作的行业。 上过的学校。 经历过的纠纷。 常去的地点。 感兴趣的话题。 只有内部人员才知道的情况。

即使没有写名字,候选范围也会从内容中缩小。

内容能看到什么
亲身经历本人或关系人的候选
专业术语职业、行业、所属领域
地区话题日常活动范围、移动范围
内部情况所属组织或关系人
图片背景地点、学校、职场
文件内容作者、组织、业务内容

内容关联不同于技术追踪。 它会以“读得懂的人就会看出来”的形式发生。

亲身经历会成为强线索

亲身经历有说服力。 但是在匿名性中,它会成为相当强的线索。

尤其危险的是,只有少数人知道的事件。

“去年部门里发生的纠纷” “学校内只有一部分人知道的事” “自己在某个特定活动中看到的事” “只有关系人知道的时间顺序”

这些内容即使外部的人不知道,关系人也会知道。

即使匿名发帖没有广泛传播,只要进入关系人的视野,候选范围就会缩小。

写亲身经历时,要把读者需要的事实与缩小本人范围的细节分开。

对于“职场发生了骚扰”这样的内容,并不一定需要写准确的部门名、会议日期、上司的口头禅、参加人数、内部系统名。 另一方面,为了传达问题结构,有时也需要在一定程度上说明行业和立场。

细节处理方式
日期时间不写具体日期,改为时期
地点不写具体名称,改为宽泛分类
人数如果人数很少就模糊化
职位如果候选会缩小,就泛化
对话避免本人特有的说法

在匿名性中,要在保留说服力的同时,降低识别所需的粒度。

也要看图片和文件内容

内容关联不只存在于文章。

图片背景会拍到地点或所属。 PDF 和 Office 文档的正文中,可能会残留内部术语、部门名、案件名、评论。 截图中可能拍到通知、标签页名称、账号名、书签。

即使删除元数据,只要可见内容仍然存在,就没有意义。

类型例子注意点
元数据作者、日期时间、位置信息容易用工具确认
正文内容内部信息、亲身经历、专有名词人会阅读并推测
图片内容背景、反射、招牌、制服需要放大确认
截图通知、标签页、账号名容易漏看边缘信息

在匿名性中,要同时确认文件背后的信息和表面可见的内容。

会与过去发帖连接

即使现在的发帖没有本名,只要与过去发帖连接起来,匿名性就会变弱。

同一个亲身经历以前也写在博客上。 同一张图片曾经在过去的社交媒体上使用过。 曾经用实名谈论过同一个专业领域。 以同样顺序写过同样主张。

这种重叠会被搜索或记忆找到。

思考匿名性时,只看现在的发帖是不够的。 需要确认过去的自己是否已经发布过同样信息。

模糊化方法错误就没有意义

模糊化内容时,并不是只删除专有名词就可以。

即使删除地名,只要写到地区活动,地点仍会暴露。 即使删除公司名,如果行业、职位、人数、时期很细,候选仍会缩小。 即使删除学校名,如果年级、活动、社团、地区重叠,也会被看出。

危险写法更安全的思路理由
只删除公司名行业、人数、时期也变粗所属会通过组合显现
只删除车站名也重新审视线路和日常活动范围移动范围会留下
只隐去姓名也模糊关系和角色关系人会看出来
只删除日期也查看前后事件会被时间线缩小范围

模糊化的目的不是让文章变得含糊。 而是降低识别所需的粒度。

发布前要确认的事

为了避免内容关联,发布前要确认以下几点。

  • 是否写了只有自己或关系人才知道的事件
  • 是否会显示地区、职场、学校、日常活动范围
  • 是否使用了与过去发帖相同的亲身经历
  • 图片背景或反射中是否有线索
  • 截图中是否有通知或账号名
  • 文件正文中是否残留内部术语或评论
  • 即使组合模糊化后的信息,是否仍会被识别

确认时,要思考不是自己,而是“认识自己的人”读到后会怎样看。

在匿名性中,相比外部陌生人,近距离关系人有时更危险。

存在只有关系人才懂的信息

即使外部读者觉得文章很抽象,关系人也可能看得很具体。

即使没有写公司名,只要出现内部术语、独有制度名、会议叫法、项目时期,公司内部的人就会看出来。 即使没有写学校名,也可能从活动名、老师的称呼、社团成绩中看出来。

在内容关联中,标准不是“一般公开读者是否看得懂”,而是“当时在场的人读了是否看得出来”。

选择保留具体性的地方

为了匿名性把所有内容都写得含糊,文章会变得难读。 要让读者理解问题,需要一定程度的具体性。

重要的是选择把具体性放在哪里。

例如,如果想传达制度问题,就不要具体写个人名或部门名,而要具体写机制。 如果想传达地区风险,就不要写最近车站,而要说明更宽泛的地区或状况。

想传达的事保留的具体性删去的具体性
职场问题机制、影响、复发条件部门名、会议日、少数人的发言
地区问题交通和环境的结构最近车站、家附近的店
学校问题制度和应对流程班级、班主任姓名、活动日
个人受害受害类型和应对会指向对方特定身份的细节

保护匿名性的文章,并不只是把内容写得含糊。 它是保留读者需要的信息、削掉会被用于识别的信息的文章。

总结

内容关联,是指公开的内容与过去信息、实名账号、所属、日常活动范围、关系人的记忆连接起来。

文章、图片、截图、PDF、Office 文档、视频、音频的内容都会成为线索。

即使删除姓名和地名,如果仍然留下亲身经历、专业术语、时间线、背景、只有关系人才知道的信息,候选范围就会缩小。

在匿名性中,不仅要确认通信路径和元数据,也需要确认公开内容本身。 重要的不是删除信息,而是降低识别所需的粒度。

相关工具

OSINT directory

OSINT Framework

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://osintframework.com/

打开外部网站
Reverse image search

Google Lens

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://lens.google/

打开外部网站
Metadata inspection

ExifTool

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://exiftool.org/

打开外部网站
Metadata removal

MAT2

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://0xacab.org/jvoisin/mat2

打开外部网站
Audio and video

FFmpeg

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://ffmpeg.org/

打开外部网站

相关文章