文章和发言破坏匿名性的机制
匿名性不能只靠通信环境来保护。
正文中不写本名。 不放脸部照片。 使用 或 。
即便如此,文章和发言中也可能残留本人特征。
地区、职场、学校、专业领域、经历、、口头禅、发帖时间。 这些信息叠加后,即使没有名字,也会缩小候选范围。
本文整理匿名性如何从文章和发言中变弱。
文章包含本人的经验
文章中会出现本人的经验。
即使自己只是当作普通说明,读者也可能把它视为强线索。
例如,以下信息就是如此。
- 职场或学校发生的事
- 特定地区或线路的话题
- 只有少数人知道的经历
- 专业领域或内部用语
- 家庭结构或生活节奏
- 过去写过同一话题的历史
即使外部的人看不懂,相关人员也可能看得出来。
在匿名性中,只考虑“陌生人读了没问题”是不够的。 还需要考虑“认识自己的人读了会怎么看”。
对本人来说越普通的经验,对身边的人越可能成为强线索。 职场常用的词、学校活动、当地店铺、家庭结构、通勤路线、特定时期的麻烦。 对外部读者来说是一般话题,但对相关人员来说,会看成“说这件事的难道是那个人吗”。
在匿名性中,要从陌生外部读者之外的视角阅读文章,包括熟人、同事、同学、家人、知道过去账号的人。
文体也会成为线索
不仅文章内容,写法也会成为线索。
语尾、标点、换行、常用说法、话题排列方式、生气方式、说明顺序。 这些都会形成同一人物感。
| 线索 | 可见的东西 |
|---|---|
| 语尾和口头禅 | 文章习惯 |
| 标点和换行 | 写作节奏 |
| 专业术语 | 职业或所属领域 |
| 说明顺序 | 思考习惯 |
| 常提到的话题 | 关注点或立场 |
并不是只靠文体就一定能知道本人。 但是,当它与过去发帖、实名账号、发帖时间、内容组合时,就会成为关联材料。
文体的详细思路,会在“通过文体推测身份的原因”这篇文章中处理。
文体单独来看是模糊线索。 但是,如果与同一话题、同一地区、同一发帖时间、同一图片重叠,就会变强。 特别是反复发布长文的账号中,说明顺序和用词选择会积累起来。
要把文体完全变成另一个人并不容易。 比起勉强制造不自然的文体,更现实的是减少只有本人会用的表达、固有口头禅、与实名侧相同的固定说法。
话题组合会变得危险
如果只有一个话题,很多人都符合。
但是,话题一组合,范围就会一下子缩小。
例如,熟悉特定行业。 也熟悉特定地区的交通情况。 对特定学校活动作出反应。 在同一时期经历同样的麻烦。
这些重叠后,候选就会减少。
| 单项信息 | 组合的信息 | 会发生的事 |
|---|---|---|
| IT 行业话题 | 地方城市的特定线路 | 职业和日常活动范围接近 |
| 学校活动话题 | 年级或社团 | 所属候选被缩小 |
| 职场麻烦 | 时期和职位 | 相关人员可以推测 |
| 地区活动 | 发帖时间 | 出现在现场的可能性出现 |
在匿名性中,不只看一个个信息,也要看组合。
话题组合是匿名性的核心风险。 像“IT 行业”“地方城市”“特定铁路线路”“育儿”“夜班”“某个时期的职场麻烦”这样,元素越重叠,候选越少。 本人可能把它们当成不同发帖来写,但阅读者会查看整个账号。
发帖前,要把它和过去发帖并排确认。 重要的是看同一地区、同一行业、同一时期、同一人际关系是否反复出现。
也要注意语音和说话方式
发言不只是文章。
语音、视频、直播、通话、空间、采访中也有线索。
声音本身。 说话方式。 方言。 语塞。 周围声音。 背景对话。 通知音。
语音有时比文章包含更多信息。 知道声音和说话方式的人,可能即使是匿名语音也会注意到。
此外,背景音也可能让地点和时间被推测。
语音比文章更强地表现本人特征。 音质、方言、说话速度、停顿方式、笑法、语塞、专业术语使用方式,认识的人会听得出来。 即使改变声音,如果说话内容和背景音仍在,候选也会被缩小。
直播和通话中,也要注意周围声音。 车站广播、职场广播、学校铃声、家人声音、通知音、键盘声会显示地点或生活环境。
模糊文章时的思路
要让文章更安全,只删除固有名词是不够的。
即使删除公司名,如果部门人数、职位、时期、事件过细,候选也会被缩小。 即使删除地名,如果车站、店铺、活动、天气、交通信息仍在,日常活动范围也会可见。
模糊化的目的,不是让文章变得意义不明。 而是降低识别所需的粒度。
- 把固有名词改成更宽泛的表达
- 把时期变粗
- 模糊人数和职位
- 扩大地区范围
- 避免只有自己知道的经历
- 减少与实名侧相同的文体
模糊过度后,文章会无法传达。 重要的是保留读者需要的事实,删除会连接到本人的细节。 问题结构、想传达的主张、读者需要的背景要保留。 另一方面,只有少数人知道的时间、地点、职位、对话、固有说法要调整。
也要注意公开后的回复
即使最初的发帖写得很谨慎,也可能在回复中增加信息。 回答问题的过程中,地区、时期、职场、相关人员、经历的粒度会上升。 DM 也一样。
要保护匿名性,不只要决定发帖正文,还要决定回复和补充的规则。 要有不回答的问题、模糊范围、不追加资料的基准。
决定要确认的粒度
确认文章和发言时,只找固有名词是不够的。 要看地区、时期、人数、职位、相关人员、专业术语、话题组合。
| 要确认的粒度 | 查看理由 |
|---|---|
| 地区 | 不缩小日常活动范围或所属 |
| 时期 | 会与事件或日志比对 |
| 人数、职位 | 相关人员范围会缩小 |
| 专业术语 | 职业或部门会可见 |
| 口头禅、方言 | 会推测本人或地区 |
不是把内容变薄,而是降低识别所需的细致程度。
发帖前要确认的事
公开文章或发言前,确认以下几点。
- 是否没有出现本名、地名、职场、学校、所属
- 是否没有写只有相关人员知道的事件
- 是否没有使用和过去发帖相同的经历
- 是否与实名账号文体相似
- 发帖时间是否没有与生活节奏过度重叠
- 如果是语音,是否没有留下背景音和方言
- 即使组合多个小信息,是否也不会被识别
在匿名性中,要把内容、文体、时间、地点合在一起看。
总结
文章和发言中会残留连接到本人的线索。
即使没有写本名,也会通过地区、职场、学校、专业领域、经历、文体、话题组合缩小候选范围。
在语音和视频中,声音、方言、说话方式、背景音也会成为线索。
要保护匿名性,不只要确认写了什么,还要确认怎么写、何时发出、谁读了会看得出来。
相关工具
OSINT Framework
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。