文章中可推测身份的线索
匿名发帖时,很多人会删掉姓名和地址。
但是,文章本身也包含身份线索。、措辞、专业术语、地域表达、个人经历、时间线、情绪表达方式、常用词。这些信息可能与过去账号或真实身份环境连接起来。
在匿名性中,文章要同时从“内容”和“写法”两方面来看。
本文整理文章中可推测身份的线索。
内容中包含的线索
文章内容很容易包含缩小本人或相关人员范围的信息。
| 线索 | 例子 | 匿名性中的风险 |
|---|---|---|
| 地域 | 车站、店铺、天气、方言 | 日常活动范围会显现 |
| 职业 | 行业术语、工作形态 | 职场候选范围会缩小 |
| 学校 | 年级、活动、老师 | 本人或家人会被缩小范围 |
| 家人 | 孩子、配偶、同住者 | 本人以外的人也会被卷入 |
| 时间线 | 某月某日发生的事 | 会被拿来与记录核对 |
即使不写本名,内容组合也会缩小候选范围。
写法中包含的线索
文章的写法也会成为线索。
相同的措辞、标点使用方式、句尾、换行、专业术语的选择、错别字习惯,都会与过去发帖产生关联。
| 写法 | 可见信息 | 注意点 |
|---|---|---|
| 口头禅 | 像同一位写作者 | 是否与实名 SNS 过于相似 |
| 专业术语 | 职业或经验 | 不要具体到超过必要范围 |
| 方言 | 地区或出身 | 与地名重叠时会更强 |
| 换行和符号 | 文体习惯 | 长期会累积 |
| 错别字习惯 | 同一人物性 | 同样错误持续出现会很显眼 |
仅凭文体并不总是能识别个人。
但是,一旦与过去账号、发帖时间、话题组合起来,就会成为强线索。
只有相关人员才懂的信息
文章中特别危险的是只有相关人员才懂的信息。
一般读者看不出来的内容,职场、学校、家人、对方组织却可能看得出来。
| 信息 | 外部看到的样子 | 相关人员看到的样子 |
|---|---|---|
| 会议流程 | 常见的职场话题 | 能看出是哪个部门 |
| 老师的话 | 学校里的事 | 能看出特定老师或班级 |
| 家庭内事件 | 个人话题 | 家人能看出本人 |
| 活动幕后故事 | 参加者的话题 | 现场的人能看出是谁 |
| 资料特征 | 普通文档 | 能看出是哪一件事 |
发布前不仅要确认“陌生人能不能看懂”,也要确认“认识的人读了会不会看出来”。
改写的思路
减少文章线索时,要保留含义,同时降低粒度。
| 原始信息 | 改写例 | 保留的含义 |
|---|---|---|
| 涩谷站附近 | 城市车站周边 | 地点性质 |
| 入职第 3 年的会计 | 工作数年的管理部门人员 | 立场和经验 |
| 5 月 12 日的会议 | 最近的一次公司内部会议 | 事件流程 |
| 初中二年级的儿子 | 孩子 | 家庭语境 |
| 部长的真实姓名 | 上司 | 关系 |
不过,举报或咨询中也有需要准确信息的场景。
也可以把公开用文章做模糊化,而把准确信息交给可信的咨询对象。
AI 时代的文章关联
文章关联并不只靠人的记忆发生。
搜索、摘要、翻译、文章比较让过去发帖和当前发帖更容易被找到。阅读大量帖子所需的成本下降后,文体、话题、专业术语的一致性更容易被发现。
| 材料 | 关联例子 | 注意点 |
|---|---|---|
| 文体 | 像同一位写作者 | 看是否与真实身份一侧过于相似 |
| 专业术语 | 职业或所属 | 限定在必要范围内 |
| 话题组合 | 兴趣、地域、职业 | 人物像会变浓 |
| 过去发帖 | 旧 ID 或博客 | 会被搜索找到 |
| 翻译 | 不同语言的发帖 | 海外发声也无法完全切开 |
没有必要把文章写得完全像另一个人。
但是,在高风险发声中,要避免过度暴露与真实身份一侧文章相同的习惯。
发布前的阅读顺序
确认文章时,按内容、相关人员、写法的顺序看。
| 顺序 | 看什么 | 理由 |
|---|---|---|
| 1 | 本名、地名、组织名 | 因为是直接线索 |
| 2 | 职场、学校、家人 | 因为会缩小候选范围 |
| 3 | 日期、人数、职务 | 因为会被与记录核对 |
| 4 | 只有相关人员才懂的话 | 因为会导致内部识别 |
| 5 | 文体和口头禅 | 因为会与过去账号关联 |
不要一上来只改文体,而要先去掉强线索。
之后再回看文章习惯和话题偏向。
文章短不一定安全
即使是短帖,只要包含特定线索也会危险。
像“现在在站前的店里”“今天我们部门”“刚才孩子学校里”这样的短句,看起来信息量很少,但地点、时间、相关人员都很强。
| 短表达 | 暴露的信息 |
|---|---|
| 现在在站前的店里 | 地点和当前时间 |
| 今天我们部门 | 职场和日期 |
| 孩子学校里 | 家人和学校 |
| 夜班结束后 | 工作形态 |
| 常去的医院 | 日常活动范围和健康信息 |
要看的不是文章量,而是什么会被连接起来。
| 查看范围 | 确认内容 |
|---|---|
| 近期发帖 | 当前暴露的特定线索 |
| 过去发帖 | 同一话题或地区的重复 |
| 回复 | 情绪化时追加的信息 |
| 个人资料 | 与正文组合的属性 |
| 其他账号 | 相同文体或话题的重叠 |
文章不是只看单条帖子,而要按整个账号来确认。
比起变成别人,更重要的是减少关联
匿名发帖时,不必认为“必须写出完全像另一个人的文章”。
重要的是,减少与真实身份一侧或过去账号连接的强关联。常用的独特说法、同一组专业术语、同一地区话题、同样的生气方式、同样的比喻重叠时,文章会带有本人特征。
| 想避免的关联 | 调整例 | 理由 |
|---|---|---|
| 同一句套话 | 改成一般表达 | 减少与过去发帖的一致 |
| 过细的职业术语 | 降到读者需要的范围 | 扩大所属候选范围 |
| 地域性说法 | 改为标准表达 | 弱化与日常活动范围的关联 |
| 同样的愤怒方式 | 分开事实和影响来写 | 弱化情绪习惯 |
| 同一个体验谈 | 模糊时期和细节 | 不与真实身份一侧的经历连接 |
文章安全性可以与可读性并存。
如果删得太多导致意思不明,读者就无法理解。保护匿名性的文章要删掉可用于识别的细节,同时保留读者理解所需的结构和背景。
最后,要确认即使认识真实身份一侧的你的人读到,也不容易觉得是同一个人。
总结
文章在内容和写法两方面都包含身份线索。
地域、职业、学校、家人、时间线、专业术语、文体、口头禅、只有相关人员才懂的信息重叠时,本人或相关人员会被缩小范围。
在匿名性中,只删掉名字并不够。
需要重新阅读文章,确认什么会与过去信息或真实身份环境连接。
重要的是,在保留必要含义的同时,减少可用于识别的细节。
相关工具
OSINT Framework
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。