Learn

284 篇文章分类:全部
文本与内容

文章中可推测身份的线索

匿名发帖时,很多人会删掉姓名和地址。

但是,文章本身也包含身份线索。、措辞、专业术语、地域表达、个人经历、时间线、情绪表达方式、常用词。这些信息可能与过去账号或真实身份环境连接起来。

在匿名性中,文章要同时从“内容”和“写法”两方面来看。

本文整理文章中可推测身份的线索。

内容中包含的线索

文章内容很容易包含缩小本人或相关人员范围的信息。

线索例子匿名性中的风险
地域车站、店铺、天气、方言日常活动范围会显现
职业行业术语、工作形态职场候选范围会缩小
学校年级、活动、老师本人或家人会被缩小范围
家人孩子、配偶、同住者本人以外的人也会被卷入
时间线某月某日发生的事会被拿来与记录核对

即使不写本名,内容组合也会缩小候选范围。

写法中包含的线索

文章的写法也会成为线索。

相同的措辞、标点使用方式、句尾、换行、专业术语的选择、错别字习惯,都会与过去发帖产生关联。

写法可见信息注意点
口头禅像同一位写作者是否与实名 SNS 过于相似
专业术语职业或经验不要具体到超过必要范围
方言地区或出身与地名重叠时会更强
换行和符号文体习惯长期会累积
错别字习惯同一人物性同样错误持续出现会很显眼

仅凭文体并不总是能识别个人。

但是,一旦与过去账号、发帖时间、话题组合起来,就会成为强线索。

只有相关人员才懂的信息

文章中特别危险的是只有相关人员才懂的信息。

一般读者看不出来的内容,职场、学校、家人、对方组织却可能看得出来。

信息外部看到的样子相关人员看到的样子
会议流程常见的职场话题能看出是哪个部门
老师的话学校里的事能看出特定老师或班级
家庭内事件个人话题家人能看出本人
活动幕后故事参加者的话题现场的人能看出是谁
资料特征普通文档能看出是哪一件事

发布前不仅要确认“陌生人能不能看懂”,也要确认“认识的人读了会不会看出来”。

改写的思路

减少文章线索时,要保留含义,同时降低粒度。

原始信息改写例保留的含义
涩谷站附近城市车站周边地点性质
入职第 3 年的会计工作数年的管理部门人员立场和经验
5 月 12 日的会议最近的一次公司内部会议事件流程
初中二年级的儿子孩子家庭语境
部长的真实姓名上司关系

不过,举报或咨询中也有需要准确信息的场景。

也可以把公开用文章做模糊化,而把准确信息交给可信的咨询对象。

AI 时代的文章关联

文章关联并不只靠人的记忆发生。

搜索、摘要、翻译、文章比较让过去发帖和当前发帖更容易被找到。阅读大量帖子所需的成本下降后,文体、话题、专业术语的一致性更容易被发现。

材料关联例子注意点
文体像同一位写作者看是否与真实身份一侧过于相似
专业术语职业或所属限定在必要范围内
话题组合兴趣、地域、职业人物像会变浓
过去发帖旧 ID 或博客会被搜索找到
翻译不同语言的发帖海外发声也无法完全切开

没有必要把文章写得完全像另一个人。

但是,在高风险发声中,要避免过度暴露与真实身份一侧文章相同的习惯。

发布前的阅读顺序

确认文章时,按内容、相关人员、写法的顺序看。

顺序看什么理由
1本名、地名、组织名因为是直接线索
2职场、学校、家人因为会缩小候选范围
3日期、人数、职务因为会被与记录核对
4只有相关人员才懂的话因为会导致内部识别
5文体和口头禅因为会与过去账号关联

不要一上来只改文体,而要先去掉强线索。

之后再回看文章习惯和话题偏向。

文章短不一定安全

即使是短帖,只要包含特定线索也会危险。

像“现在在站前的店里”“今天我们部门”“刚才孩子学校里”这样的短句,看起来信息量很少,但地点、时间、相关人员都很强。

短表达暴露的信息
现在在站前的店里地点和当前时间
今天我们部门职场和日期
孩子学校里家人和学校
夜班结束后工作形态
常去的医院日常活动范围和健康信息

要看的不是文章量,而是什么会被连接起来。

查看范围确认内容
近期发帖当前暴露的特定线索
过去发帖同一话题或地区的重复
回复情绪化时追加的信息
个人资料与正文组合的属性
其他账号相同文体或话题的重叠

文章不是只看单条帖子,而要按整个账号来确认。

比起变成别人,更重要的是减少关联

匿名发帖时,不必认为“必须写出完全像另一个人的文章”。

重要的是,减少与真实身份一侧或过去账号连接的强关联。常用的独特说法、同一组专业术语、同一地区话题、同样的生气方式、同样的比喻重叠时,文章会带有本人特征。

想避免的关联调整例理由
同一句套话改成一般表达减少与过去发帖的一致
过细的职业术语降到读者需要的范围扩大所属候选范围
地域性说法改为标准表达弱化与日常活动范围的关联
同样的愤怒方式分开事实和影响来写弱化情绪习惯
同一个体验谈模糊时期和细节不与真实身份一侧的经历连接

文章安全性可以与可读性并存。

如果删得太多导致意思不明,读者就无法理解。保护匿名性的文章要删掉可用于识别的细节,同时保留读者理解所需的结构和背景。

最后,要确认即使认识真实身份一侧的你的人读到,也不容易觉得是同一个人。

总结

文章在内容和写法两方面都包含身份线索。

地域、职业、学校、家人、时间线、专业术语、文体、口头禅、只有相关人员才懂的信息重叠时,本人或相关人员会被缩小范围。

在匿名性中,只删掉名字并不够。

需要重新阅读文章,确认什么会与过去信息或真实身份环境连接。

重要的是,在保留必要含义的同时,减少可用于识别的细节。

相关工具

OSINT directory

OSINT Framework

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://osintframework.com/

打开外部网站

相关文章