匿名性被破坏的原因
匿名性不一定会因为一次重大失败而被破坏。
很多时候,是小线索不断累积,看起来分开的信息被连接到同一个人身上,匿名性因此变弱。
没有写本名。 没有发布脸部照片。 使用了 。
即使如此,匿名性仍可能被破坏。
本文会把匿名性被破坏的主要原因,分为网络、识别符、发帖内容、元数据、时间、过去信息、运营失误来整理。
匿名性被破坏是什么意思
匿名性被破坏,是指匿名进行的活动或发言,与真实姓名、本人、所属、日常活动范围、过去账号等连接起来。
这并不一定只意味着本名突然被公开。
例如,下面这些状态也是匿名性变弱的状态。
- 被推测为同一个人的另一个账号
- 职场或学校被推测出来
- 居住地区被缩小范围
- 与过去的实名发帖连接起来
- 被缩小到特定群体中的某个人
- 账号行为与本人的生活模式重叠
匿名性不是 0 或 100 的问题。 线索越多,候选范围就越会被缩小。
通过网络信息被破坏
匿名性中经常被注意到的是 IP 地址和通信路径。
访问网站时,连接目标会看到访问来源 IP 地址。 仅凭 IP 地址不一定能知道个人姓名。 但是,如果与通信运营商、地区、组织、连接时间等组合起来,就会成为通信来源的线索。
此外,DNS 查询、WebRTC 泄漏、VPN 设置错误、 以外的通信、实名应用同时使用,也会成为问题。
| 原因 | 会发生什么 |
|---|---|
| IP 地址暴露 | 连接来源网络可见 |
| DNS 泄漏 | 查询了哪些域名会从另一条路径可见 |
| WebRTC 泄漏 | 通过浏览器泄露本地 IP 或路径信息 |
| VPN 断开 | 通信从原本的线路发出 |
| Tor 外通信 | 想匿名化的通信并没有经过 Tor |
不过,并不是只隐藏网络就能匿名。 网络是重要要素,但只是原因的一部分。
通过 和登录状态被破坏
Cookie 和登录状态,对匿名性来说是非常强的线索。
即使改变 IP 地址,只要发送的是同一个 Cookie,网站侧就会把它当作同一个浏览器的再次访问。 如果登录同一个账号,该行为就会与账号连接起来。
即使使用 VPN 或 Tor,也是一样。
例如,如果在匿名用通信路径中登录实名账号,即使连接来源 IP 的可见方式变了,也会因为账号而与本人连接起来。
| 原因 | 对匿名性的影响 |
|---|---|
| 相同 Cookie | 即使网络改变,也会被当作同一个浏览器 |
| 登录实名账号 | 行为会绑定到账号 |
| 相同邮箱地址 | 实名侧和匿名侧连接起来 |
| 相同电话号码 | 被作为强本人确认信息处理 |
| 相同广告 ID | 跨应用和服务被识别 |
在匿名性中,不只要分离通信路径,也要分离识别符。
从发帖内容被破坏
匿名性并不只会被技术信息破坏。
发帖内容本身也可能包含指向本人或所属的信息。
本名、地区、职场、学校、所属、家庭结构、日常活动范围、过去事件、专业领域、内部情况等,都会成为强线索。
例如,即使没有写名字,如果写了只有少数人知道的事件,对能读懂的人来说,候选范围也会被缩小。 专业术语和行业特有表达,也会成为推测所属或经历的材料。
发帖内容,是发布前最容易确认的部分。 但也是本人越熟悉,越容易漏看的部分。
从图片和文件元数据被破坏
图片、视频、PDF、Office 文件等,可能包含外观看不到的信息。
这称为元数据。
例如,照片中可能包含拍摄时间、相机型号、位置信息。 文档文件中可能留下作者名、组织名、编辑历史、应用程序信息。
在线元数据确认网站或转换网站,可能需要把要确认的文件上传到外部服务。对于高风险文件,需要连同文件正文、元数据、访问来源 IP、确认时间会留在外部的可能性一起考虑。
| 文件 | 残留信息 |
|---|---|
| 照片 | 拍摄时间、位置信息、相机型号 |
| 视频 | 拍摄时间、位置信息、设备信息 |
| 作者、制作软件、文档属性 | |
| Office 文件 | 作者、公司名、编辑历史、评论 |
| 音频文件 | 录音时间、软件信息、标签信息 |
而且,即使删除元数据,图片背景、反射、招牌、制服、建筑物、画面内文字等仍会留下。
在匿名性中,需要同时查看文件内容和元数据。
从时间和行为模式被破坏
发帖时间和访问时间也与匿名性有关。
例如,如果匿名账号的发帖时间,与实名账号的活动时间或本人的生活节奏强烈重叠,就可能成为同一人物的线索。
此外,在特定事件刚发生后发布详细内容、只在职场工作时间外发帖、只在特定地区的时间段活动,这些模式也会成为线索。
时间信息很容易与其他日志对照。
通信日志、社交媒体发帖、出入记录、支付记录、位置信息、访问日志等,可能会以时间为轴连接起来。
从和话题被破坏
文章习惯也与匿名性有关。
标点使用、句尾、措辞、专业词、话题选择、文章长度、表情符号用法等,会因人而有倾向。
在 AI 时代,这类文体和话题特征更容易被分析。 并不是只凭文章就一定能识别本人。 但是,如果与其他信息组合起来,就可能成为同一人物感的材料。
为了保护匿名性,重要的是避免与实名账号使用相同的文体和话题组合。
从过去信息被破坏
匿名性并不只由现在的发帖决定。
过去使用过的账号、旧网名、旧博客、图片、个人资料、社交媒体发帖、存档网站等,可能与现在的匿名活动连接起来。
例如,如果稍微改动并复用过去使用过的用户名,搜索可能会找到过去信息。 如果使用相同头像或图片,可能会通过图片搜索与过去账号连接起来。
思考匿名性时,不只要看“现在的发帖里有没有本名”,也要看“会不会连接到过去公开信息”。
从运营失误被破坏
匿名性不是只要正确设置一次就结束的东西。
持续得越久,出错的可能性就越高。
- 用实名账号搜索匿名活动的信息
- 在匿名用浏览器中登录实名账号
- 用实名邮箱地址注册
- 重复使用相同图片或文体
- 匆忙发帖而省略确认
- 发布后的回复中透露个人信息
匿名性的失败不只是技术失败。 当持续运营崩塌时,也会发生。
总结
匿名性被破坏的原因不止一个。
IP 地址、DNS、Cookie、登录状态、发帖内容、图片、元数据、文体、时间、过去信息、运营失误等,都会涉及多种线索。
重要的是,不要用“没有写本名所以没问题”“使用了 VPN 所以没问题”这种单一判断。
匿名性会根据多种信息如何连接而改变。
在发布前或匿名活动前,需要把网络、设备、账号、内容、文件、时间、过去信息分开确认。
相关工具
ExifTool
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://exiftool.org/