Wayback Machine 与存档的风险
已经公开过一次的信息,即使删除,也不一定会完全消失。
会残留在搜索结果中。 会被截图。 会被转载。 会被保存到存档中。
其中的代表例子就是 Internet Archive 的 。
Wayback Machine 是 Internet Archive 的服务,可以保存并查看网页过去的状态。 URL : https://web.archive.org/
本文整理存档与匿名性有什么关系。
什么是存档
存档,是指保存下来的网页过去状态。
即使页面现在已经删除,它过去的状态也可能残留在存档中。
旧个人资料。 已删除的博客。 已关闭的网站。 旧社交媒体页面。 活动公告。 成员介绍。
这些内容如果残留下来,可能会与当前的匿名活动连接起来。
存档并不是把过去的互联网原样、完整地保存下来。 有些页面会被保存,有些页面不会。 图片或 CSS 也可能缺失。 需要登录的页面有时看不到。
但是,在思考匿名性时,把它看作“可能还残留着”会更安全。 本人以为已经删除的个人资料、过去的自我介绍、网名、链接集、参加过的活动,可能会被第三方看到。 尤其是旧网站和博客,有时会比本人记忆中保留得更久。
已删除页面也可能被找到
即使本人以为“已经删掉了”,从第三方看来也可能找到。
例如,过去的博客里写着真实姓名和网名。 那个博客已经删除。 但仍残留在存档中。
如果当前匿名账号使用同一个网名或同一段经历,就会与过去页面连接起来。
不要认为删除过的信息一定已经消失,这样更安全。
常见情况是,当前搜索结果中已经不出现,但只要知道旧 URL,就能在存档中找到。 例如过去的个人资料页面、活动参加页面、博客文章、作品集、论坛自我介绍等。 还可能从过去的链接集或个人资料继续追到其他旧页面。
在匿名活动中,旧 URL 本身也会成为线索。 回想自己过去使用过的域名、博客服务、用户 ID、个人资料页面 URL,并确认它们是否残留在存档中。
存档中容易被看到的信息
| 容易残留在存档中的信息 | 对匿名性的影响 |
|---|---|
| 旧个人资料 | 能看到真实姓名、地区、职业 |
| 过去的网名 | 与当前匿名名连接起来 |
| 图片和头像 | 通过图片搜索或记忆连接起来 |
| 活动页面 | 能看到所属和活动历史 |
| 旧链接集 | 能看到人际关系和运营网站 |
存档是一种回溯时间的搜索。 只看当前页面是不够的。
在存档中特别危险的,是当时并不觉得有问题的信息。 过去曾用实名活动。 写过学校名或工作单位名。 用同一个网名做过多个活动。 个人资料图片中出现了脸或日常活动范围。
即使这些信息在当时很自然,一旦与当前匿名活动组合起来,就会成为风险。 存档会成为连接过去的自己与当前匿名活动的桥。
| 过去存档中的信息 | 与当前匿名活动的连接 |
|---|---|
| 真实姓名和网名在同一页面上 | 匿名名的候选会与本人连接起来 |
| 旧个人资料图片残留 | 会与当前头像或脸部照片比较 |
| 写有学校或工作单位 | 与发帖内容中的所属信息重叠 |
| 过去的亲身经历残留 | 与当前发帖的上下文一致 |
| 链接集残留 | 能看到交友关系和运营网站 |
不要只靠删除请求就安心
有时可以从存档中删除内容。 但是,删除请求不一定会把所有内容都删除。
其他存档。 搜索结果。 转载网站。 截图。 社交媒体引用。
内容可能残留在别的地方。
删除请求有时有效。 不过,在匿名性上,以“仍然残留”为前提设计当前发帖会更安全。
提出删除请求时,也需要准确掌握对象 URL。 不只是同一网站的首页,个别文章、个人资料、图片 URL、PDF、旧子页面也可能被保存。 即使首页消失,下层页面也可能残留。
此外,除了 Wayback Machine,还有搜索引擎缓存、引用网站、镜像网站、社交媒体截图、个人保存的数据。 不要把从一个地方消失,理解成已经从整体消失。
要确认的事项
在匿名活动之前,确认以下信息。不过,如果把真实姓名、旧姓、电子邮件地址、用户 ID、未公开图片、高风险资料原样输入搜索引擎或外部 AI,搜索词或上传内容可能会残留在服务侧日志中。高风险情况下,应避免实名环境,尽量减少搜索词,并以不把未公开资料上传到外部服务为前提进行确认。
- 用真实姓名和旧网名搜索
- 在 Wayback Machine 中确认旧博客和网站的 URL
- 查看过去个人资料是否残留
- 查看旧图片和头像是否残留
- 查看是否有与当前匿名活动相同的经历或
- 记录并整理已删除页面的 URL
存档确认是过去信息对策的一部分。
事先决定确认顺序,可以减少遗漏。 首先用真实姓名、旧姓、网名、电子邮件地址、用户 ID 搜索。 接着,在 Wayback Machine 中确认找到的旧 URL。 进一步查看那些页面上贴出的链接和图片 URL。
找到的信息,在立刻进入删除请求之前要先分类。 它是直接连接本人的信息,还是显示日常活动范围的信息,是连接过去匿名名与真实姓名的信息,还是单纯的旧活动历史。 不分类,就容易弄错优先级。
反映到当前运营中
如果信息残留在存档中,当前匿名活动中不要使用同样的材料,这一点很重要。
如果旧网名残留,就不要使用相似名称。 如果旧图片残留,就不要使用同一图片或氛围相同的头像。 如果过去的职业或学校残留,当前发帖中就不要详细写同一上下文。 如果过去的亲身经历残留,匿名侧就不要原样重复使用同一个故事。
存档对策不只是删除过去的工作。 它是以残留的过去为前提,设计当前发布内容的工作。
确认时,不只按整个网站看,也要按 URL 单位查看,这一点也很重要。 首页、个人资料、个别文章、图片文件、PDF、标签页、月度存档可能分别被保存。 即使以为“网站已经没了”,也可能只有个别页面残留。 也要把能从旧链接追到的页面一起确认。
总结
Wayback Machine 等存档中,可能残留过去的网页。
已删除的博客、旧个人资料、过去的网名、图片、活动页面如果残留,可能会与当前匿名活动连接起来。
不要只靠删除请求就安心。重要的是以过去信息会残留为前提进行确认。
为了保护匿名性,不只需要查看当前发帖,也需要查看过去公开过的信息痕迹。
相关工具
Wayback Machine
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://web.archive.org/
OSINT Framework
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。