什么是 Wayback Machine
Web 页面并不是删除后就一定消失。
过去的页面可能被保存到存档中,之后仍可浏览。代表性服务就是 Wayback Machine。
Wayback Machine 是 Internet Archive 提供的 Web 存档。它能确认过去的 Web 页面,因此对研究、报道、资料确认、引用已消失页面有帮助。
URL : https://web.archive.org/
另一方面,从匿名性角度看,它也会成为旧个人资料、已删除博客、活动页面、图片、PDF 残留的位置。
本文说明 Wayback Machine 的基本,以及思考匿名性时应确认什么。
Wayback Machine 中能看到什么
Wayback Machine 中,有时可以看到被保存时点的 Web 页面。
当前已删除页面、改写前的个人资料、旧博客文章、过去链接、图片、PDF 等可能残留。
| 可能可见的内容 | 对匿名性的影响 |
|---|---|
| 旧个人资料 | 看见本名、地区、职业、旧网名 |
| 已删除文章 | 过去想法、、经验残留 |
| 链接集 | 可追到其他账号或实名信息 |
| 图片 | 脸、背景、旧头像残留 |
| PDF・资料 | 作者、活动信息、名单残留 |
Wayback Machine 会显示仅看当前 Web 无法知道的过去信息。
匿名活动中,它用于确认过去信息是否会与当前活动连接。
确认哪些 URL
用 Wayback Machine 确认时,URL 很重要。
只搜索本名不一定能找到页面。要回想过去使用的博客 URL、个人资料 URL、作品页面、学校或团体页面、活动页面、图片 URL、PDF URL 并确认。
| 确认 URL | 理由 |
|---|---|
| 旧博客 URL | 已删除文章和个人资料可能残留 |
| 个人资料 URL | 自我介绍和链接集会残留 |
| 图片 URL | 页面删除后图片单体可能残留 |
| PDF URL | 资料和名单可能被保存 |
| 团体・活动页面 | 参加历史和所属会残留 |
不知道 URL 时,从搜索引擎、旧邮件、书签、SNS 发帖、过去链接集寻找线索。
查看保存日期
在 Wayback Machine 中,保存日期也很重要。
即使同一 URL,不同时期内容会变化。某个时期可能出现本名,另一个时期已删除。个人资料图片、链接、自我介绍、所属信息也可能变化。
| 按保存日期查看什么 | 理由 |
|---|---|
| 信息出现的时期 | 与所属或活动时期连接 |
| 个人资料变更 | 旧网名和实名迁移可见 |
| 链接添加・删除 | 可看出与其他账号关系 |
| 图片替换 | 过去头像或脸部照片残留 |
| 页面删除时期 | 有时会推测想删除什么 |
不要只看一个保存日期,而要确认多个时间点。
过去的变化本身也可能成为关联材料。
删除原页面和删除存档是两回事
即使删除原页面,Wayback Machine 中保存的页面也不一定自动消失。
反过来,即使 Wayback Machine 中不可见,原页面、其他存档、转载处也可能残留信息。
| 应对 | 含义 | 注意点 |
|---|---|---|
| 删除原页面 | 删除当前公开页面 | 存档和转载可能残留 |
| 删除搜索结果 | 让搜索中不易看到 | 不是删除原信息本身 |
| 请求删除存档 | 请求删除已保存页面 | 依赖服务侧手续和判断 |
| robots.txt/noindex | 给爬虫或搜索的指示 | 不一定删除过去保存内容 |
在匿名性中,要分开思考“搜索不到”“原页面没有”“存档中没有”。
不能只凭其中一个就判断已经完全消失。
确认时的注意点
在 Wayback Machine 查看过去页面时,不只看页面正文,也要确认周边信息。
页面标题、链接、图片、PDF、侧边栏、个人资料栏、评论栏、页脚、存档日期都会成为线索。
| 确认位置 | 查看内容 |
|---|---|
| 正文 | 本名、地区、职场、学校、过去经验 |
| 个人资料栏 | 旧网名、链接、图片 |
| 图片 | 脸、背景、过去头像 |
| 链接 | 到其他账号或实名网站的路径 |
| 保存日期 | 是否与当时行为或所属连接 |
越旧的页面,越容易残留本人没警惕时写的信息。
要确认是否有与当前匿名活动重叠的信息。
不由自己管理的页面也会残留
Wayback Machine 中需要确认的不只是自己的网站。
学校、职场、团体、活动、店铺、媒体、朋友博客等,不由自己管理的页面也会残留信息。即使本人删除了自己的博客,活动参加者名单或团体页面中仍可能残留姓名和照片。
| 第三方页面 | 残留信息 |
|---|---|
| 学校・职场页面 | 姓名、所属、职务、活动历史 |
| 活动页面 | 参加日期时间、照片、团体名 |
| 店铺・地区网站 | 日常活动范围或活动地点 |
| 媒体文章 | 发言、脸部照片、头衔 |
| 朋友或团体博客 | 交友关系或旧网名 |
过去信息不只是自己发出的东西。
他人和组织公开的信息也会影响当前匿名性。
找到时的应对
如果在 Wayback Machine 中发现过去信息,先确认原页面状态。
如果原页面仍公开,先考虑删除或修改原页面。不是自己管理的页面,可能需要联系网站管理员。
| 状态 | 应对 |
|---|---|
| 原页面公开中 | 先考虑删除或修改原页面 |
| 原页面已删除 | 考虑存档删除请求 |
| 图片或 PDF 残留 | 也确认个别 URL |
| 他人或团体页面 | 请求管理员删除或修正 |
| 无法删除 | 改成不与当前匿名活动连接的运营 |
删除请求可能需要对象 URL、有问题的信息、证明本人或管理员身份的信息。
但是,为本人确认而暴露过多信息也会成为另一种风险。要谨慎考虑必要范围。
无法删除时的思路
有时无法完全删除存档。
这种情况下,优先避免残留信息与当前活动连接。如果过去地区、职场、学校、旧网名、图片、文体仍残留,就不要在新匿名账号中强化相同要素。
无法删除的过去信息要放入威胁模型。
把它当成“只要查找就可能找到的信息”,并调整当前发帖、图片、时间、账号设计。
总结
Wayback Machine 是可以确认过去 Web 页面的存档。
它有助于研究和资料确认,但在匿名性中,也会成为已删除个人资料、旧博客、图片、PDF、链接集残留的位置。
确认时,要看旧 URL、个人资料 URL、图片 URL、PDF URL、团体和活动页面。不只看正文,也要确认个人资料栏、链接、图片、保存日期。
删除原页面、删除搜索结果、删除存档是不同问题。
如果无法删除过去信息,重要的是切换到不让它与当前匿名活动连接的运营。
相关工具
Wayback Machine
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://web.archive.org/
OSINT Framework
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。