Learn

284 篇文章分类:全部
过往信息与搜索

什么是 Wayback Machine

Web 页面并不是删除后就一定消失。

过去的页面可能被保存到存档中,之后仍可浏览。代表性服务就是 Wayback Machine。

Wayback Machine 是 Internet Archive 提供的 Web 存档。它能确认过去的 Web 页面,因此对研究、报道、资料确认、引用已消失页面有帮助。

URL : https://web.archive.org/

另一方面,从匿名性角度看,它也会成为旧个人资料、已删除博客、活动页面、图片、PDF 残留的位置。

本文说明 Wayback Machine 的基本,以及思考匿名性时应确认什么。

Wayback Machine 中能看到什么

Wayback Machine 中,有时可以看到被保存时点的 Web 页面。

当前已删除页面、改写前的个人资料、旧博客文章、过去链接、图片、PDF 等可能残留。

可能可见的内容对匿名性的影响
旧个人资料看见本名、地区、职业、旧网名
已删除文章过去想法、、经验残留
链接集可追到其他账号或实名信息
图片脸、背景、旧头像残留
PDF・资料作者、活动信息、名单残留

Wayback Machine 会显示仅看当前 Web 无法知道的过去信息。

匿名活动中,它用于确认过去信息是否会与当前活动连接。

确认哪些 URL

用 Wayback Machine 确认时,URL 很重要。

只搜索本名不一定能找到页面。要回想过去使用的博客 URL、个人资料 URL、作品页面、学校或团体页面、活动页面、图片 URL、PDF URL 并确认。

确认 URL理由
旧博客 URL已删除文章和个人资料可能残留
个人资料 URL自我介绍和链接集会残留
图片 URL页面删除后图片单体可能残留
PDF URL资料和名单可能被保存
团体・活动页面参加历史和所属会残留

不知道 URL 时,从搜索引擎、旧邮件、书签、SNS 发帖、过去链接集寻找线索。

查看保存日期

在 Wayback Machine 中,保存日期也很重要。

即使同一 URL,不同时期内容会变化。某个时期可能出现本名,另一个时期已删除。个人资料图片、链接、自我介绍、所属信息也可能变化。

按保存日期查看什么理由
信息出现的时期与所属或活动时期连接
个人资料变更旧网名和实名迁移可见
链接添加・删除可看出与其他账号关系
图片替换过去头像或脸部照片残留
页面删除时期有时会推测想删除什么

不要只看一个保存日期,而要确认多个时间点。

过去的变化本身也可能成为关联材料。

删除原页面和删除存档是两回事

即使删除原页面,Wayback Machine 中保存的页面也不一定自动消失。

反过来,即使 Wayback Machine 中不可见,原页面、其他存档、转载处也可能残留信息。

应对含义注意点
删除原页面删除当前公开页面存档和转载可能残留
删除搜索结果让搜索中不易看到不是删除原信息本身
请求删除存档请求删除已保存页面依赖服务侧手续和判断
robots.txt/noindex给爬虫或搜索的指示不一定删除过去保存内容

在匿名性中,要分开思考“搜索不到”“原页面没有”“存档中没有”。

不能只凭其中一个就判断已经完全消失。

确认时的注意点

在 Wayback Machine 查看过去页面时,不只看页面正文,也要确认周边信息。

页面标题、链接、图片、PDF、侧边栏、个人资料栏、评论栏、页脚、存档日期都会成为线索。

确认位置查看内容
正文本名、地区、职场、学校、过去经验
个人资料栏旧网名、链接、图片
图片脸、背景、过去头像
链接到其他账号或实名网站的路径
保存日期是否与当时行为或所属连接

越旧的页面,越容易残留本人没警惕时写的信息。

要确认是否有与当前匿名活动重叠的信息。

不由自己管理的页面也会残留

Wayback Machine 中需要确认的不只是自己的网站。

学校、职场、团体、活动、店铺、媒体、朋友博客等,不由自己管理的页面也会残留信息。即使本人删除了自己的博客,活动参加者名单或团体页面中仍可能残留姓名和照片。

第三方页面残留信息
学校・职场页面姓名、所属、职务、活动历史
活动页面参加日期时间、照片、团体名
店铺・地区网站日常活动范围或活动地点
媒体文章发言、脸部照片、头衔
朋友或团体博客交友关系或旧网名

过去信息不只是自己发出的东西。

他人和组织公开的信息也会影响当前匿名性。

找到时的应对

如果在 Wayback Machine 中发现过去信息,先确认原页面状态。

如果原页面仍公开,先考虑删除或修改原页面。不是自己管理的页面,可能需要联系网站管理员。

状态应对
原页面公开中先考虑删除或修改原页面
原页面已删除考虑存档删除请求
图片或 PDF 残留也确认个别 URL
他人或团体页面请求管理员删除或修正
无法删除改成不与当前匿名活动连接的运营

删除请求可能需要对象 URL、有问题的信息、证明本人或管理员身份的信息。

但是,为本人确认而暴露过多信息也会成为另一种风险。要谨慎考虑必要范围。

无法删除时的思路

有时无法完全删除存档。

这种情况下,优先避免残留信息与当前活动连接。如果过去地区、职场、学校、旧网名、图片、文体仍残留,就不要在新匿名账号中强化相同要素。

无法删除的过去信息要放入威胁模型。

把它当成“只要查找就可能找到的信息”,并调整当前发帖、图片、时间、账号设计。

总结

Wayback Machine 是可以确认过去 Web 页面的存档。

它有助于研究和资料确认,但在匿名性中,也会成为已删除个人资料、旧博客、图片、PDF、链接集残留的位置。

确认时,要看旧 URL、个人资料 URL、图片 URL、PDF URL、团体和活动页面。不只看正文,也要确认个人资料栏、链接、图片、保存日期。

删除原页面、删除搜索结果、删除存档是不同问题。

如果无法删除过去信息,重要的是切换到不让它与当前匿名活动连接的运营。

相关工具

Archive check

Wayback Machine

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://web.archive.org/

打开外部网站
OSINT directory

OSINT Framework

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://osintframework.com/

打开外部网站

相关文章