Office 文件中的作者信息
Word、Excel、PowerPoint 等 Office 文件中可能残留作者信息。
即使正文没有写姓名,文件内部属性中也可能残留个人名、公司名、用户名、模板名、修改历史、评论。匿名共享资料时,这会成为强线索。
本文整理 Office 文件的作者信息如何关系到匿名性。
什么是作者信息
Office 文件不只有文档正文,还包含与创建和编辑有关的信息。
| 信息 | 例 | 匿名性风险 |
|---|---|---|
| 作者 | 个人名、OS 用户名 | 本人姓名直接出现 |
| 公司名 | 组织名、部门名 | 所属可见 |
| 最后更新者 | 编辑者姓名 | 相关人员可见 |
| 模板 | 内部模板名 | 组织或部门被推测 |
| 评论 | 审阅者、内部备忘 | 相关人员和判断过程残留 |
Office 文件是便于共同编辑和审阅的格式。
这种便利在匿名性中会变成风险。
修改历史和评论
Office 文档中可能残留修改历史和评论。
即使整理了正文,如果评论中残留实名、邮箱、内部对话、判断理由,相关人员就可能从中暴露。
| 功能 | 残留信息 | 注意点 |
|---|---|---|
| 修改历史 | 谁编辑了哪里 | 最终版中也可能残留 |
| 评论 | 内部备忘或姓名 | 公开前删除 |
| 隐藏工作表 | 背后数据或备忘 | Excel 中尤其注意 |
| 备注 | 演示者备注 | PowerPoint 中容易残留 |
| 链接 | 内部路径或云端 URL | 暴露组织信息 |
Office 文件只看可见页面是不够的。
要确认审阅信息和隐藏信息。
转换成 PDF 也不等于安全
把 Office 文件转换成 PDF 并不一定安全。
转换后的 PDF 中可能残留标题、作者、创建软件。另外,如果通过其他路径共享了原 Office 文件,其中仍然会残留作者信息。
| 处理 | 可能残留 | 要确认的事 |
|---|---|---|
| PDF 转换 | 作者和标题 | 查看 PDF 属性 |
| 打印输出 | 页边、页眉、水印 | 确认可见内容 |
| 共同编辑 | 历史和评论 | 确认原文件 |
| 云端共享 | 所有者名和编辑历史 | 查看共享对象看到什么 |
| 文件名修改 | 内部信息会留下 | 不只按名称判断 |
制作公开用文件时,要同时确认原 Office 文件和转换后的 PDF。
不过,如果把原文件上传到外部转换服务或在线文档检查服务,该服务可能获得文档内容、作者信息、访问信息。高风险资料中,应优先在本地环境进行转换和检查。
确认步骤
匿名处理 Office 文件时,要制作公开用副本。
| 步骤 | 要确认的事 |
|---|---|
| 1 | 不直接公开原文件 |
| 2 | 制作公开用副本 |
| 3 | 确认作者、公司名、最后更新者 |
| 4 | 确认评论、修改历史、隐藏工作表 |
| 5 | 确认文件名、文件夹名、链接 |
| 6 | 转换为 PDF 等格式后也再次确认 |
| 7 | 查看上传目标是否显示所有者名 |
内部举报和采访资料中,有些场景不应独自判断文件处理。
需要同时考虑证据价值和匿名性。
作者信息残留的典型场景
作者信息会在本人没有意识到的地方进入文件。
用公司配发 PC 创建的文档、用学校账号创建的资料、用带个人名的 OS 用户创建的文件、共同编辑的文档,都可能包含创建环境的信息。
| 场景 | 容易残留的信息 | 注意点 |
|---|---|---|
| 公司 PC 创建 | 公司名、用户名 | 与组织连接 |
| 学校账号创建 | 学校名、邮箱 | 暴露未成年人或学生信息 |
| 共同编辑 | 编辑者名、评论 | 卷入相关人员 |
| 使用模板 | 内部模板名 | 部门或案件可见 |
| 个人 PC 创建 | OS 用户名 | 可能包含本名 |
Office 文件会携带它是在哪个环境中创建的信息。
匿名发布时,也要确认创建环境的信息。
删除后也要再次确认
即使以为已经删除作者信息,姓名仍可能留在别处。
要确认评论、修改历史、隐藏工作表、链接、文件名、PDF 转换后的属性。特别是在 Excel 中,不能只看可见的工作表来判断。
| 确认位置 | 查看信息 |
|---|---|
| 文档属性 | 作者、公司名、标题 |
| 评论 | 姓名、内部备忘 |
| 修改历史 | 编辑者、修改内容 |
| 隐藏信息 | 隐藏工作表、备注 |
| 转换后 PDF | PDF 侧作者信息 |
作者信息不只是公开者本人的问题。
共同编辑者、上司、同事、老师、学生、家人的名字也可能残留。在匿名性中,不只确认自己的名字,也要确认相关人员的名字是否出现。
收到的 Office 文件也要注意
Office 文件的作者信息不只是自己创建的文件的问题。
如果把别人给的资料原样公开,可能把对方的姓名、组织名、编辑历史外泄。在匿名性中,不只要保护自己的信息,也要保护提供者和相关人员的信息。
| 收到的信息 | 风险 |
|---|---|
| 作者名 | 提供者可见 |
| 公司名 | 所属组织可见 |
| 评论 | 内部对话外泄 |
| 修改历史 | 相关人员顺序可见 |
| 文件名 | 案件或部门可见 |
公开收到的 Office 文件前,也要制作公开用副本,并确认作者信息。
分开创建环境
匿名性重要的文档,最好从创建环境开始分开。
使用实名 Office 环境、公司配发 PC、学校账号、个人云端时,作者信息和共享者信息更容易进入文件。之后也可以删除,但从一开始不混用,会减少确认负担。
| 环境 | 容易发生的问题 | 思路 |
|---|---|---|
| 公司 PC | 公司名和用户名进入 | 不用于匿名公开 |
| 学校账号 | 学校名和邮箱残留 | 与个人活动分开 |
| 个人云端 | 所有者名显示 | 分开共享路径 |
| 平时的 OS 用户 | 本名用户名进入 | 准备公开用环境 |
| 共同编辑 | 相关人员名残留 | 整理到公开用副本 |
即使分开创建环境,也仍要确认正文和文件名。
不过,一开始就不使用实名环境,可以减少之后忘记删除的信息。在匿名性中,不只是删除,避免混合的设计也很重要。
总结
Office 文件中可能残留作者、公司名、最后更新者、评论、修改历史、隐藏工作表、链接。
在匿名性中,要确认的不只是正文,还有文件内部信息。
即使转换成 PDF,作者信息也可能残留。
公开前,要制作公开用副本,并同时确认原文件和转换后文件。
高风险资料中,为了兼顾证据价值和安全性,使用可信咨询对象也很重要。
相关工具
ExifTool
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://exiftool.org/
MAT2
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。