生成式 AI 图片中残留的信息
有人会认为,用生成式 AI 制作的图片不是现实相机拍摄的,所以安全。
但这种理解过于简单。
生成式 AI 图片也可能涉及创建工具、生成日期、编辑软件、提示词片段、与账号信息连接的文件名、服务侧历史、云端共享信息。
另外,即使图片本身没有拍到个人信息,也可能从提示词、公开文字、生成历史、复用素材中推测出创建者或活动内容。
如果考虑匿名性,生成式 AI 图片也要像普通图片一样确认。
本文整理生成式 AI 图片中残留的信息,以及公开前应查看的点。
生成式 AI 图片中也会留下信息
生成式 AI 图片不一定包含相机 GPS 信息。
但是,这并不意味着不会留下任何信息。图片文件中可能包含元数据,服务侧也可能留下生成历史、提示词、账号、IP 地址、支付信息、使用时刻。
| 信息 | 残留位置 | 对匿名性的影响 |
|---|---|---|
| 生成日期 | 文件、服务历史 | 与发帖时间或作业时间连接 |
| 生成工具名 | 元数据、水印、文件名 | 可知道使用服务或作业环境 |
| 提示词 | 服务历史、共享页面 | 关注点、目的、对象可见 |
| 账号信息 | 生成服务、云端 | 与真实身份使用连接 |
| 编辑历史 | 图片编辑软件、云端 | 作业环境和终端可见 |
信息不只留在图片文件内部,也会留在生成所用的服务侧。
匿名性中,要分开考虑文件和服务历史。
提示词会成为线索
在生成式 AI 图片中,提示词是重要信息。
提示词中可能包含地点、人物形象、目的、政治主张、组织名、活动名、内部情况、预定发帖语境。在会暴露提示词的服务或共享页面中,提示词本身会成为关联材料。
| 提示词中包含的信息 | 可看出的事 |
|---|---|
| 地名和建筑名 | 活动地点或日常活动范围 |
| 组织名、学校名 | 所属或相关对象 |
| 人物特征 | 相关人员或作为模型的人 |
| 政治主张 | 活动内容或立场 |
| 内部情况 | 知情者范围被缩小 |
提示词是图片背后的文字。
即使以为只公开了图片,服务的共享功能或历史画面中也可能显示提示词。
公开前,要确认提示词是否会通过设置暴露到外部。
生成图片也有元数据
生成式 AI 图片也可能残留文件元数据。
例如创建软件、编辑软件、生成工具、日期时间、色彩配置文件、XMP 信息,以及某些情况下与 AI 生成相关的来源信息。
| 元数据 | 注意点 |
|---|---|
| 创建软件 | 可知道使用的工具和编辑环境 |
| 生成日期 | 与发帖时间或活动时间连接 |
| XMP 信息 | 可能残留编辑历史和管理信息 |
| 文件名 | 可能包含提示词、项目名、真实姓名 |
| 水印、来源信息 | 可能显示 AI 生成物或创建路径 |
ExifTool 是可用于确认图片文件元数据的代表性工具。它可以确认 、GPS、XMP 等广泛信息。
URL : https://exiftool.org/
不过,ExifTool 主要能确认的是文件侧信息。生成服务侧保留的历史、账号、支付信息、IP 地址无法由它确认。
也要确认图片内容
即使是生成式 AI 图片,内容本身也可能成为线索。
例如,类似现实地区的背景、让人联想到特定职场或学校的构图、活动团体的符号、与过去使用过的头像相似的画风等。
| 图片内容 | 对匿名性的影响 |
|---|---|
| 类似现实地点的背景 | 日常活动范围或活动地点被推测 |
| 特定团体的符号 | 所属或支持关系可见 |
| 类似过去头像的画风 | 与旧账号产生关联 |
| 模仿本人外貌的人物 | 从脸或氛围中被推测 |
| 显示内部情况的构图 | 成为只有有限知情者知道的信息 |
AI 图片即使是“虚构”的,也会显出创建者的关注点和活动范围。
匿名性中,不能只按图片是实拍还是生成来判断。
确认共享方式
共享生成式 AI 图片时,不只看文件,也要看共享方式。
生成服务的公开页面、云端共享、SNS 发帖、聊天发送,都会让对方看到不同信息。
| 共享方式 | 确认内容 |
|---|---|
| 生成服务共享 URL | 提示词、作者名、账号是否可见 |
| 云端共享 | 所有者名、共享范围、文件夹名是否可见 |
| SNS 发帖 | 是否与发帖账号、时间、过去发帖连接 |
| 聊天发送 | 发送者名、文件名、预览是否留下 |
| 图片文件附件 | 元数据和文件名是否留下 |
生成式 AI 图片最好先保存文件,再制作公开副本,这样更容易管理。
如果直接粘贴服务的共享 URL,必须确认对方会看到什么。
考虑生成服务的账号历史
生成式 AI 图片在文件外侧也有历史。
生成服务可能保留提示词、生成日期、创建图片、编辑历史、账号、支付、登录历史。即使下载文件并删除元数据,也不等于服务侧会删除这些信息。
| 服务侧信息 | 对匿名性的影响 |
|---|---|
| 提示词历史 | 关注点、活动内容、对象可见 |
| 生成日期 | 与发帖时间或作业时间连接 |
| 账号 | 与真实姓名邮箱或支付信息连接 |
| 共享历史 | 留下给谁看过、使用了哪个 URL |
| 编辑历史 | 可看到图片制作过程 |
匿名活动中使用生成式 AI 时,也要把生成服务账号纳入威胁模型。
用真实身份账号制作的图片,再用匿名账号使用,就会产生关联。
注意复用素材
生成式 AI 图片中,有时会使用手头照片或参考图片。
如果素材是过去账号用过的图片、真实身份云端中的图片、自宅或职场拍摄的图片,生成后的图片中也可能留下特征。
另外,把参考图片或未公开素材输入外部图片生成服务时,图片、提示词、使用时刻、账号信息、连接信息可能会交给该服务。高风险素材不仅要看生成后外观是否变化,还要先思考是否可以把输入交给这个对象。
| 使用素材 | 注意点 |
|---|---|
| 自己的照片 | 脸或氛围可能保留下来 |
| 自宅拍摄的图片 | 背景和日常活动范围特征可能反映进去 |
| 过去头像 | 与旧账号产生关联 |
| 职场资料 | 内部信息和可能混入 |
| 手写素材 | 笔迹和作风会成为线索 |
用生成式 AI 加工后,原信息未必就会消失。
输入素材也要作为公开物的一部分来考虑。 交给外部服务的素材,即使从公开图片中消失,也可能留在服务侧历史和日志中。
制作公开副本
生成式 AI 图片在公开前也要制作公开副本。
不要直接粘贴服务的共享页面,而是只保存需要的图片,并确认文件名、元数据、图片内容。必要时改变尺寸或格式,再确认是否残留多余信息。
这个步骤麻烦,但对匿名活动很重要。
把图片生成服务、云端、投稿服务三者分开,可以减少关联入口。
总结
生成式 AI 图片并不是因为不是实拍就安全。
文件元数据、生成工具、生成日期、提示词、服务历史、账号信息、共享 URL、文件名都会影响匿名性。
图片内容中也可能出现日常活动范围、关注点、活动团体、与过去账号的关联。
公开前,要确认文件侧元数据、生成服务侧共享设置、提示词的可见方式、图片内容、文件名。
生成式 AI 图片也和普通图片一样,必须分开确认“外观”“内部信息”“共享路径”。
相关工具
Google Lens
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://lens.google/
ExifTool
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://exiftool.org/
MAT2
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。