Learn

284 篇文章分类:全部
元数据

生成式 AI 图片中残留的信息

有人会认为,用生成式 AI 制作的图片不是现实相机拍摄的,所以安全。

但这种理解过于简单。

生成式 AI 图片也可能涉及创建工具、生成日期、编辑软件、提示词片段、与账号信息连接的文件名、服务侧历史、云端共享信息。

另外,即使图片本身没有拍到个人信息,也可能从提示词、公开文字、生成历史、复用素材中推测出创建者或活动内容。

如果考虑匿名性,生成式 AI 图片也要像普通图片一样确认。

本文整理生成式 AI 图片中残留的信息,以及公开前应查看的点。

生成式 AI 图片中也会留下信息

生成式 AI 图片不一定包含相机 GPS 信息。

但是,这并不意味着不会留下任何信息。图片文件中可能包含元数据,服务侧也可能留下生成历史、提示词、账号、IP 地址、支付信息、使用时刻。

信息残留位置对匿名性的影响
生成日期文件、服务历史与发帖时间或作业时间连接
生成工具名元数据、水印、文件名可知道使用服务或作业环境
提示词服务历史、共享页面关注点、目的、对象可见
账号信息生成服务、云端与真实身份使用连接
编辑历史图片编辑软件、云端作业环境和终端可见

信息不只留在图片文件内部,也会留在生成所用的服务侧。

匿名性中,要分开考虑文件和服务历史。

提示词会成为线索

在生成式 AI 图片中,提示词是重要信息。

提示词中可能包含地点、人物形象、目的、政治主张、组织名、活动名、内部情况、预定发帖语境。在会暴露提示词的服务或共享页面中,提示词本身会成为关联材料。

提示词中包含的信息可看出的事
地名和建筑名活动地点或日常活动范围
组织名、学校名所属或相关对象
人物特征相关人员或作为模型的人
政治主张活动内容或立场
内部情况知情者范围被缩小

提示词是图片背后的文字。

即使以为只公开了图片,服务的共享功能或历史画面中也可能显示提示词。

公开前,要确认提示词是否会通过设置暴露到外部。

生成图片也有元数据

生成式 AI 图片也可能残留文件元数据。

例如创建软件、编辑软件、生成工具、日期时间、色彩配置文件、XMP 信息,以及某些情况下与 AI 生成相关的来源信息。

元数据注意点
创建软件可知道使用的工具和编辑环境
生成日期与发帖时间或活动时间连接
XMP 信息可能残留编辑历史和管理信息
文件名可能包含提示词、项目名、真实姓名
水印、来源信息可能显示 AI 生成物或创建路径

ExifTool 是可用于确认图片文件元数据的代表性工具。它可以确认 、GPS、XMP 等广泛信息。

URL : https://exiftool.org/

不过,ExifTool 主要能确认的是文件侧信息。生成服务侧保留的历史、账号、支付信息、IP 地址无法由它确认。

也要确认图片内容

即使是生成式 AI 图片,内容本身也可能成为线索。

例如,类似现实地区的背景、让人联想到特定职场或学校的构图、活动团体的符号、与过去使用过的头像相似的画风等。

图片内容对匿名性的影响
类似现实地点的背景日常活动范围或活动地点被推测
特定团体的符号所属或支持关系可见
类似过去头像的画风与旧账号产生关联
模仿本人外貌的人物从脸或氛围中被推测
显示内部情况的构图成为只有有限知情者知道的信息

AI 图片即使是“虚构”的,也会显出创建者的关注点和活动范围。

匿名性中,不能只按图片是实拍还是生成来判断。

确认共享方式

共享生成式 AI 图片时,不只看文件,也要看共享方式。

生成服务的公开页面、云端共享、SNS 发帖、聊天发送,都会让对方看到不同信息。

共享方式确认内容
生成服务共享 URL提示词、作者名、账号是否可见
云端共享所有者名、共享范围、文件夹名是否可见
SNS 发帖是否与发帖账号、时间、过去发帖连接
聊天发送发送者名、文件名、预览是否留下
图片文件附件元数据和文件名是否留下

生成式 AI 图片最好先保存文件,再制作公开副本,这样更容易管理。

如果直接粘贴服务的共享 URL,必须确认对方会看到什么。

考虑生成服务的账号历史

生成式 AI 图片在文件外侧也有历史。

生成服务可能保留提示词、生成日期、创建图片、编辑历史、账号、支付、登录历史。即使下载文件并删除元数据,也不等于服务侧会删除这些信息。

服务侧信息对匿名性的影响
提示词历史关注点、活动内容、对象可见
生成日期与发帖时间或作业时间连接
账号与真实姓名邮箱或支付信息连接
共享历史留下给谁看过、使用了哪个 URL
编辑历史可看到图片制作过程

匿名活动中使用生成式 AI 时,也要把生成服务账号纳入威胁模型。

用真实身份账号制作的图片,再用匿名账号使用,就会产生关联。

注意复用素材

生成式 AI 图片中,有时会使用手头照片或参考图片。

如果素材是过去账号用过的图片、真实身份云端中的图片、自宅或职场拍摄的图片,生成后的图片中也可能留下特征。

另外,把参考图片或未公开素材输入外部图片生成服务时,图片、提示词、使用时刻、账号信息、连接信息可能会交给该服务。高风险素材不仅要看生成后外观是否变化,还要先思考是否可以把输入交给这个对象。

使用素材注意点
自己的照片脸或氛围可能保留下来
自宅拍摄的图片背景和日常活动范围特征可能反映进去
过去头像与旧账号产生关联
职场资料内部信息和可能混入
手写素材笔迹和作风会成为线索

用生成式 AI 加工后,原信息未必就会消失。

输入素材也要作为公开物的一部分来考虑。 交给外部服务的素材,即使从公开图片中消失,也可能留在服务侧历史和日志中。

制作公开副本

生成式 AI 图片在公开前也要制作公开副本。

不要直接粘贴服务的共享页面,而是只保存需要的图片,并确认文件名、元数据、图片内容。必要时改变尺寸或格式,再确认是否残留多余信息。

这个步骤麻烦,但对匿名活动很重要。

把图片生成服务、云端、投稿服务三者分开,可以减少关联入口。

总结

生成式 AI 图片并不是因为不是实拍就安全。

文件元数据、生成工具、生成日期、提示词、服务历史、账号信息、共享 URL、文件名都会影响匿名性。

图片内容中也可能出现日常活动范围、关注点、活动团体、与过去账号的关联。

公开前,要确认文件侧元数据、生成服务侧共享设置、提示词的可见方式、图片内容、文件名。

生成式 AI 图片也和普通图片一样,必须分开确认“外观”“内部信息”“共享路径”。

相关工具

Reverse image search

Google Lens

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://lens.google/

打开外部网站
Metadata inspection

ExifTool

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://exiftool.org/

打开外部网站
Metadata removal

MAT2

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://0xacab.org/jvoisin/mat2

打开外部网站

相关文章