什么是画像分析
即使匿名时没有写名字,对方也未必把你看成“完全不知道是谁的人”。
发帖内容、访问时间、使用的词、感兴趣的话题、图片、终端信息、过去账号。收集这些信息后,就能构成一个人物像。
这里把从片段信息推测人物属性、行为、兴趣、日常活动范围和关系的做法称为画像分析。
画像分析并不只是电影里那种特殊调查。
广告投放、访问解析、防止滥用、SNS 推荐、公开信息调查、以骚扰为目的的识别中,也会使用这种思路。
思考匿名性时,不只要看“是否写了名字”,还要看“会被构造成怎样的人物像”。
什么是画像分析
画像分析,是从多个线索推测人物像。
在匿名性语境中,即使不知道本人姓名,也可能推测性别、年龄层、地区、职业、生活节奏、兴趣、所属社区、与过去账号的连接。
| 线索 | 被推测的事 | 例 |
|---|---|---|
| 发帖内容 | 职业、地区、经历 | 行业用语、通勤、学校活动 |
| 发帖时间 | 生活节奏 | 夜班、午休、上学时间 |
| 用词 | 年龄层、地区、社区 | 方言、专业术语、网络用语 |
| 图片 | 地点、随身物品、终端 | 招牌、制服、房间、通知 |
| 关注关系 | 兴趣、同伴、所属 | 特定团体或学校相关人员 |
| 过去 ID | 同一人特征 | 旧 SNS、游戏、论坛 |
画像分析可怕之处在于,单独看很弱的信息会被组合。
“医疗相关”“地方城市”“夜班”“特定考试”“过去网名”重叠后,候选范围会迅速变窄。
没有本名也会构成人物像
认为不写本名就是匿名,并不充分。
例如,在 SNS 上持续发布下面这样的内容。
工作日早上 7 点多回应车站拥挤。夜班后发帖很多。使用医疗或照护专业术语。熟悉当地天气和活动。使用与旧游戏 ID 相似的名字。
这个阶段没有出现本名。
即便如此,日常活动范围、工作方式、职业、年龄层、过去活动都会开始可见。
| 发出的信息 | 单独看时 | 组合后 |
|---|---|---|
| 夜班后 | 工作时间的一部分 | 职种和生活节奏被缩小 |
| 行业用语 | 熟悉的领域 | 职业和所属候选可见 |
| 地区话题 | 日常活动范围的一部分 | 与通勤范围和参加活动连接 |
| 类似旧 ID 的名字 | 命名习惯 | 连接到过去账号搜索 |
| 照片背景 | 地点的一部分 | 现实移动范围可见 |
匿名性被破坏,并不只是户籍上的姓名突然出现。
候选范围被缩小,也属于匿名性变弱的状态。
服务侧的画像分析
网站和应用会处理各种信息,以区分使用者。
IP 地址、、登录状态、User-Agent、终端信息、浏览历史、点击、停留时间、购买历史。这些会用于显示优化、广告投放、防止滥用、服务改善。
| 信息 | 用法 | 匿名性上的注意点 |
|---|---|---|
| Cookie | 识别同一浏览器再次访问 | 即使改变 IP,也被视为同一使用者 |
| 登录状态 | 把行为连接到账号 | 即使不写名字,历史也会残留 |
| IP 地址 | 查看连接来源网络 | 成为地区或线路线索 |
| 终端信息 | 显示调整和滥用检测 | 与其他信息合并后成为识别材料 |
| 行为历史 | 用于推荐和广告 | 兴趣和属性被推测 |
这里重要的是,服务侧画像分析并不只在“有恶意”时发生。
很多服务会把区分使用者作为普通功能。作为便利的代价,识别材料会增加。
谁会做画像分析
进行画像分析的对象不止一种。
广告公司、SNS 运营者、职场或学校相关人员、骚扰者、调查者、国家机构,能看到的信息和能力都不同。思考匿名性时,要分清对手是谁。
| 对象 | 可见信息 | 注意点 |
|---|---|---|
| Web 服务 | 登录状态、Cookie、浏览历史 | 服务内部行为会连接 |
| 广告、解析 | 终端信息、跨站行为 | 多个网站行为会连接 |
| 熟人、职场 | 发帖内容、时间、用词习惯 | 容易对内部情况产生反应 |
| 调查者 | 公开信息、搜索结果、图片 | 连接过去信息和当前发布 |
| 国家机构 | 法律权限、通信记录、服务照会 | 高风险时需要专业咨询 |
对手不同,对策也不同。
防熟人时,发帖内容和日常活动范围重要。想减少服务运营者识别时,Cookie、登录状态、终端信息重要。设想国家级对手时,已经超出只凭文章能判断的范围。
从公开信息进行画像分析
画像分析不只依赖服务内部日志。
仅用公开的发帖、个人资料、图片、搜索结果、过去账号,也能构成人物像。这接近 OSINT,也就是公开信息调查的领域。
| 公开信息 | 会被看的内容 | 注意点 |
|---|---|---|
| SNS 发帖 | 话题、时间、相关人员 | 长期积累会变强 |
| 个人资料 | 属性、链接、自我介绍 | 少量信息也会与其他内容连接 |
| 图片搜索 | 过去图片、脸、地点 | 复用图片容易追溯到过去账号 |
| 搜索结果 | 旧博客、论坛 | 被忘记的信息残留 |
| 外部链接 | 其他 SNS、表单、资料 | 与管理员信息和日志连接 |
创建匿名账号前,要确认候选用户名和已公开图片是否会与过去信息连接。
但是,不要把未公开的脸部照片、直接连接身份的图片、高风险资料上传到搜索服务或外部 AI 进行确认。已经运营时,也要意识到搜索日志和服务侧残留的信息,确认自己的账号名、发帖中的特征词、公开图片从外部如何可见。
削弱画像分析的思路
画像分析无法完全消除。
只要发布,就会发出某些信息。重要的是减少不必要信息,并避免多个线索指向同一方向。
| 对策 | 理由 | 具体例 |
|---|---|---|
| 缩小主题 | 减少生活信息混入 | 不在爱好账号写职场抱怨 |
| 模糊地区 | 不缩小日常活动范围 | 不写车站名和店名 |
| 错开时间 | 不显示现场参加 | 不在活动刚结束后发帖 |
| 确认图片 | 删除背景和通知 | 裁切截图 |
| 不复用 ID | 切断过去账号 | 创建新名字 |
| 分开登录 | 分开服务内识别 | 不混用实名环境和匿名环境 |
这并不只是为了伪装自己。
在咨询、内部举报、信源保护、活动安全确保中,这也是为了保护本人以外的相关人员。
总结
画像分析,是从多个信息推测人物像。
即使不写本名,发帖内容、时间、用词、图片、Cookie、登录状态、过去账号组合后,也会看到日常活动范围、职业、相关人员。
在匿名性中,不只要看名字,也要思考“自己会被看成怎样的人物”。
画像分析无法完全消除。
但是,通过分开主题、模糊地区、错开时间、确认图片、不复用 ID、不混用实名环境和匿名环境,可以降低候选范围被缩小的速度。
匿名性不是把信息变成零。
它是为了不让对方构成过于清晰的人物像而进行的判断。
相关工具
OSINT Framework
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。