Learn

284 篇文章分类:全部
基础

什么是画像分析

即使匿名时没有写名字,对方也未必把你看成“完全不知道是谁的人”。

发帖内容、访问时间、使用的词、感兴趣的话题、图片、终端信息、过去账号。收集这些信息后,就能构成一个人物像。

这里把从片段信息推测人物属性、行为、兴趣、日常活动范围和关系的做法称为画像分析。

画像分析并不只是电影里那种特殊调查。

广告投放、访问解析、防止滥用、SNS 推荐、公开信息调查、以骚扰为目的的识别中,也会使用这种思路。

思考匿名性时,不只要看“是否写了名字”,还要看“会被构造成怎样的人物像”。

什么是画像分析

画像分析,是从多个线索推测人物像。

在匿名性语境中,即使不知道本人姓名,也可能推测性别、年龄层、地区、职业、生活节奏、兴趣、所属社区、与过去账号的连接。

线索被推测的事
发帖内容职业、地区、经历行业用语、通勤、学校活动
发帖时间生活节奏夜班、午休、上学时间
用词年龄层、地区、社区方言、专业术语、网络用语
图片地点、随身物品、终端招牌、制服、房间、通知
关注关系兴趣、同伴、所属特定团体或学校相关人员
过去 ID同一人特征旧 SNS、游戏、论坛

画像分析可怕之处在于,单独看很弱的信息会被组合。

“医疗相关”“地方城市”“夜班”“特定考试”“过去网名”重叠后,候选范围会迅速变窄。

没有本名也会构成人物像

认为不写本名就是匿名,并不充分。

例如,在 SNS 上持续发布下面这样的内容。

工作日早上 7 点多回应车站拥挤。夜班后发帖很多。使用医疗或照护专业术语。熟悉当地天气和活动。使用与旧游戏 ID 相似的名字。

这个阶段没有出现本名。

即便如此,日常活动范围、工作方式、职业、年龄层、过去活动都会开始可见。

发出的信息单独看时组合后
夜班后工作时间的一部分职种和生活节奏被缩小
行业用语熟悉的领域职业和所属候选可见
地区话题日常活动范围的一部分与通勤范围和参加活动连接
类似旧 ID 的名字命名习惯连接到过去账号搜索
照片背景地点的一部分现实移动范围可见

匿名性被破坏,并不只是户籍上的姓名突然出现。

候选范围被缩小,也属于匿名性变弱的状态。

服务侧的画像分析

网站和应用会处理各种信息,以区分使用者。

IP 地址、、登录状态、User-Agent、终端信息、浏览历史、点击、停留时间、购买历史。这些会用于显示优化、广告投放、防止滥用、服务改善。

信息用法匿名性上的注意点
Cookie识别同一浏览器再次访问即使改变 IP,也被视为同一使用者
登录状态把行为连接到账号即使不写名字,历史也会残留
IP 地址查看连接来源网络成为地区或线路线索
终端信息显示调整和滥用检测与其他信息合并后成为识别材料
行为历史用于推荐和广告兴趣和属性被推测

这里重要的是,服务侧画像分析并不只在“有恶意”时发生。

很多服务会把区分使用者作为普通功能。作为便利的代价,识别材料会增加。

谁会做画像分析

进行画像分析的对象不止一种。

广告公司、SNS 运营者、职场或学校相关人员、骚扰者、调查者、国家机构,能看到的信息和能力都不同。思考匿名性时,要分清对手是谁。

对象可见信息注意点
Web 服务登录状态、Cookie、浏览历史服务内部行为会连接
广告、解析终端信息、跨站行为多个网站行为会连接
熟人、职场发帖内容、时间、用词习惯容易对内部情况产生反应
调查者公开信息、搜索结果、图片连接过去信息和当前发布
国家机构法律权限、通信记录、服务照会高风险时需要专业咨询

对手不同,对策也不同。

防熟人时,发帖内容和日常活动范围重要。想减少服务运营者识别时,Cookie、登录状态、终端信息重要。设想国家级对手时,已经超出只凭文章能判断的范围。

从公开信息进行画像分析

画像分析不只依赖服务内部日志。

仅用公开的发帖、个人资料、图片、搜索结果、过去账号,也能构成人物像。这接近 OSINT,也就是公开信息调查的领域。

公开信息会被看的内容注意点
SNS 发帖话题、时间、相关人员长期积累会变强
个人资料属性、链接、自我介绍少量信息也会与其他内容连接
图片搜索过去图片、脸、地点复用图片容易追溯到过去账号
搜索结果旧博客、论坛被忘记的信息残留
外部链接其他 SNS、表单、资料与管理员信息和日志连接

创建匿名账号前,要确认候选用户名和已公开图片是否会与过去信息连接。

但是,不要把未公开的脸部照片、直接连接身份的图片、高风险资料上传到搜索服务或外部 AI 进行确认。已经运营时,也要意识到搜索日志和服务侧残留的信息,确认自己的账号名、发帖中的特征词、公开图片从外部如何可见。

削弱画像分析的思路

画像分析无法完全消除。

只要发布,就会发出某些信息。重要的是减少不必要信息,并避免多个线索指向同一方向。

对策理由具体例
缩小主题减少生活信息混入不在爱好账号写职场抱怨
模糊地区不缩小日常活动范围不写车站名和店名
错开时间不显示现场参加不在活动刚结束后发帖
确认图片删除背景和通知裁切截图
不复用 ID切断过去账号创建新名字
分开登录分开服务内识别不混用实名环境和匿名环境

这并不只是为了伪装自己。

在咨询、内部举报、信源保护、活动安全确保中,这也是为了保护本人以外的相关人员。

总结

画像分析,是从多个信息推测人物像。

即使不写本名,发帖内容、时间、用词、图片、Cookie、登录状态、过去账号组合后,也会看到日常活动范围、职业、相关人员。

在匿名性中,不只要看名字,也要思考“自己会被看成怎样的人物”。

画像分析无法完全消除。

但是,通过分开主题、模糊地区、错开时间、确认图片、不复用 ID、不混用实名环境和匿名环境,可以降低候选范围被缩小的速度。

匿名性不是把信息变成零。

它是为了不让对方构成过于清晰的人物像而进行的判断。

相关工具

OSINT directory

OSINT Framework

与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。

列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。

URL : https://osintframework.com/

打开外部网站

相关文章