数据经纪商的风险
互联网上有一些企业会收集、整理并提供与个人有关的信息。
一般称为数据经纪商。
它们处理的信息可能包括姓名、地址、电话号码、电子邮件地址、家庭构成、职业、购买倾向、兴趣爱好、公开个人资料等。
思考匿名性时,重要的是要知道,即使不是自己直接发布的信息,也可能在别的地方被整理。
什么是数据经纪商
数据经纪商是指收集、分析、出售或提供与个人、家庭、企业等有关信息的企业。
信息来源有很多种。
公开信息。 商业数据。 应用和 Web 上的行为数据。 名册。 不动产信息。 购买历史。 问卷。
不同国家和地区的制度与处理方式不同。 但是,个人信息在多个地方被收集并汇总的问题,在世界范围内都存在。
数据经纪商的问题,并不在于信息存在于某一个地方。 问题在于,原本位于不同地方的信息,会被汇总为同一个人或同一户家庭的信息。 当姓名、地址、电话号码、电子邮件地址、家庭、购买倾向、兴趣爱好、公开社交媒体、位置相关信息连接起来时,一个人的轮廓会变得相当清晰。
当然,并不是所有企业都持有同样的信息。 处理哪些信息,会因国家和地区、法律制度、企业、数据取得路径而变化。 即便如此,在思考匿名性时,也需要理解:“自己没有直接放出去的信息,也可能在外部被整理。”
与匿名性的关系
在匿名活动中,人们会希望减少与本人相连的信息。
但是,数据经纪商持有的信息可能让姓名、地址、电话号码、家人、过去地址、职业等被找到。
如果匿名账号的发帖中有日常活动范围或职业线索,就可能与外部个人信息连接起来,缩小候选范围。
| 信息 | 对匿名性的影响 |
|---|---|
| 地址或过去地址 | 与日常活动范围连接 |
| 电话号码 | 与账号注册和联系方式连接 |
| 电子邮件地址 | 成为多个服务中的识别符 |
| 家庭信息 | 经由家人推测本人 |
| 职业或工作单位 | 与发帖内容连接 |
| 购买和兴趣 | 成为行为模式的材料 |
数据经纪商的信息与发帖内容组合起来时,就会成为风险。
例如,假设一个匿名账号写了“我在这个地区育儿”“在特定行业工作”“有夜班”“经常使用这条线路”。 仅凭这些内容不会知道真实姓名。 但是,如果它们与外部存在的地址、家庭构成、职业、过去地址、电话号码信息重叠,候选范围就会缩小。
在匿名性中,不能只看发帖内容,也要思考它是否会与外部存在的个人信息连接。 数据经纪商的信息有时会像攻击者可使用的候选名单一样发挥作用。 匿名发帖则会成为进一步缩小候选范围的材料。
| 匿名发帖中的信息 | 外部数据中重叠的信息 | 会发生什么 |
|---|---|---|
| 日常活动范围 | 地址、过去地址、家人地址 | 候选地区被缩小 |
| 职业或行业 | 工作单位、职种、资格 | 本人候选更接近 |
| 家庭构成 | 家庭信息、同住人、亲属 | 从本人以外的人推测 |
| 电话或电子邮件痕迹 | 注册信息、泄露数据 | 多个服务连接起来 |
| 兴趣爱好 | 购买历史、广告分类 | 发帖内容与行为倾向重叠 |
也有不是自己放出的信息
数据经纪商的困难之处在于,信息并不限于自己直接公开过的内容。
家人或同住人的信息。 旧名册。 与不动产或法人有关的公开信息。 泄露数据。 过去的注册信息。
这些信息可能以其他形式留下。
在匿名性中,不能断言“我没有发帖,所以没问题”。
家人或同住人公开的信息,可能让自己的日常活动范围可见。 工作单位、学校、地方政府、活动主办方、团体的资料中,也可能登载自己的姓名。 过去的名册和 PDF、旧网页、招聘、登台发言、投稿信息也会成为线索。
另外,电话号码和电子邮件地址是容易在多个服务中重复使用的识别符。 如果在接近匿名活动的地方使用实名侧用过的联系方式,与外部信息连接的风险会上升。 在匿名用的活动中,需要把联系方式、支付、配送、认证、恢复手段都分开思考。
删除并不简单
从数据经纪商处删除信息的手续,会因国家和服务而不同。
有时可以提交删除申请。 有时需要身份验证。 有时只能删除一部分信息。 有时同样的信息会留在其他企业那里。
更现实的做法是,不要认为删除处理一次就会结束。
提交删除申请时也有注意点。 有时会为了身份验证而要求提供追加信息。 提交这些信息,可能会增加其他记录。 删除请求用的电子邮件地址、提交的身份验证信息、请求文中写的内容,都要慎重选择。
另外,即使某个企业删除了信息,同样的信息也可能留在其他企业那里。 如果信息来源相同,过一段时间后也可能重新登载。 因此,删除不是“一次性作业”,而要与定期确认结合起来。
要确认的事项
应对数据经纪商时,要确认以下几点。
- 用真实姓名搜索时,是否出现个人信息网站
- 是否能用电话号码或电子邮件地址搜索到
- 地址或过去地址是否被公开
- 是否会从家庭信息推测出本人
- 匿名发帖中是否有日常活动范围或职业线索
- 是否可以提交删除申请
确认个人信息暴露情况之后,再调整匿名发帖的内容。
确认时,不只看真实姓名,也要看电话号码、电子邮件地址、过去地址、家人姓名、旧姓、网名。 不过,调查这个行为本身也可能留下记录。 如果用实名侧浏览器、已登录的搜索服务、工作单位或学校网络调查,可能会增加其他日志。 与匿名活动有关的调查,要分开环境进行。
| 确认对象 | 查看理由 |
|---|---|
| 真实姓名 | 确认基本个人信息暴露 |
| 电话号码 | 查看与账号注册和联系方式的结合 |
| 电子邮件地址 | 确认多个服务中的重复使用 |
| 地址、过去地址 | 查看与日常活动范围的重叠 |
| 家人姓名 | 防止经由家人推测 |
| 职业、工作单位 | 确认与发帖内容的关联 |
以信息会留下为前提处理
在应对数据经纪商时,减少可以删除的信息很重要。 但是,只期待删除是危险的。
如果外部有信息留下,就要在匿名发帖侧避免与这些信息重叠。 不要详细写日常活动范围。 不要具体写家庭构成。 降低职业或行业的粒度。 不要使用实名侧的电子邮件地址或电话号码。 不要使用同一张个人资料图片或同一个网名。
匿名性由自己放出的信息和外部残留信息的组合决定。 需要把数据经纪商理解为放大这些外部信息的存在。
总结
数据经纪商是收集、整理并提供与个人有关信息的企业。
它们可能处理姓名、地址、电话号码、电子邮件地址、家庭信息、职业、兴趣爱好等。
在匿名性中,不只是自己直接发布的信息,外部整理过的个人信息也会成为风险。
删除并不简单。 因此,需要以外部信息可能留下为前提,慎重思考发帖内容、日常活动范围、职业、家庭信息的写法。
相关工具
Wayback Machine
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
URL : https://web.archive.org/
Google Search removal tools
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。
OSINT Framework
与本文相关的外部资源。只有在符合你的处境和威胁模型时再打开。
列在这里的原因: 它可能有助于理解本文主题,但位于 Anonymity Sense 之外,使用前应先自行确认。