一项新研究认为,人际互动数据或可长期用来识别匿名数据集中个体的身份。英国伦敦帝国理工学院的Yves-Alexandre de Montjoye和同事研究认为,处理这类数据的现行做法可能并不符合欧盟《通用数据保护条例》(GDPR)的匿名化标准。
为了开展服务或出于研究目的,短信应用、手机运营商、社交媒体平台和其他应用都会收集细粒度的互动数据。这些数据已被用来研究个体间的互动模式,预测流行病的空间传播,以及评估友情对政治动员的影响。根据当前的数据保护条例,这些数据无需征得用户同意就能分享和出售,但前提是数据必须匿名。
在1月26日发表于《自然—通讯》的一项研究中,Montjoye和Ana-Maria Cretu等发现,人们的互动数据能保持长期稳定,这或许能用来识别匿名数据集中个体的身份。
作者开发了一款基于深度学习的模型,他们训练这个模型根据个体的互动网络来识别他们的身份,并应用于一个在不同时期收集信息的逾4万人的数据集。该模型能基于个体的2级(2-hop)互动网络(与目标个体相隔1人的个体互动)识别出52%的人,基于个体的直接(1级)互动网络识别出15%的人。
由于这类互动网络能保持长期稳定,作者在20周后还能用个体的2级互动网络识别出24%的人。当作者将该模型用于一个587人的蓝牙近距离数据集时,该模型可以识别出超过26%的人。
这项研究结果表明,匿名化、非连接互动数据或具有长期可识别性,这可能对隐私保护条例的遵守具有启示意义。他们认为,接入控制和隐私增强系统这类安全措施或能防止这种个人身份被识别的情况发生。
相关论文信息:
https://www.nature.com/articles/s41467-021-27714-6
在一个繁忙的火车站,监控摄像头正全方位追踪站台的情况,乘客流量、轨道占用、卫生状况……所有信息实时传输给中央人工智能(AI)系统。这个系统的任务是帮助调度列车,让它们安全准点进站。然而,一旦有人恶意干......
为推动地方数据集团创新发展,服务全国一体化数据市场培育建设,7月23日,国家数据局组织召开座谈会。国家数据局党组书记、局长刘烈宏出席会议并讲话,局党组成员、副局长沈竹林、夏冰、余英出席会议。局党组成员......
7月21日,中国互联网络信息中心(CNNIC)在京发布第56次《中国互联网络发展状况统计报告》(以下简称《报告》)。《报告》显示,截至6月,我国网民规模达11.23亿人,互联网普及率达79.7%,越来......
随着人工智能(AI)、自动化等技术的持续突破,利用传感器进行数据采集与高速传输,并通过物联网存储海量数据,正持续推进智能化养殖业发展,逐渐成为推动猪育种向精准化、高效化、智能化转型的核心驱动力。从整个......
国家知识产权局办公室关于印发《知识产权数据使用手册及开放目录》的通知国知办函服字〔2025〕153号各省、自治区、直辖市和新疆生产建设兵团知识产权局,各地方有关中心:为促进知识产权数据开发利用,提高知......
2月23日,记者从海南医科大学获悉,该校热带医学院杨国静教授团队近日在国际医学期刊《英国医学杂志》在线发表论文《中国被忽视热带病负担估计的差异:真实世界数据与GBD2021的比较研究(2004—202......
人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满......
12月28日,由人民数据开发的“数融平台”正式上线试运营。平台整体依托区块链、人工智能和企业经营相关数据要素,实现链上信息全透明、全上链,实现数据资产情况全穿透,实时追踪一手风控数据,对潜......
随着新一轮科技革命和产业变革深入发展,数据作为关键生产要素的价值日益凸显。五部门:制定数据产业发展促进政策近日,国家数据局联合中央网信办、工业和信息化部、公安部、国务院国资委印发了《关于促进企业数据资......
2024年12月3日,自然科学基金委管理科学部、信息科学部在北京召开专项项目“数据市场制度设计与关键技术”评审会议。自然科学基金委党组成员、副主任江松院士出席会议并讲话。国家数据局政策与规划司副司长栾......