即便你完全删除自己的社交账户,也不能保证隐私。如果你可以链接到其他用户,他们的活动也可以“曝光”你的信息。现在,计算机科学家已经证明,利用你的10个最亲密联系人的推特信息流,比用自己的信息流更能预测你未来的推文。

  没有参与这项研究的奥地利维也纳医科大学计算社会科学家David Garcia表示,从这种“二手”监控中判断一个人的性格“比看上去要容易得多”。

  这里,美国佛蒙特大学研究人员没有预测任何人的真实推文,而是利用一种名为信息熵的测量方法,估计了一个人未来将发布的推文的可预测性。更多的熵意味着更多的随机性和更少的重复。

  他们研究了927名用户的推特信息流,每个人都有50到500名关注者。在每个人的信息流中,他们计算出单词序列包含了多少熵。然后,他们把这个数字输入信息理论工具——范诺不等式,计算一个人的信息流能否准确预测其下一条推文的第一个单词。平均而言,准确率的上限是53%。但是预测每一个连续的单词就不那么准确了。

  接下来,研究人员计算了基于用户信息流,外加15个与其最接近的联系人的信息流的预测上限:准确率上升到60%。当他们从等式中删除用户信息流时,这个数字下降到57%。

  研究人员近日在《自然—人类行为》上发表报告称,这意味着利用用户联系人的信息流预测效果几乎和包括用户在内的信息流一样准确,甚至比单独观察用户信息流更好。仅仅利用10个联系人的信息流就超过了利用用户个人信息流的预测准确度。相比之下,根据陌生人的推文随机分类预测某人会写什么,准确率最高可达51%。

  “我们用信息论中一些非常有趣的数学知识展示了,如果有完美的机器学习方法,你能做得怎么样。”研究报告第一作者、佛蒙特大学数据科学家James Bagrow说。

  英国巴斯大学心理学家Joanne Hinds对此表示赞同。她说,这是一种独特的方法,超越了该领域现有的许多工作。

  Bagrow说,研究结果表明,原则上,人们可以粗略地预测那些甚至不在推特上的人会发什么样的推文。在现实中,这意味着找出一个人社交网络的朋友,然后找到这些朋友的动态。

  目前,许多应用程序都能访问联系人列表,有些甚至共享联系人列表。以脸书为例,它利用用户的联系人列表创建甚至不在互联网的人的“影子档案”。

  研究人员已经使用推文预测性格、抑郁和政治倾向。基于朋友推文可能也会得出同样的推论。

  不过,Bagrow表示,这项工作的一个实际局限性是把所有词汇都视为信息量均等,但有些人可能会比其他人更了解你。如果你的朋友发了很多关于同性恋权利的推特,或者只关注共和党政客,这可能会特别暴露出你的性取向或政治倾向。

  Garcia也发现交友网站上的联系人可以预测一个人的性取向和关系状态,而推特上的联系人可以预测一个人的位置。Hinds说:“我们仅仅触及了通过这种方式可以揭示的信息类型的表面。”

  Bagrow说:“就隐私而言,我担心的是,这些大平台获取数据的方式太多了,我认为人们没有意识到这一点的危险。”而且,人们可能没有考虑到的另一件事是:“当他们放弃自己的数据时,他们也在放弃朋友的数据。”

相关文章

复旦大学突破性成果:几滴血结合AI可预测上百种疾病风险

采上几滴血就能诊断一个人会不会患病,如同科幻电影才会出现的场景,正在成为现实。近日央视报道,复旦大学科研团队研发出“人类健康与疾病蛋白质组图谱”这一突破性研究成果。通过AI算法的辅助,医生只需通过简单......

超快人工智能首次预测全球空气污染

日前,微软开发的人工智能模型可以在不到一分钟时间内准确预测全球空气污染,甚至还能快速预测全球10天内的天气。天气预报正受益于人工智能的蓬勃发展。图片来源:NESDIS/STAR/NOAA/Alamy该......

“阿尔法折叠3”来了

科技日报北京5月8日电 (记者张梦然)《自然》8日报道了结构生物学最新进展——阿尔法折叠3的问世。它能以高准确率预测蛋白质与其他生物分子相互作用的结构。这种用计算机解析蛋白质与其他分子复杂相......

心脏病预警!最新AI模型可提前十年预知心血管危机!

心血管疾病(CVD)是全球死亡的主要原因,每年造成超过1730万人死亡。预计到2030年,发病率将增至2360万人。由于疾病诊断前的临床前阶段较长,因此迫切需要有效的方法来早期识别高危人群。以往预测C......

大连化物所等发展出基于机器学习的苦味肽筛选新方法

近日,中国科学院大连化学物理研究所能源技术研究平台研究员靳艳团队与大连工业大学、内蒙古伊利实业集团有限公司合作,发展了一种基于机器学习的苦味肽筛选新方法。科研人员利用该方法在超高温处理(UltraHi......

一种神经影像特征可用于预测药物和食物渴求强度

施普林格·自然旗下专业学术期刊《自然-神经科学》最新发表的一篇论文报告了一种神经影像特征,可用于预测药物和食物渴求的强度。该论文介绍,对使用药物或进食的渴求,被认为是物质滥用或过度进食的驱动因素。药物......

治疗帕金森病新研究有助预测细胞替代疗法结果

中新网上海6月15日电(记者郑莹莹)帕金森病给患者带来极大痛苦,也给社会造成沉重负担。中国科学院脑科学与智能技术卓越创新中心的陈跃军研究组15日在TheJournalofClinicalInvesti......

我国今年灾害性风暴潮预计为6至8次

自然资源部国家海洋环境预报中心昨天(24日)发布了2022年海洋灾害预测结果。最新结果显示,今年我国沿海灾害性风暴潮发生次数预计为6至8次,灾害性海浪过程36至40次。国家海洋环境预报中心风暴潮预报室......

百度研究院2022年科技趋势预测发布

1月25日,百度研究院发布2022年科技趋势预测。作为深耕人工智能(AI)技术的科技实体,百度研究院发布的科技趋势中,AI“出镜”较多:今年上榜的科技趋势预测涵盖了AI核心技术、交叉学科与跨领域研究以......

《柳叶刀》重磅预测:今年3月底,新冠大流行或即将结束!

今天上线的Lancet有几篇Omicron的文章,其中最引人注目的莫过于给白宫做了两年疫情建模,对疫情病死率一直预测十分准确的美国健康指标与评估研究所(IHME)主任ChrisMurray的评论文章“......