大型基因组数据库对于科学家寻找同疾病相关的遗传变异来说是必不可少的。不过,对于贡献了DNA的人来说,这会带来隐私风险。一项2013年的研究显示,黑客能利用网络上公开可用的信息,从被匿名的基因组数据中辨别出人们的身份。
为解决这些担忧,一个由美国麻省理工学院计算机科学家Bonnie Berger和Sean Simmons研发的系统利用了被称为差分隐私的方法。它通过向用户查询结果中添加少量噪音或者随机变异,模糊捐赠者的身份。研究人员在最新一期的《细胞系统》杂志上发表了他们的成果。
该系统会计算研究人员想要的统计数值,比如一个遗传变异同某种特定疾病存在关联的几率,或者同一种疾病最相关的5个遗传变异。然后,它向结果中添加随机变异,并且返回本质上带有轻微错误的信息。比如,在对同某种疾病相关的前5个遗传变异的查询中,系统可能会产生前4个遗传变异以及第6个或第7个变异。
用户并不知道哪个查询结果更正确,但仍能利用这些信息。只是对于想弄清楚数据背后的患者信息的人来说,变得更加困难了而已。
当你在系统中加入一点点噪音,从很多方面来说,它同数据开始自带的噪音并没有太大的不同。田纳西州范德堡大学计算机专家Bradley Malin表示,在一定程度上,它仍然是可靠的。几十年来,美国人口普查局和劳工部一直通过这种方式向它们的数据中添加噪音。
只要数据库足够大含有来自几千或更多人的信息,同时研究人员保持在限制其能询问问题数量的隐私预算之内,利用此项技术的数据集中的个人隐私便不会受到侵害。用户将无法询问一个基因组中的几百个或上千个位置。
受该技术保护的数据库可被立即搜索到,而目前要获准调用由包括美国国立卫生研究院在内的各机构管理的数据库可能需要数月。
Simmons和Berger表示,即便带有噪音,在询问一些有针对性的问题时,该系统提供的答案仍然足够有用。它主要被用于获取通过其他途径可能无法接触到的数据集。Simmons介绍说。
比如,如果分析一个小型数据集的研究人员发现了同某种疾病存在关联的遗传变异,该系统能让他们利用规模大很多且通过其他方式无法获取到的数据集证实这一关联。它还能让研究人员预览某个数据集,从而在进行耗费时间的完整获取申请流程前判定其有用程度。
我认为,这是一项极其卓越的数学工作。哥伦比亚大学计算生物学家Yaniv Erlich表示,理论上讲,它很不错。不过,从实际的角度来说,我并不确定它会派上用场。
Erlich的一个担忧来自该系统的问题限制。在他看来,现在研究人员想要的是分析同某种疾病存在关联的前10个或100个遗传变异,而不是前5个。
与此同时,Erlich 表示,人们并不喜欢在其数据中加入噪音”,因为产生这些信息需要经过很多艰苦的工作。噪音问题还会对基于此类信息的临床决策产生令人不安的影响。
10月16日,记者从中信湘雅生殖与遗传专科医院获悉,该院研究员林戈、副研究员郑伟团队,联合山东大学、上海交通大学医学院等单位的科研团队开展合作攻关,系统揭示了卵子与早期胚胎质量问题导致女性反复“试管”......
瑞士苏黎世联邦理工学院科学家在最新一期《自然》杂志上发表论文称,他们开发出一款名为MetaGraph的DNA搜索引擎,能快速、高效地检索公共生物学数据库中的海量信息,为研究生命科学提供了强大的专业工具......
究竟是什么让人脑与众不同?美国加州大学圣迭戈分校研究团队发现了一个名为HAR123的小型DNA片段,这将是解开人类大脑独特性之谜的关键。相关研究成果发表于新一期《科学进展》杂志。最新研究表明,HAR1......
衰老对身体产生的可见影响有时与基因活动的无形变化有关。DNA甲基化的表观遗传过程会随着年龄增长而变得不再精确,造成基因表达的变化。而这种变化与随着年龄增长而出现的器官功能衰退和疾病易感性增加有关。如今......
有些人比同龄人更显年轻,而有些人看着更显老;有些人年逾九旬仍身心康健,而另一些人早在数十年前就饱受糖尿病、阿尔茨海默病或行动障碍的困扰;有些人能轻松应对严重摔伤或流感侵袭,而有些人一旦住院就再难康复。......
究竟是什么让人脑与众不同?美国加州大学圣迭戈分校研究团队发现了一个名为HAR123的小型DNA片段,这将是解开人类大脑独特性之谜的关键。相关研究成果发表于新一期《科学进展》杂志。最新研究表明,HAR1......
基因组编辑技术作为生命科学领域的一项重要突破,为基础研究和应用开发提供了技术支撑。以CRISPR及其衍生技术为代表的编辑系统通过可编程的向导RNA引导Cas9等核酸酶靶向基因组特定位点,被广泛应用于特......
近日,西北农林科技大学玉米生物学与遗传育种团队联合华中农业大学玉米团队在《植物生理学研究》发表论文。研究初步揭示了ZmGBF1-ZmATG8c模块通过自噬途径调控玉米耐热性的分子机制。随着全球气温持续......
神经元中基因编辑的插图。图片来源:杰克逊实验室哪怕在五年前,人们也会认为在活体大脑中进行DNA修复是科幻小说中才有的情节。但现在,科学家已能进入大脑、修复突变,并让细胞在整个生命周期中维持住这种修复效......
记者21日从国家乳业技术创新中心获悉,该中心技术研发团队成功研制出奶牛种用胚胎基因组遗传评估芯片和“高产、抗病、长生产期”功能强化基因组预测芯片。该系列基因芯片具有完全自主知识产权,填补了我国基因芯片......