发布时间:2019-05-23 16:19 原文链接: Benchmarker一种可靠的对GWAS数据进行挖掘的算法

  全基因组关联研究(GWAS)针对大量人群寻找有助于常见的多基因特征(如身高或肥胖)的基因。这些综合性研究经常发现大量微小的遗传变异,这些变异在高龄,肥胖等人群中更常发生。但这种相关性并不一定意味着因果关系的存在。

  虽然有许多计算算法可用于帮助提取GWAS结果,但很难知道选择哪一种。研究人员在《American Journal of Human Genetics》杂志上发表的文章称Benchmarker一种可靠的对GWAS数据进行挖掘的算法。

(图片来源:Www.pixabay.com)

  “我们有不同的优先级算法,但我们实际上并不知道如何确定哪一个是最好的,”该文章主要作者Rebecca Fine说 “我们不想依赖先前的'黄金标准'或引入除原始GWAS数据之外的任何其他内容。”

  借助“交叉验证”的机器学习概念,Benchmarker使调查人员能够将GWAS数据本身作为自己的控制。我们的想法是采用GWAS数据集并挑出一条染色体。然后,基准测试的算法使用来自剩余的21条染色体(除X和Y之外的所有染色体)的数据来预测单个染色体上的哪些基因最有可能对所研究的性状有贡献。由于依次对每个染色体重复该过程,因此汇集算法标记的基因。然后通过将这组优先基因与原始GWAS结果进行比较来验证该算法。

  “首先在GWAS上训练算法,并保留一条染色体,然后返回到该染色体,并询问这些基因是否与原始GWAS结果中的强p值相关联,”Fine解释说。 “虽然这些p值并不能代表确切的”正确答案“,但它们确实可以告诉我们一些真正的遗传关联。最终产品是对每种算法执行情况的评估。

  Fine,Hirschhorn及其同事通过应用得出的结论是,结合多种策略通常可以获得最佳结果。他们还发现了某些算法在寻找某些特征的基因时表现最佳的证据。

  “我们希望在GWAS之后开发更多算法来回答关键的下一个问题:哪些基因和变异与人类特征和疾病有因果关系,”Hirschhorn说。 “benchmarker可以作为一种无偏见的方法来确定用于回答这个问题的算法。”


相关文章

中国科学家研发晶圆级AI光谱仪,登《PNAS》封面

光的波长探测在科学研究和工业应用中具有重要作用,光学光谱仪是其中不可或缺的分析工具。如今,体积庞大的传统光谱仪已经无法满足日益发展的光谱检测技术需求,微型化成为光谱仪发展的必由之路,其在机器视觉、环境......

超快网络流算法问世,能实现最大流量的同时最大限度降低传输成本

瑞士苏黎世联邦理工学院的研究人员开发了一种超快算法,即网络流算法。该算法成功解决了在网络中实现最大流量的同时最大限度降低传输成本的问题。这种超快计算能力是研究高度复杂、数据丰富、动态且快速变化的网络(......

第三届琶洲算法大赛正式启动

4月23日,由广州市人民政府、中国人工智能学会联合主办的第三届琶洲算法大赛正式启动。记者获悉,本届大赛面向国内外开设5个赛区,并首次开启赛区晋级制度。大赛采取线上线下相结合的形式,经过报名、初赛、复赛......

利用深度学习对短文本产品名称分类的研究

一、研究背景在数字化浪潮的冲击下,基于产品质量安全监管的信息化基础,运用大数据、自然语言处理、机器学习等技术,让信息横向在不同区域间、纵向在各级市场监管部门流通,是一个有重要意义且需要我们在业务支撑工......

2023医疗大数据:从“生产要素”到“资产”,距离数据流通还有多远?

千禧年后的第二个十年,移动医疗、人工智能等前沿技术的发展唤起医疗数据的需求。作为算法、算力、数据三要素中最常见但又最难获取的要素,医疗数据彼时仍以碎片化、非标准化的形态分散于医院各个系统中。为了寻找智......

首个量子领域大模型上线了!

百度量子计算研究所所长段润尧介绍,该量子领域大模型是在百度文心一言的基础上,使用量子领域高质量数据进行更有针对性的训练和优化而成的。它能更好地理解量子知识,执行量子领域相关任务。据介绍,百度量子领域大......

研究新进展!牡丹花器官数量变异遗传调控网络

花器官作为有花植物的重要繁殖系统,是物种形成与多样化的关键。在人类对植物驯化栽培和育种过程中,花器官数量决定其产量、品质及育种成败。牡丹(Paeoniasuffruticosa)属于芍药科芍药属植物,......

机器学习算法现在可以快速与准确地诊断心脏病发作

心脏病发作的症状有时与非心脏相关的疾病相似,使诊断变得棘手。英国研究人员已经转向机器学习,为医生提供一种快速和准确的诊断心脏病发作的方法,这有可能缩短诊断所需的时间,并为患者提供更高效和有效的治疗。目......

乘势而上,生命科学算力与算法市场需求持续增长

北京,2023年5月5日——IDC于近日发布了《中国生命科学算力与算法解决方案市场分析》(IDC#CHC50191223,2023年4月),本报告主要围绕中国生命科学领域算力与算法的相关解决方案展开分......

解码大脑信号再现视觉图像

是否有可能仅根据大脑信号,就完全重建某人所看到的内容?瑞士洛桑联邦理工学院研究人员朝着这个方向迈出了重要的一步,他们引入了一种新算法构建的人工神经网络模型,能以令人印象深刻的准确度捕捉大脑动态。该研究......