发布时间:2017-04-19 15:56 原文链接: 人工智能再次战胜人类!这次是在心脏病预测上

  上周五,《科学》杂志报道了英国诺丁汉大学流行病学家Stephen Weng博士团队发表在《PLOS ONE》上的重要研究成果,Weng博士团队将机器学习算法应用于电子病历的常规数据分析,发现与当前的心脏病预测方法相比,深度学习算法不仅可以更准确地预测心脏病发病风险,还可以降低假阳性患者数量(1)。人工智能再一次战胜人类。

  「这项研究的重要性再怎么强调都不过分」,没有参与这项研究的斯坦福大学血管外科医生Elsie Ross博士在接受《科学》杂志采访时表示,「我真的希望医生敞开胸怀拥抱人工智能,利用这个工具更好地帮助患者。」

  我相信大部分心血管医生对人工智能的期待与Ross博士一样。因为据世界卫生组织统计,在2012年,全球非传染病导致的死亡人数为3800万,其中心血管疾病(心脏病和中风等)为1750万人,占所有非传染疾病导致死亡病例的46.2%;而让人感到畏惧的癌症导致的死亡为820万,占所有非传染疾病导致死亡病例的21.7%(2)。心血管疾病的预防与治疗确实刻不容缓。

  实际上科学家也一直在努力寻找与心脑血管疾病相关的风险因子,以达到预防疾病的目的。例如美国心脏病学院与美国心脏病协会(American College of Cardiology/American Heart Association;ACC/AHA)等机构通过多年的研究,将高血压、胆固醇、年龄、吸烟和糖尿病等一系列因素列为与心血管疾病风险高相关的因素,并推出了ACC/AHA预测模型(3)。除此之外,还有其他组织机构推出的QRISK2、Framingham和Reynolds等预测模型。

  然而,在Weng博士看来,这些方法都不给力。因为所有标准的心血管病风险评估模型都有一个隐含的假设,即每个风险因子与心血管疾病之间的关系都是线性的(4),这些模型可能过度简化了它们之间的关系。

  相对于复杂的生命活动,这显然太简单了,无法揭示患者服用的药物,或其他疾病和生活方式因素对疾病的影响。甚至还有一些因素是反直觉的,很多人认为脂肪对身体有害,会增加健康人患心血管疾病的风险。但在一些情况下,它实际上是保护心脏的。「这些例外在人体内实实在在地发生,」Weng博士说。「计算科学给了我们探索那些复杂关系的机会。」

  为了探索利用机器学习预测心血管病发病风险的方法,Weng博士团队从Clinical Practice Research Datalink (CPRD)数据库筛选了378256名符合标准居民的10年(2005年1月1日起)电子病历,这些居民在2005年都是各方面指标正常的健康人。

  然后随机将这个庞大的数据库分成两份,其中295267(78%)个居民的电子病历,用来训练机器学习算法,剩下的82989个居民的10年电子病历用来验证算法的准确性。据Weng博士了解,这是全世界范围内,首次在如此大规模的群体中,使用机器学习预测人类患心血管疾病的风险。

  为了找到更合适的机器学习算法,Weng博士和其同事采用了4种机器学习算法,它们分别是:随机森林(random forest)、逻辑回归(logistic regression)、梯度提升(gradient boosting)和神经网络(neural networks)。将ACC/AHA模型作为对照。

  第一步工作是让4种机器学习算法在没有人类指示的情况下,通过分析295267的电子病历数据,各自「创造」一个预测模型。当研究人员将标准化的数据「喂」给这四种算法之后,它们很快找到了各自认为的与心血管病发生相关性较高的风险因子。

  在这一步,机器学习算法就显现出了它的优势。与ACC/AHA指南相比,年龄、性别和吸烟三项风险因素,也被四种机器学习算法列为首要风险因素。然而,现行的许多心血管疾病算法认为糖尿病是风险因子之一,四种机器学习模型要么不考虑这项因素,要么只认为糖化血红蛋白是风险因素。

  更有意思的是,这四种机器学习模型认为房颤、种族差异、慢性肾病、慢性阻塞性肺疾病和严重精神病等疾病,以及是否服用皮质类固醇,以及甘油三酯水平等生物标志物等是重要风险因素。但是这些在现存的模型里都是不存在的。

  这再一次表明,机器学习可以帮助研究人员发现一些潜在的风险因子,这些变量凭人力是很难发现的,但是机器学习可以从其他变量中推断出来(5)。那机器学习的这几套模型到底靠谱吗?

  第二步,Weng博士将四种机器学习算法自主建立的模型与ACC/AHA模型进行比较,让它们分别预测剩下的82989个居民哪些10年后会患心血管疾病(实际总发病人数为7404人,当然研究人员没有把这个信息告诉深度学习模型),哪些不会发病。它们的预测结果如下。

  不难看出,四种机器算法自主创建的模型要优于ACC/AHA模型。随机森林模型的敏感性比ACC/AHA高出2.6%,逻辑回归模型的敏感性比ACC/AHA高出4.4%,梯度提升机和神经网络模型的敏感性比ACC/AHA高出4.8%。从本研究的结果看来,最好的神经网络算法比传统模型多正确预测了355个居民的发病风险。这意味着,在更大的人群里,将有数以万计的人会因此而得救。

  然而,我们也不难发现,即使引入深度学习算法之后,还有30%以上的高风险居民没有被提前预测出来。这意味着深度学习算法还需要大幅改进。Weng希望在将来能将更多的生活因素和遗传因素纳入分析范围,进而提升其精确度。

  这件事情却未必那么容易。因为机器学习算法就像「黑箱」,你输入数据,它反馈结果,然而在这个黑箱之中到底发生了什么,目前研究人员是很难知道的,这使得科学家难以在算法上做调整。不过,科学家正在努力改进这一现状,争取实现数据处理过程的可视化(6)。

  相较于人工智能在常规电子病历上的应用而言,人工智能在影像学领域的科研和应用正可谓如日中天。尤其是2015年底,Google和Facebook先后公开自家的深度学习算法TensorFlow和Big Sur,带动了基于图像识别的深度学习算法在医疗领域的爆发式发展。

  基于图片识别的人工智能目前在皮肤癌、糖尿病视网膜病变和先天性白内障等疾病的辅助诊断上已经达到或超过专业医生的水准。今年年初FDA批准了全球首个深度学习影像临床应用平台Arterys Cardio DL,意味着深度学习技术正逐渐获得认可。

  目前国内同行也在积极布局人工智能在医疗领域的应用,例如致力于医疗影像的智能诊断和大数据分析的慧影医疗,在今年3月底联合七喜医疗发布了全球首款智能DR。

  而致力于在眼底、X-Ray和头颈癌MRI等各个科室影像的诊断与科研的肽积木,首创将深度网络应用于病灶识别标记及病程判断,可在13~15秒内完成一张病灶标记,远快于3~5分钟的行业标准,实际场景已超过医生准确率,在特定数据集准确度超过97%。从眼底照片的阅读与识别入手,肽积木在糖尿病视网膜病的等级识别方面已持平国际顶级医生。

  尽管国内处于辅助诊断阶段的人工智能平台,在准确度上也已经达到或超过医生的水平,但是在政策、技术、伦理,以及教育方面仍有不少问题需要突破。不过,2017年3月,人工智能首次被列入政府工作报告中。国家将加大在人工智能领域的投入,在未来的5-10年,这个产业或许会发生很大的变化。

相关文章

中年危机或从“发福”开始!

研究表明,与那些在中年保持苗条身材的人相比,在四五十岁时体重增加可能会使早逝的几率增加近三分之一。血压、胆固醇或血糖略高且体重略微超标的人,其较早死亡的几率会高出30%。专家称,这些“轻微的不健康特征......

利用激光光谱技术,通过皮肤诊断心脏病

俄罗斯科学家研发出世界上第一种无需侵入人体即可检测慢性心力衰竭的方法。研究人员称,通过激光照射皮肤进行诊断将成为现有侵入性方法的理想替代。相关研究发表在《生物光子学杂志》上。萨马拉国立科罗廖夫大学科研......

心脏病为什么会引起睡眠障碍?原因找到了

大约三分之一的心脏病患者存在睡眠问题。德国慕尼黑工业大学的一个研究小组在新一期《科学》杂志发表论文称,心脏病会影响松果体中睡眠荷尔蒙褪黑激素的产生。心脏和松果体两个器官之间的联系在于颈部的神经节。这项......

心脏病引起睡眠障碍原因找到

大约三分之一的心脏病患者存在睡眠问题。德国慕尼黑工业大学的一个研究小组在新一期《科学》杂志发表论文称,心脏病会影响松果体中睡眠荷尔蒙褪黑激素的产生。心脏和松果体两个器官之间的联系在于颈部的神经节。这项......

心脏病引起睡眠障碍原因找到

在小鼠的颈上神经节,控制心肌(粉色)的神经元与控制松果体(蓝色)的神经元非常接近。一项新的研究表明,神经节可以充当连接两个器官的“电气开关盒”。大约三分之一的心脏病患者存在睡眠问题。德国慕尼黑工业大学......

维生素D补充剂或可降低心脏病发作风险

近日,澳大利亚一项涉及21000多名60岁以上老年人的随机对照试验表明,维生素D补充剂可以降低患心血管疾病的风险。相关研究结果已发表在期刊《英国医学杂志》上。据《卫报》6月28日报道,这项研究由昆士兰......

中疾控分析16年国人饮食:3种食物不足是心脏病主因

心血管疾病是典型的生活方式病,健康的生活方式可以预防80%的心血管疾病。在几种生活方式中,饮食往往排在第一位。近日,中国疾病预防控制中心周脉耕、何宇纳等人发表一份16年国人饮食分析,3种食物摄入不足,......

科学家发现大脑机能在心脏病发作后的几年内会迅速下降

心脏病发作后的恢复往往集中在改变生活方式以支持和保护心血管健康。但是约翰霍普金斯大学医学院的研究人员敲响了另一个警钟,他们发现,与那些心脏健康的人相比,遭受过心脏病发作的人在随后的几年里经历了更快的大......

女性比男性更有可能在心脏病发作后出现死亡

根据2023年心力衰竭大会上的一项研究,与男性相比,女性在心脏病发作后死亡的可能性是男性的两倍以上。即使控制了其他健康因素和治疗时间,这种差异仍然存在,老年妇女的不良后果率甚至更高。这种差异的原因仍然......

机器学习算法现在可以快速与准确地诊断心脏病发作

心脏病发作的症状有时与非心脏相关的疾病相似,使诊断变得棘手。英国研究人员已经转向机器学习,为医生提供一种快速和准确的诊断心脏病发作的方法,这有可能缩短诊断所需的时间,并为患者提供更高效和有效的治疗。目......