发布时间:2020-03-26 14:21 原文链接: 研究开发基于菌群大数据搜索的新疾病检测方法

基于菌群大数据搜索引擎实现疾病检测的原理

  微生物组具有服务疾病诊治与生态监控的巨大潜力,但是其影响因素错综复杂。如何通过菌群检测实现快速精准的疾病诊断呢?中科院青岛生物能源与过程研究所单细胞中心发明了基于菌群大数据搜索的疾病检测方法,为此共性问题提供了原创解决方案。该研究成果近日在线发表于《美国微生物学会会刊》。

  微生物组与人体、环境的健康有着千丝万缕的关联。同时,菌群检测具有非侵入性、可量化、可预警等优势。因此,如何用菌群来判断和识别人体或环境的健康状态,一直是精准医学和大健康领域的热点问题之一。但是,作为一种疾病诊断手段,菌群面临着三个关键挑战。

  首先是“漏诊”问题,现有的检测手段通常只针对特定疾病,并依赖于该疾病已知的标识微生物来构建检测模型。然而很多疾病尚无明确标识物,而且同一种疾病在不同人群中的生物标识物种经常不尽一致,因此难以普适性地判断待检样本是否健康。其次是“误诊”问题,同一种生物标识经常与多种疾病相关联,导致难以准确地分辨具体的疾病类型。第三,由于元基因组数据的极端高通量、高度异质性、多种测序平台共存等特点,菌群诊断模型的构建、训练和更新,均具有突出的挑战性。

  针对上述关键问题,青岛能源所副研究员苏晓泉带领的单细胞中心组群生物信息研究组,利用前期开发的微生物组搜索引擎MSE,发明了基于菌群大数据搜索的疾病检测新策略。与现有基于模型训练的机器学习手段相比,该方法不再依赖于疾病相关的特定标识微生物,而是利用待测菌群元基因组与已有菌群元基因组大数据的整体相似度来实现检测。

  首先,计算待测样本相对于数据库中所有健康样本的异常程度,即可评估其是否健康。其次,与数据库中的多种疾病的参照样本进行比对,即可识别具体的患病种类。基于超过3,000例肠道菌群样本的测试表明,针对炎症性肠病、结直肠癌、艾滋病毒感染和肠腹泻病等,MSE在回答“是否健康”和“哪种疾病”这两个问题上的准确率均超过80%,显著高于目前常用的机器学习算法,从而有效地降低了“漏诊”和“误诊”的可能。另一方面,与常规手段相比,该方法在跨研究、跨测试人群、跨测序平台、样品污染等因素影响下的适应性和抗干扰能力等方面,也具有显著优势。

  记者了解到,得益于其强大的高通量菌群结构搜索能力,MSE的使用与百度、谷歌一样简单,通常在0.5秒内即能完成诊断。同时,MSE能够通过其菌群大数据系统的实时更新,来提升检测的可靠性以及拓宽其适用范围。因此,随着微生物组测序数据的爆发式增长,该方法在实际应用中的便捷性、可延展性等特色将愈发突出。

  单细胞中心开发的MSE是目前国内外最大的微生物组数据科学研究体系之一,其参照数据库包括来自肠道、皮肤、口腔、室内环境、海洋、土壤等广袤生态系统的超过23万例高质量、标准化、可比较的元基因组样本。与本研究提出的诊断手段相结合,MSE为建立针对各种慢性疾病或生态灾害的菌群诊断系统和干预手段效能评价体系奠定了一个共性的方法学基础。

相关文章

中国新能源汽车大数据蓝皮书发布

2022年大数据蓝皮书正式发布新能源汽车国家大数据联盟供图11月13日,“中国新能源汽车大数据2022年产业峰会”在北京举行,该峰会由沈阳市人民政府和新能源汽车国家大数据联盟共同主办。会议期间,主办方......

中外科学家借助大数据揭示地球大气氧化过程

中新社武汉10月9日电(马芙蓉陈国雄)记者9日从中国地质大学(武汉)获悉,该校联合美国加州大学河滨分校、加拿大地调局等机构科研人员,利用深时地学大数据和机器学习技术,重建了高精度的地球大气氧化历史,据......

空间站与“卡脖子”,中国在警醒中争取“逆袭”

9月17日,神舟十四号航天员乘组实施第二次出舱活动,举世瞩目。中国航天员身后的“太空之家”里,拟南芥幼苗已长出多片叶子,高秆水稻幼苗、矮秆水稻也在奋力生长。自1987年中国首次将农作物种子送上天迄今的......

重磅!2022地球大数据支撑可持续发展目标报告发布

当地时间2022年9月20日,“全球发展倡议之友小组”部长级会议在纽约举行。会上,中方发布《地球大数据支撑可持续发展目标报告(2022)》。《报告》聚焦零饥饿、清洁饮水和卫生设施、经济适用的清洁能源、......

第五届新旧动能转换国家战略发展论坛在菏泽举办

   现场进行科技合作签约  山东省科协供图9月15日,由山东省科协、菏泽市人民政府、中国软件行业协会主办,菏泽市科协、山东省大数据研究会等承办的山东......

2022可持续发展大数据国际论坛北京举行

在全球首个大数据服务联合国2030年可持续发展议程的专业科技机构——可持续发展大数据国际研究中心(SDG中心,英文简称CBAS)成立一周年之际,2022年可持续发展大数据国际论坛9月6日至8日在北京举......

香山科学会议:大数据驱动中西医“相向而行”

“不用有创的组织活检,看了眼底就知道肾脏病变到了何种程度,而且还能判别血管硬化、肾小球病变的程度。”在短短一句话中,中国工程院院士、解放军总医院第一医学中心陈香美既道出了中医、西医可互补的优势,又呈现......

研究发现:扁桃体菌群具免疫调节作用

桃体大家并不陌生,它是重要的淋巴器官,因其产生的淋巴细胞和抗体,可以对付入侵的各种致病微生物,包括细菌、病毒、寄生虫等,发挥着抗细菌、抗病毒的防御功能,常常被称为是人体免疫系统的第一道大门。我科学家发......

我国算力总规模超过150EFlops排名全球第二!

日前从2022中国算力大会获悉:截至今年6月底,我国在用数据中心机架总规模超过590万标准机架,服务器规模约2000万台,算力总规模超过150EFlops(每秒15000京次浮点运算次数),排名全球第......

陈玉玲:全力投入,与实验室共成长

近十年来,大数据成了贵州对外展示的一张靓丽名片,为推动大数据产业发展,贵州筑巢引凤,吸引了一大批科技巨头。贵州一方面紧锣密鼓进行产业布局,另一方面坚持推动大数据与各行各业的深度融合,助力传统产业转型升......