发布时间:2013-02-27 08:08 原文链接: 生物医学遭遇大数据复合型人才缺乏待解决

  目前获取海量数据变得越来越方便,但一家机构与另一家产生的资料有很多差别,把这些信息集中分析时就需要一个共同的标准。

  标准化虽然艰难,但与会的业内人士普遍认为,当务之急是解决生物医学和信息科学兼通的复合型人才缺乏困境。

  大数据时代正在深刻影响生物医学研究:海量数据需要在不同系统和机构间共享和分析,但因缺乏统一的标准而使研究者无从下手;信息技术和生物医学的结合更加紧密,两者兼通的复合型人才也明显缺乏。

  面对如潮水般涌来的海量数据,如何更好地利用,成为了信息技术和生物医学领域共同面对的挑战。

大数据时代来临

  2012年,美国政府发布了《大数据研究和发展倡议》,旨在利用大量复杂数据集合获取知识和提升洞见能力,投入金额高达2亿美元。

  所谓大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助决策更积极目的的资讯。

  2月18日至20日,由李嘉诚基金会出资举办的以“信息技术与未来医学”为主题的第二届“与大师同行”学术交流活动上,来自耶鲁大学、麻省理工学院与哈佛大学博劳德研究所、美国劳伦斯伯克利国家实验室、中国工程院等研究机构的国际知名学者,对大数据对生物医学的影响、大数据时代生物医学研究标准化困境和复合型人才缺乏难题进行了探讨。

  中国工程院院士韦钰对《中国科学报》记者表示:“生物医学正进入大数据时代,很多研究都是大数据研究、大数据存储,从大数据里面挖掘新信息。”

  她举例说,比如现在诊断某种疾病,医生可能需要调用患者的基因数据、从小到大的病历等大量数据。

  深圳华大基因研究院院长汪建近日曾表示,大数据与大科学是未来生物经济发展的核心点。“要解决当前生命科学的问题,需要从时空状态对生老病死进行解读,这就需要大数据。这种大数据揭示的就是大科学,从而衍生出大产业。”

  仅以深圳国家基因库为例,其中的样本量已达130万份,其中人类样本115万份,动植物、微生物等其他样本15万份。至2013年底,预计实现1000万份可溯源生物样本的存储,2015年底实现3000万份生物样本的存储。

  而这仅仅是不断膨胀的大数据的冰山一角。

标准化困境

  不同系统和科研机构之间难以实现标准化的数据共享和分析,这令很多科学家无所适从。

  美国特拉华大学生物信息学和计算机生物学中心主任吴慧华对《中国科学报》记者表示,上述问题是生物医学与信息科学结合过程中遇到的关键难题。目前获取海量数据变得越来越方便,但一家机构与另一家产生的资料有很多差别,把这些信息集中分析时就需要一个共同的标准。

  以对大数据需求最为迫切的医院为例。美国劳伦斯伯克利国家实验室基因组科学部主任鲁宾(Rubin)表示,理想状态下的目标是建立统一的电子病历系统,这些信息应该有统一的标准,但现实并非如此,各个医院存储的数据标准不同,而且不同系统存储的信息也不一样。

  据吴慧华观察,目前在美国等国家,不同机构和资料库产生和存储的数据都是遵从不同的标准,标准化问题在业内尚未达成共识。

  对于标准化之难,鲁宾对《中国科学报》记者解释道,数据量大并非关键,而是数据类型的多样性导致了难以统一标准。

  他说,比如基因测序,虽然数据量很大,但属于同一类型,就比较容易在同一标准下进行分析,而生物医学方面的数据就困难得多,涉及血压、心跳等多种不同类型的临床和数字化信息,有些数据之间难以关联,这便造成了标准化的挑战。目前各个国家已经开始重视这个问题,信息科学和生物医学的学者需要更加紧密的合作。

  在吴慧华看来,中国科学家应该积极加入国际标准的讨论、设计和制定中,更多参与国际上的生物医学信息共享。

复合型人才缺乏

  标准化虽然艰难,但与会的业内人士普遍认为,当务之急是解决生物医学和信息科学兼通的复合型人才缺乏困境。因为两者结合过程中的标准化及一系列问题的化解,需要研究者对两个领域都有很深的造诣。

  据与会专家介绍,目前鲜有高校主动设置生物医学和信息科学的交叉学科和院系,横跨这两个领域的复合型人才大多源自学者自发或在导师引导下的选修。

  耶鲁大学医学院干细胞研究中心主任林海帆对自己的一位学生印象深刻。这位学生曾经主动提出关注生物信息方面的研究,当年很多老师以为他不务正业。最后他选择了兼修信息科学,现在已经是生物医学和信息科学兼备的稀缺人才。

  “我发现有的学生虽然选择生物专业,但其实很有数学天分,我们研究所信息部的主任就是这样培养出来的。”林海帆对《中国科学报》记者表示。

  吴慧华也是这种复合型人才的典型。她同时具备生物学和计算机科学教育背景,曾获台湾大学理科学士学位、美国普渡大学植物病理学硕士和博士学位,得克萨斯大学泰勒分校第二硕士学位(计算机学)。

  为促进多学科研究和教育,她2009年在特拉华大学创立生物信息学与计算生物学中心(CBCB),由来自5个学院的60多名教师组成,并创立或负责多个生物信息学教育项目。

  麻省理工学院和哈佛大学博劳德研究所副主任、首席信息官梅西罗夫(Mesirov)向《中国科学报》记者介绍,美国政府正在推动计算机科学和生物学等交叉学科的教育,从国家级科学中心的层面促进高中阶段的学生就开始学习交叉学科的知识。

相关文章

烟台新增7家省级数据开放创新应用实验室

近日,山东省大数据局印发《关于公布山东省数据开放创新应用实验室名单(第三批)的通知》(鲁数字〔2023〕59号),烟台智慧城市大数据研究院、陆海空间(烟台)信息技术有限公司等7家企事业单位获批。截至目......

2023年大数据产业发展示范名单公示

根据《工业和信息化部办公厅关于组织开展2023年大数据产业发展示范申报工作的通知》(工信厅信发函〔2023〕187号),经企业自主申报、地方推荐、专家评审等环节,形成了2023年大数据产业发展示范名单......

财政部四川监管局:立足“三个一”构建财政运行分析“立体画像”

为全面提升财政治理能力,实现财政治理现代化。四川监管局统筹整合全省财政数据资源和全局各处室监管成果,充分运用大数据和信息化手段,自主研发财政运行分析评估系统,以“一张图”对全省监管单位实现财政运行分析......

沈阳自动化所与中国医科大学签署合作协议

12月11日,中国科学院沈阳自动化研究所与中国医科大学合作签约仪式在沈阳自动化所举行。沈阳自动化所副所长李硕与中国医科大学党委常委、副校长曲波分别代表双方签署协议。沈阳自动化所所长史泽林表示,前期双方......

科学家提出地理大数据实时呈现新方法

地理空间数据分析在生物多样性、移动通讯、网络监控、环境监测等领域应用广泛,如生物地理分析、即时通讯场景的位置共享、手机定位、卫星定位等。因此,大规模地理数据的快速呈现具有重要的理论意义和实际应用价值。......

重大突破!首款可见光波长飞秒光纤激光器研制成功

技术进步为生物医学应用等领域可靠、紧凑的超快激光器奠定了基础。研究人员最近开发出了第一款能够在电磁波谱可见光范围内产生飞秒脉冲的光纤激光器。这一进步为各种生物医学和材料加工应用带来了潜力。这些激光器的......

上海公共政策大数据联合实验室正式成立

日前,由上海市发展和改革委员会、上海推进科技创新中心建设办公室指导,上海市经济信息中心主办的上信智库全球科创指数暨大数据联合实验室发布活动在上海举行。在活动上,上海经济信息中心数据2.0平台(以下简称......

脑机接口“连接”产业新空间

科技感满满的假肢不是装饰,而是能握拳、抓取,甚至持笔写字、握拍打球;仅靠“意念”就能驱动机械臂拿取东西,甚至操作电脑输入信息;穿戴式的设备记录脑电波的波动,将大脑的运转情况以数值形式反馈……众多科幻电......

46位拿到“新基石”连续5年2500万不看项目只看人

2023年10月30日,腾讯公司“10年100亿元资助基础研究”的“新基石研究员项目”第二期名单发布,来自数学与物质科学、生物与医学科学领域的46位科学家上榜,成为第二批“新基石研究员”。2023年第......

单台近2千万!富集离子淌度高分辨质谱仪采购项目公开招标

近日,西湖实验室(生命科学和生物医学浙江省实验室)富集离子淌度高分辨质谱仪采购项目进行公开招标。预算金额1980万元,采购一台富集离子淌度高分辨质谱仪。具体如下:一、项目编号:WLL-HW-GK-WM......