发布时间:2013-12-04 11:59 原文链接: 解读美材料基因组计划:数据共享乃大势所趋

  MGI于2011年6月启动,旨在将应用于能源、交通和安全等领域的先进材料的开发时间和资金成本减半。

  美国的材料基因组计划(MGI)启动至今已有两年,5位专家日前在《自然》杂志撰文,指出材料科学家应该如何在该计划中实施工作。

  Sally Tinkle:借鉴其他项目

  华盛顿科技政策研究所政策分析师

  MGI由总统巴拉克·奥巴马于2011年6月启动,旨在将应用于能源、交通和安全等领域的先进材料的开发时间和资金成本减半。两年过去了,数亿美元已经投入到了学术、产业和联邦机构的项目中。

  数据共享与计算工具开发对MGI的成功至关重要。先进材料复杂的物理与化学特性可以因不同的应用需要而相应调整,并可以在合成、生产和使用过程中改变。对这些特性的跟踪是一项非常艰巨的任务,MGI的努力还包括将术语、数据归档格式和指南报告标准化。

  幸运的是,MGI可以从现有的纳米技术协作项目中得到借鉴。美国国家纳米技术项目(NNI)在10年前建立,它针对1~100纳米范围内的材料,是MGI的合作项目,MGI的材料范围是纳米到微米级。

  MGI可能会考虑加入NNI的纳米技术知识基础设施计划,该计划于2012年5月启动,旨在开发一个数字数据和信息框架,并加强科学和建模团体之间的协作。该计划已仿照美国宇航局的技术准备标准,定义了一组数据准备标准,力图提供传达材料数据的质量与成熟度的基础。

  MGI还可以加入NNI和欧洲委员会的合作关系,以支持关于数据共享具体细节的大西洋两岸对话。

  数据共享是一种固有的协作活动,有着更快速推进材料科学发展的潜力。MGI可以使现有的项目更具活力,并成为共享所有尺度的材料信息的平台。

  David L. McDowell:激励分享

  亚特兰大佐治亚理工学院材料研究所执行董事

  MGI必须避免这样的态度,即“项目建成,所有目标就会实现”。对于合作和分享其数据与技术的科学家和工程师来说,激励措施非常必要。MGI必须要有一些东西,可以使每一个人受益。

  数据共享的环境必须吸引和促进合作。利益相关者在检索现有数据之外还有着广泛的利益——他们想要发现新材料,并期待得到改善的产品。直观健康的网络环境,以及分散和有机的网络基础设施发展要比集中式的网络环境更能激励不同用户作出贡献。

  社交网络策略可以使有着不同技能的用户追求共同的利益。双赢的方式应该被鼓励。例如,上传实验数据集可以换取建模工具,这会推动进一步建模。不过,需要规定明确的协议,以管理数据使用伦理等。

  对于MGI基础设施的投资者来说,信息使用最大化有着最主要的吸引力。例如,从国家的同步加速器和中子衍射设施中得到的实验数据集,应该在最大程度上得到存档和使用,以供搜索与引用,大型超级计算机模拟器得到的数据也应如此。

  开放获取的规则是可取的,可以遵循美国国家科学基金会所赞助的关于纳米级建模与仿真工具的nanoHUB项目,以及LAMMPS分子动态代码和DREAM.3D软件的范例。

  Amanda Barnard:拥抱不确定性

  澳大利亚联邦科学与工业研究所所长

  MGI正在形成协同工作的风格,这提高了技术与个人所面临的挑战。材料科学家必须更加适应不确定性。他们必须放弃控制欲,相信他们的同事,抗拒那种“让所有事情都确定”的冲动。

  从现有数据中得到新的科学成果需要集中资源。一些见解和突破只能通过特定的方式达到,其他方式无法完成。电子显微镜可以发现亚原子表面的特性,而光学显微镜可以显示光如何从亚原子表面上被反射。

  结合不同来源的成果十分困难。错误通常来自实验或计算技术本身的特性。许多实验人员都了解当实验结果随着实验室条件的变化而变化时有多沮丧,甚至连那些基于理论的计算方法都可能会得到不同的答案。

  与单纯将源于纯数据集的测量或统计错误进行综合相比,将不同来源的数据混合通常会带来更多的不确定性。若想从数据共享中受益,我们必须学会适应这种情况。

  MGI使用者必须要适应的另一种不确定性是人为因素,即我们对创造原始数据的人们及其能力的看法。科学家应该习惯客观的怀疑。为了快速推进材料研究,我们需要假设每个贡献者都非常有能力,并让数据本身来说话。

  只有当我们能够像给予MGI数据那样轻松并且自信地从MGI获得数据时,MGI的价值才能得以体现。

  Francois Gygi:使模拟可再生

  加州大学戴维斯分校计算机科学教授

  MGI所得到的最快速的回报应该来自于对材料结构模拟的共享。

  数值模拟并不像其理论和计算机基础所显示的那样可靠和可再生。由于近似值以及使用参数数量的复杂性,它们经常会给出不同的结果。

  克服这些困难对于设计新材料来说是必不可少的。例如,来自对一种材料晶格缺陷形成模拟的预测,可以改善我们优化材料强度或者电子特性的能力。

  数据只有在得到独立证实,并由不同的研究团队成功复制的情况下才是可靠的。自由地共享数据将使这种交叉验证成为可能。

  在传播模拟数据时,研究人员必须谨记两点。首先,模拟软件应该可以公开访问,而不只是数据。软件供应商不能禁止原始数据或性能数据的。第二,通用数据格式和集中的数据库并不总是必要的。材料研发团队可以采用现有的框架来共享数据。

  在适度的投资下,研究人员可以在自己的服务器上发布数据,其他人也可以访问这些数据。通过鼓励特定领域网络工具的开发,我们将会减少数据交互检验和验证的障碍。

  Peter B. Littlewood:发掘多样性

  伊利诺伊州阿贡国家实验室物理科学与工程实验室助理主任

  从同步加速器到电子扫描显微镜,纳米技术工具在信息革命中得到了磨炼。如今,在MGI中,我们需要通过扩大视野并纳入多种多样的材料来推进分子制造。

  这一过程存在基本的障碍。尽管MGI的名字听起来雄心勃勃,但实际上,原子并不同于基因。生物基因组既是一种理论,又是一种执行算法。在材料科学中,量子力学可以使从编码到功能的完美翻译毁于一旦。

  这种理论僵局仅仅反映了材料的多样性。组成或者结构上的微小变化可以产生全新的功能。

  不过化学是系统性的。自从门捷列夫制定元素周期表以来,我们接触了材料结构和功能的不同形式,现在可以借助强大的计算机和高通量实验进行筛选。我们正在建造一个与材料种类、特性和功能相吻合的工具包。MGI将会扩大其范围。


相关文章

工业大麻产量基因首次被发现

记者6月22日从中国农业科学院麻类研究所获悉,该所联合国内外多家单位,研究发现第一个工业大麻产量基因,标志着大麻分子育种领域的重大突破。据介绍,该研究为提高工业大麻花叶及籽粒产量奠定了理论基础,也为培......

【CGCT2024】青藜论坛全议程揭晓,开启CGT九大主题交流!

2024年第四届基因与细胞治疗青藜风云论坛(CGCT2024),由中国研究型医院学会医工转化与健康产业融合专业委员会、博腾生物、佰傲谷BioValley联合主办,将于2024年7月5-6日在上海召开。......

新工具可轻松搜索世界已知10%的基因

一种功能类似于谷歌搜索的计算工具已经证明了它的前景——可以廉价且容易地搜索生物序列数据。开发该工具的瑞士团队表示,在一项原理验证研究中,他们利用该工具成功索引了10%世界已知DNA、RNA和蛋白质序列......

古麦今用现代小麦找回丢失的遗传基因

记者18日从中国农业科学院深圳农业基因组研究所获悉,6月17日23时,《自然》刊登了该所(岭南现代农业科学与技术广东省实验室深圳分中心)研究员程时锋团队联合英国约翰·英纳斯中心等国内外多家优势单位完成......

全球首款基因编辑疗法公布长期数据

·Casgevy是一款自体细胞疗法,它利用CRISPR/Cas9基因编辑系统,在体外对来自患者的造血干细胞进行编辑,使血红细胞生产高水平的胎儿血红蛋白——一种健康的、携带氧气的血红蛋白。当地时间202......

《自然》最新:古基因组研究揭示玛雅人祭祀仪式细节

中新网北京6月13日电(记者孙自法)国际著名学术期刊《自然》最新发表一篇考古学论文称,一项研究通过对古代个体的DNA分析,发现了玛雅古城奇琴伊察埋葬祭祀仪式的更多细节。研究结果还展示了玛雅地区延续至今......

智力障碍相关非编码基因突变发现

科技日报北京6月6日电 (记者张梦然)新一期《自然·医学》发表的一项大规模遗传学研究结果显示,相比目前已知的其他任何非性别相关基因,RNU4-2基因的罕见突变,可能是更多临床诊断智力障碍病例......

深圳先进院实现医学数据在生物DNA分子中存储

5月29日,中国科学院深圳先进技术研究院研究员姜青山、高级工程师黄小罗、中国农业科学院深圳农业基因组研究所戴俊彪研究员等联合在SmallMethods发表最新研究成果。研究人员设计了一种名为"......

中国科学家首次捕获全新长寿基因!

线粒体与衰老息息相关,近年来,通过优化线粒体功能“延年益寿”的研究十分热门。然而,浙江大学联合中国科学院分子植物科学卓越创新中心的科研团队却另辟蹊径,他们在昆虫核基因组中发现了与线粒体协同演化的基因,......

华大智造2023年财报发布:核心测序业务稳步增30.31%

华大智造近日公布了其2023年的财务报告,2023年的营业收入达到了29.11亿元,较2022年的42.31亿元降低了31.19%。营业总成本33.31亿元,其中研发投入9.1亿元,占总收入的31.2......