发布时间:2015-01-06 16:36 原文链接: Science:无纸化实验室演进记

  纸质笔记本看起来似乎能够永久保存。毕竟,古登堡版圣经自15世纪就留存至今。

  但纸张不是完美的。真实事例摆在眼前:在澳大利亚一所大学,装订好的书籍在搬移中散开,保存了30年的笔记本变成了一堆散落的纸片。在美国,一名博士后梳理了数天,才从三孔活页夹中找到了审稿人需要的实验细节。而无纸化的正面例子是,一家瑞士合作生产组织实时在线地展示了客户样品的色谱反应,客户对此倍加赞赏。

  电子实验室工具已经优势十足,然而科学家还是不愿意采用。数字化最主要的障碍在于成本,改变工作习惯的动力以及让人望而生畏的可选种类。

  始于何处

  对于实验室信息化的初学者来说,LIMSwiki是绝佳的开始。实验室信息化研究所是LabLynx公司(基于浏览器的研究管理软件商)在2006年成立的商业机构,提供在线社区服务资源。LabLynx强调透明性,如定价,LIMSwiki可提供的价格都在最新的供应商描述中。“我们尽力保持中立,避免营销和自我推销。wiki是一个逐步发展的工具,我们也一直在找寻高质量的提供者。”LIMSwiki负责人Shawn Douglas表示。

  LIMSwiki对这些术语进行了定义,例如ELN(通常用于记录实验数据)和LIMS(传统上用于追踪标准化流程,如生产)。然而信息化产品间的区别是模糊的,罗氏公司优质生产规范与计算机系统验证协调员Markus Dathe说,因为“正在出现技术的结合”。ELNs、LIMS和设备软件在不断地扩展功能,互相联系、交错。信息化软件包持续地瞄准覆盖研发项目的全生命周期,包括试剂库存、监管形式、工作需求以及实验细节。然而,许多研究者从小规模起步,使用自我搭建的、带有实验步骤文本文档和电子数据文件的ELN。

  “从科学家到课题组长再到实验管理者,所有人都看到了ELNs的价值。”Accelrys公司软件研发部高级主管Erik Alsmyr说,该公司的ELNs(之前为Contur公司的iLabber)可以用于小型到中等规模的研究组。Alsmyr说大部分实验室起初都采用通用的组织和共享软件,如Evernote或SharePoint,之后他们会意识到需要更多的存储能力或知识产权保护。对于你的电子记录,电子系统提供7天24小时的全球权限,Alsmyr说,大多数商业化ELNs都符合电子记录的法规要求。例如,《美国联邦法规》第21篇第11部分,其中包括美国食品药品监督管理局的要求,以及面向欧洲市场的欧盟附录11条。

  然而,尤其是在大学,研究人员的接受速度仍然较慢。这就是为什么LabArchives公司在提供具有更大存储及特性的凝胶成像之外,要提供免费的ELN版本。“我们的调查发现,在学术界,约95%的科学家仍然在使用纸质的实验记录本。”LabArchives公司首席执行官Earl Beutler说道。Beutler的整个家族都是科学家(包括一位诺贝尔奖获得者),他认为实验室应该走向数字化时代了。他说,“我这辈子都在与那些精通技术的天才科学家打交道,然而令我吃惊的是,他们最先进的做法依然是拍照,打印出来,然后把它贴在纸质的实验记录本上。”

  当高校意识到黏合剂会失效,笔记本电脑中的记录没有最强的知识产权保护时,他们开始购买覆盖整个系所的信息化站点许可,Beutler说。这样就为科学家扫清了成本障碍,确保正确地归档潜在的ZL成果。LabArchives的目标群体也包括没有纸张依赖症的群体:学生。“我们的许多用户都是从事教学工作的研究者,因此我们应他们的需求开发了课堂ELN。”Beutler表示,“这样教师在提供背景信息和评判作业时,都能做到电子化。目前使用的最大课堂超过2000名学生。”

  学术研究者Tammy Morrish从第一天起就开始使用数字化工具,她在Labguru上搭建了自己的实验室,这是一个基于网络的研究管理系统。作为一名博士后,Morrish有一个自己搭建的项目资源数据库,然而当她在托莱多大学生化与癌症生物学系开始助理教授生涯时,她需要一个更高级的可共享系统。这是构建新系统的最好时机,她说,因为你了解项目可以使用的所有的小鼠、细胞系和质粒。

  Morrish对Labguru的客户服务评价很高,称这一系统节约了大量时间。它通过将产品数量、供应商和当前订单放在一起,将订购流程化,她说。Labguru保存了实验室小鼠的所有基因型,以及包括图谱的质粒信息。Morrish认为该系统对于定位物品来说尤其有用。“想想看我们在找东西上浪费了多少时间。”她说,“现在我一需要找东西时,即使不问其他人,也能在数据库中输入名称并找到它。”她接着说,“当然,人们需要将找到的东西放回原处。”她的实验室有一名实验员每周定期比对数据库检查库存。

  在更高的层面上,该系统可以促进团队交流,例如通过便捷的数据交换。它也是最好的实践教学,Morrish说,“它帮助学生用任何数据库都可以掌握这一技能,你需要正确、一致地输入信息,否则就找不到它。”

  可控数字化

  基于科研的商业机构也十分欣赏数字化研究管理的效率,但是长期的稳定性也至关重要。“挑战在于确保数据从现在起20年的可达性和可用性。”Dathe说。选择主流的信息供应商,如IDBS、PerkinElmer或者Accelrys可能会提供较为持久的保障,但是市场是动态的,任何机构都可能面临改变。在过去的几十年间,赛默飞世尔公司收购了InnaPhase公司,PerkinElmer公司购买了Labtronics、CambridgeSoft和ArtusLabs公司,拥有漫长并购和收购史的Accelrys最近也被法国的软件公司Dassault所收购。诚然,合并后的公司仍力求保留用户。“我们依然拥有自上世纪90年代就研发出来的软件,我们也经常会为客户指明前进的道路。”Accelrys公司高级副总裁Leif Pedersen说。

  尽管如此,产业界并不都采用实验室信息化系统。但即使是食品药品监督管理局这样的机构都鼓励使用电子文档,Dathe说,“制药厂商通常都比较保守,它们认为已经被监管机构所接受的纸质系统通常更容易、更便宜。”

  丹麦的LEO制药厂的信息化探索与数据管理部负责人Ulrik Nicolai de Lichtenberg研发了一种致力于商业信息化系统的模型。他说,起初是利益相关者的深入分析。定义出你的需求、目标和“能承受多大的痛苦”,也就是使用新系统所要耗费的时间、金钱和努力。要意识到你的ELN或者LIMS只是信息生态系统的一部分。LEO制药厂为其药物化学研发部门选择了Accelrys公司的ELN,但ELN只是de Lichtenberg团队设计的整套复杂的基础设施中的一个元素。他们的系统会捕获、验证并永久存储记录,一旦发生知识产权诉讼,这些记录将会易于获取、搜索并能够提供法律依据。这是一项复杂的计划,de Lichtenberg建议从独立顾问那里寻求建议,因为他们懂得不断变化的信息化市场。

  “云”端之上

  Atrium研究咨询公司首席执行官Michael Elliott为de Lichtenberg提供建议,并支持他的方法。他说,“不要迷恋于一个示范产品,要向深层次看,检验信息化系统的潜在能力。”客户们的理想系统能够流程化管理、确保存储的安全持久,同时快速检索所需信息。一个理想的系统甚至能够找到“暗数据”(能够回答目前研究问题的早期数据,但是淹没于杂乱的数据中)。客户需要的是可扩展性、用户友好的界面和杰出的全球支持。然而,不同产品在这些能力上存在差异,Elliott说,“不要只依靠宣讲和品牌名称来做选择,而要仔细考虑你当前和未来的需求。”

  如果可扩展性和易于使用性是第一需要,那么可以选择基于云的系统,如Core Informatics。原则上来说,云系统可以存储无限量的数据,而且网络浏览器的接入方式为用户提供熟悉的界面。基于浏览器的系统不需要专门的软件,因此也易于升级。信息化供应商也提供了用户友好的模块化软件包。类似于选择手机应用,用户仅需要选择他们所需的组分。

  同时进入视线的entire有更好的移动性和兼容性。研究者现在都携带智能手机和平板电脑进入实验室,因此信息化研发者正在打造与手持设备兼容的产品。数据日益需要在不同的设备和信息化平台上汇编,因此,Pedersen表示,他个人正在推动促进信息共享的标准化提升工作。然而,曾经的现实主义者Elliott也表示,标准化的进程也十分缓慢,因为即使是在同一个部门,用户也可能采用不同的术语和定义。Elliott说,推动科学信息标准化和数据集成优化的驱动力,“是走向更加协作的工作”。

  在信息化提升的愿望清单上,Dathe加入了数据的背景特性,即该数据何时何地被哪项研究采集。数据应该与相关的分子和临床信息以及整个数据产生过程相链接,包括使用仪器的类型和状态。Dathe说,“没有这些背景,我们所采集的海量数据将毫无意义。”

  开放的心态

  调整海量数据规模是Britt Piehler的工作,作为LabKey软件公司的总裁,他开发了用于数据管理和整合的工具。他说,全球化和多点合作的趋势意味着,项目经理必须要协调从各个站点、在多样环境下、以各种仪器采集的数据。“这正是LabKey起作用的地方。”Piehler说,“我们为具体任务打造工具,通常是为多点合作计划打造的数据整合,这些计划需要对各种各样的数据进行标准化。”LabKey软件公司的一个不寻常特性就是其产品是开放源码。

  “我们成长于学术群体。”LabKey公司科学拓展部主任Elizabeth Nelson说,“因此我们相信软件平台的优势在于免费获取。”开源代码使得研究者可以量身定做他们的系统,Piehler说,LabKey工具的构建和分享形成了一个社区。

  如果代码是免费的,那么LabKey提供什么呢?“定制化”,Piehler说。LabKey软件公司的专家可以打造出直接解决Dathe数据背景需求的工具,例如加入人口统计信息。在2013年8月,开源和开放获取通过LabKey相结合,以提升科学的透明性和再现性。在一项发表于《新英格兰医学杂志》上的脉管炎治疗临床试验中,利用LabKey的开源平台搭建网络入口,免费向公众开放除去了参与者识别信息的数据。

  对于那些致力于透明化和自己动手(DIY)的研究者来说,开源工作流程管理工具是一项选择。加州大学圣克鲁兹分校生态与进化学博士后研究员Carl Boettiger已经经历了完整的DIY实验室记录本之旅。起初Boettiger将可开放获取的实验记录保存在OpenWetWare平台上。“这有点激进”,Boettiger说,“任何人都能进入并且编辑他人的笔记,尽管这不常发生。”在OpenWetWare之后,Boettiger转向了能让他加强控制自己的研究记录的平台,这次是通常用于发表博客的WordPress平台。Boettiger目前使用在线软件开发网站GitHub作为他的记录本,并利用Jekyll网站生成软件在线发表他的记录本。

  博客型的ELN为你的研究建立了强大的历史保险柜,Boettiger说。这将使欺骗无所遁形,因为任何改变都会留下记录。你可以选择公开、隐私的内容并受密码保护。他说,当你在学术会议上与人交谈或回复审稿人的要求时,你可以直接在手持设备上调出记录,回顾你在何时做了哪些尝试,以及如何做出来的。

  下一步呢?

  Boettiger说,“实验记录趋向开放性和协作,更安全,更加自动化。”Boettiger和Dathe分别是圣克鲁兹的生态学家和巴塞尔的药物研发和信息技术专家,尽管他们的观点应该有所不同,但是他们对于未来实验室有着近乎科幻的一致观点。在这个愿景中,科学家只管做他们的工作,自动跟踪系统就会同时记录数据。条形码会标明使用的试剂、样品和仪器,为数据的后续分析提供背景。整个的过程也将被记录下来,展现出每个字节的出处,并最终建立知识产权的声明。“这将提供更广泛的数据记录,只要你愿意就可以透明化并可以分享。”Boettiger说。一个完全自动化的系统能够不用人工数据输入就可以采集实验细节,使研究简化。然后,我们所需要的只是将试剂归位的机器人。

相关文章

数据基础设施建设典型案例之五十|数据元件互联互通实践助力跨区域跨行业释放数据价值

数据元件互联互通实践助力跨区域跨行业释放数据价值推荐单位:中国电子信息产业集团有限公司申报单位:中电数据产业集团有限公司中电数据产业集团有限公司依托数据元件理论,基于国产自主软硬件,融合大数据、人工智......

借助合适的设备和软件,永久化学品无需永久分析

从低水平定量到识别日益增长的新型PFAS化合物及其代谢物,种种挑战引发了人们对漏检新兴关注变体的担忧,实验室需要配备多种PFAS检测能力,专注于已知目标物、未知物的可靠鉴定以及新兴威胁的分析。强大且易......

数据“中毒”会让AI“自己学坏”

在一个繁忙的火车站,监控摄像头正全方位追踪站台的情况,乘客流量、轨道占用、卫生状况……所有信息实时传输给中央人工智能(AI)系统。这个系统的任务是帮助调度列车,让它们安全准点进站。然而,一旦有人恶意干......

国家数据局召开推动地方数据集团创新发展专题座谈会

为推动地方数据集团创新发展,服务全国一体化数据市场培育建设,7月23日,国家数据局组织召开座谈会。国家数据局党组书记、局长刘烈宏出席会议并讲话,局党组成员、副局长沈竹林、夏冰、余英出席会议。局党组成员......

智能化养猪助力育种领域全新探索

随着人工智能(AI)、自动化等技术的持续突破,利用传感器进行数据采集与高速传输,并通过物联网存储海量数据,正持续推进智能化养殖业发展,逐渐成为推动猪育种向精准化、高效化、智能化转型的核心驱动力。从整个......

国知办印发《知识产权数据使用手册及开放目录》

国家知识产权局办公室关于印发《知识产权数据使用手册及开放目录》的通知国知办函服字〔2025〕153号各省、自治区、直辖市和新疆生产建设兵团知识产权局,各地方有关中心:为促进知识产权数据开发利用,提高知......

研究揭示地方真实数据在全球疾病负担研究中的重要性

2月23日,记者从海南医科大学获悉,该校热带医学院杨国静教授团队近日在国际医学期刊《英国医学杂志》在线发表论文《中国被忽视热带病负担估计的差异:真实世界数据与GBD2021的比较研究(2004—202......

打破依赖:国产饲料工业软件实现弯道超车

19个月100多人团队攻关,8家龙头企业7个月公益性示范试用,认可度100%,服务及时性100%。近日,我国具有自主知识产权的饲料配方工业软件“中农科龙腾”1.0版本正式发布。中农科龙腾软件在大型饲料......

合成数据能否让AI模型精确可靠?

人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满......

“人民数据数融平台”上线试运行

 12月28日,由人民数据开发的“数融平台”正式上线试运营。平台整体依托区块链、人工智能和企业经营相关数据要素,实现链上信息全透明、全上链,实现数据资产情况全穿透,实时追踪一手风控数据,对潜......