发布时间:2017-07-19 13:47 原文链接: 机器学习在分子生物学领域大显身手

  如果这是未来的生物学实验室,那么它看起来与今天的实验室似乎并没有什么不同。穿着白大褂的科学家拿着盛有冷冻玻璃管的箱子走过,架子上的化学物质——纯酒精瓶、糖罐、蛋白质和盐是培养和调节微生物的标准物件。如果不是耳朵听到的机械声音,你可能根本不会注意到这里的机器人:它们在风扇的低啸中像蟋蟀一样彼此哼唱着。

  这些机器人为生物技术公司Zymergen工作,这家公司在2014年搬迁到美加州旧金山东海岸一家原电子工厂所在地。这些机器人整日都在进行微生物实验,寻找增加有用化学物质产量的方式。这是一个叫作“回声”的机器人:它位于一堆杂乱的设备中间,一只机械臂抓住一个塑料模块,模块上有数百个细微孔径,其中盛着液体。一束激光扫描了模块旁的一个条形码,然后“回声”将其运到一个托盘上。下一步发生的过程及其细微,用肉眼难以观察到。

  “这并非是人们如何动手用吸移管吸移液体的复制品。”该公司共同创始人之一、分子生物学家兼操作及工程副总裁Jed Dean说,“这是以完全不同的方式在执行这件事。”机器人无须用吸移管吸收并将数毫升的液体注入到每个孔中(在细胞层面液体量的涨落),且并不会碰触它。相反,一束声波脉冲会以每秒钟500次的频率让液体自己泛起涟漪,并形成比人类可转移的液体量小1000倍的液滴。

  实际上,这些并没有真正未来主义的部分。大型生物实验室使用机器人和条形码已有多年。即便是被称作“声微滴喷射”的液体去除技术也已经存在了数十年。当Dean被问到这台机器人通过什么在做实验时,他才透露了一点真相。实际上,这是一个计算机程序输出。

  “我想要说清楚的是,这个过程中有一位人类科学家在了解结果和现实,并核查它们。”Zymergen执行总裁Joshua Hoffman解释说。他表示,对于解释数据、生成推论以及计划实验来说,其终极目标是“摆脱人类的主观直觉思维”。

  Zymergen是若干家拥有相同目标的公司之一:利用人工智能(AI)增加或替代科学过程中的人类角色。人们用“AI驱动的生物技术”来描述这一过程,但Zymergen共同创始人对这一说法表示担忧。“‘AI’听起来像是机器人在下象棋。”该公司首席技术官Aaron Kimball说,“我觉得‘ML’让人更加舒服。”Hoffman说,ML指的是机器学习,即可以解释最近几乎所有AI进展的计算科学的分支。“这正是我们正在做的。”

  自动化发现

  科学是一个序列。日复一日的实验室工作与工厂工作是如此不同。论文来了,启发新的实验,然后产生新的发现,结果又产生新的论文。如此循环。各种各样的公司和研究机构正在拓展基于机器人和AI的工具,以增强甚至替代这个过程的每个步骤中人类的角色。

  Zymergen实际上做的是调节可用于生物质燃料、塑料或药物的产业微生物。为了提高产量,一些公司将它们的菌株送到Zymergen。那里的机器人于是便探索和修复每个微生物的基因组,从而设计出一个使其合成产物更加高效的菌株版本。

  Hoffman表示,问题在于被送到Zymergen的微生物已经“高度优化”。经过数年的研究育种之后,这些细胞非常擅长发挥自己的功能。因此,“挤”出更多的效率需要深入探索其基因组、开展实验以及跟踪相关数据,进行科学研究。

  Zymergen正在设法加速这一科学过程。在传统生物学中,Hoffman表示,“需要一个人站在工作台前测试有限数量的假设。可能每月可测试10个假设。”而机器人可以用更快的速度完成这一过程,Zymergen的机器人每周可以进行多达1000个实验。但机器人只能遵循指令:给它们正确的指令是真正的瓶颈所在。

  当被问这个算式如何设计实验时,Kimball提到了一个简单的前提。“比如说你得到了约5000个基因的原始微生物,而你改变每个基因的方式有10种,这就意味着你要做5万个实验。”他说,实验“活动”从制作1000个菌株开始,每个菌株都有一个特定的突变。 “每个菌株都生活在一个液滴中。你给它喂糖,然后让它烹饪一会,接下来是测量获得了多少产物。”可能有25个菌株会产生略多一些的靶标化学物质。这些菌株将会成为下一轮实验的良种,而其余的则会进入冷冻仓。

  机器人定位

  这一发现之路绝非坦途。Kimball说,找到适当的突变结合体需要漫长而艰难的基因“地形”探索之旅。如果只是盲目地朝着效率巅峰走,可能永远不会到达主峰顶点。这是因为如果只是把所有产生小提升的突变结合到一个微生物中,它们加起来可能并不能形成一次大收获。他表示,相反,微生物会“生病”,它们会比原来的菌株性能差得更远。因此,选择正确的道路,包括绕道进入更有潜力的谷地,也需要一张地图从而一次性地展示所有突变效应,这张图不是3个维度,而是数千个。因此就需要机器学习确定方位。

  这是关键的差异:当机器人最终发现能够提高化学物质产量的基因变化时,它们并不知道其效应背后的生物化学线索。

  那么,如果机器人实验并不能加深人们对生物学工作的了解,它是真的科学吗?对于Kimball来说,这样的哲学界点可能并不重要。“我们是因为它的工作而得到了收益,并不是因为了解其中的原因而得到了收益。”

  到目前为止,Hoffman说,Zymergen的机器人实验室已经将制作化学物质的微生物的效率提高了10%以上。这样的增加听起来可能不多,但在每年依赖微生物发酵达到1600亿美元的化学产业内,一小部分的提升也可以转化为更多的资金,甚至比美国国家科学基金会每年70亿美元的预算更多。

  而机器人发现的先进遗传变异代表着真正的发现,这些可能是人类科学家并未发现的变异。大多数提高产量的基因并未直接与合成想要的化学物质相关,例如,其中一半并没有为人所知的功能。“我已经在若干不同微生物中发现了这种模式。”Dean说。不用机器学习找到正确的遗传变异就像尝试打开一个刻度盘上标着数千个数字的保险箱。“人类的直觉很容易被这种复杂性压倒。”他说。

  计算机作者?

  如果机器真的已经准备好替代人类执行一些科学任务,很多科学家将会拥抱它们。不像工厂工人或是出租车司机,大多数实验科学家会很欢迎让他们的部分工作自动化。在分子和细胞生物学领域尤其如此,因为其中的手工劳动如喷射液体、电镀细胞、计数菌落等都非常繁杂且成本高昂。一名研究生最细微的错误或不精确性都会浪费数周甚至数月的工作。

  然而,也有一些生物学家提出了支持AI解释数据和设计实验的一些不足之处。“我们发现目前的机器学习方法并不能胜任这一任务。”加州斯坦福大学计算生化学家Rhiju Das说,他研究的是分子如何折叠从而设计新的药物。“与获得同样数据的人类相比,它们在RNA设计问题上严重落后于人类。”尽管他并不知道这是为什么,但含有“设计”类的任务似乎需要人类的直觉。可能Zymergen正巧碰到了非常适应计算机控制的实验的生物学部分。

  即便AI控制的研究能够起作用,人类是否会理解计算机发现了什么?其结果背后的计算仍是一个“黑匣子”。“一个令人困惑的可能性是我们正在接近‘可理解的’科学时代。”宾夕法尼亚州匹兹堡卡耐基·梅隆大学计算生物学家、与分子生物学家一起工作的Adrien Treuille说。研究人员可能不仅会依赖计算机做科学,还包括解释科学:一些生物学理论证据如此复杂,接受它将需要对计算机抱有信心。

  在这种情况下,科学家是否应该将其计算机作为论文的共同作者?“我不会这么做。”波士顿将AI应用于科学发现的一家公司Nutonian的首席执行官Michael Schmidt说。但他随后表示:“当计算机能够阅读并理解论文的意思之后,它们自己就可以成为作者。”


相关文章

UberEats轮式送餐机器人将在美国多个城市投入使用

过去一年,由Uber支持的ServeRobotics公司的轮式机器人一直在为洛杉矶地区的客户提供外卖食品和杂货。该公司现在宣布,多达2000个机器人将与UberEats一起在北美其他城市投入使用。据S......

能多向稳定飞行的蜜蜂机器人创建

美国华盛顿州立大学研究人员开发了一种可在各个方向稳定飞行的机器蜜蜂。研究成果发表在最新一期《IEEE机器人学报》上。这款蜜蜂++原型机拥有4个由碳纤维和聚酯薄膜制成的机翼,以及4个控制机翼的轻型驱动器......

仿生蜈蚣机器人可根据地形自我适应实现强大的稳定性

技术再一次从大自然中获得了灵感。在研究了蜈蚣如何穿越崎岖的地形之后,研究人员创造了一种多腿机器人,模仿它们弯曲的侧向运动,提供更大的稳定性和可操作性。蜈蚣和千足虫是肌足类动物,这种动物的身体由许多类似......

人工智能现可识别5种心衰用于指导风险预测和治疗

心力衰竭影响着全球数百万人,但可由多种因素引起,需要不同的治疗。现在,研究人员利用一个大型的、基于人群的数据集训练了多个机器学习模型,以确定心力衰竭的五种亚型,这可能会更好地为治疗、病人教育和未来风险......

硬核成果闪耀科博会

“这个机器人的机械臂有7个自由度的高精度关节,在毫秒级视觉辨识加持下,展现出类人的灵活度和敏锐度,基于深度学习实现最优路径规划,以及各类传统机器人难以完成的精细操作,此项技术处于国际领先!”5月28日......

以声音为动力的微型机器人

研究人员在医学微型机器人方面又向前迈进了一步,他们设计了一种微小的、快速的、自我推进的机器人,有朝一日可能直接将药物送到身体内需要的地方。微型机器人,或称微型机器人,被吹捧为下一代的药物输送系统,而且......

牛津大学最新研究:天气能助力一首歌曲登顶榜首

英国牛津大学和南安普顿大学的研究人员在多年以前做过一项很有意思的研究,发现好多有名的作曲家和歌手都有在作品中写到或唱到有关天气的内容的情况,而且大多以阳光和晴天为主,甲壳虫乐队的歌曲就是其中的典型代表......

科技创新积蓄强劲动能助力智能制造跑出“加速度”

智能机器人书写软笔书法、“黑灯工厂”智能机械臂精准工作、医生使用数字化系统远程看诊……在2023第七届世界智能大会上,人工智能在智能制造、工业互联网、智慧医疗等领域广泛运用,描绘出智慧科技产业蓬勃发展......

机器学习工具可能在症状出现前几年就诊断出帕金森病

帕金森病(PD)的增长速度比任何其他神经系统疾病都要快,这使得其早期检测如此重要。研究人员已经开发出一种新的机器学习工具,显示出作为早期检测该疾病的一种方式的前景。PD的诊断通常发生在一个人出现传统症......

青元开物:让用户“解放双手”的工作站

——青元开物:以宽体积精密移液和微反应精准操控等底层技术驱动的创新型生命科学工具供应商2023年4月14-15日,“北京第四届北京临床质谱论坛”暨“《多囊卵巢综合征雄性激素质谱检测专家共识》发布会”在......