微生物系统是包括CRISPR在内的许多生物技术的基础,但是序列数据库的指数级增长使得很难找到以前未识别的系统。
2023年11月23日,博德研究所张锋及美国国立卫生研究院Eugene V. Koonin共同通讯在Science 在线发表题为“Uncovering the functional diversity of rare CRISPR-Cas systems with deep terascale clustering”的研究论文,该研究开发了基于位置敏感哈希的快速聚类(FLSHclust)算法,该算法在线性时间内对大量数据集进行深度聚类。
该研究将FLSHclust纳入CRISPR发现管道,并鉴定了188个以前未报道的CRISPR相关基因模块,揭示了许多与适应性免疫相关的其他生化功能。该研究通过实验表征了三种含HNH核酸酶的CRISPR系统,包括第一种具有特定干扰机制的IV型系统,并对它们进行了基因组编辑。该研究还鉴定并表征了一种候选的VII型系统,显示了它对RNA的作用。这项工作为利用CRISPR和更广泛地探索微生物蛋白质的巨大功能多样性开辟了新的途径。
酶和天然生化系统的发现推进了分子进化研究,揭示了生物过程,为分子技术的发展提供了一个起点。在过去的几十年里,通过对快速增长的核酸和蛋白质序列数据库的系统挖掘,发现了种类繁多的蛋白质家族和功能系统。这些工作中有许多使用蛋白质聚类来对大型数据集中的相似序列进行分组。然后,这些算法的输出可用于蛋白质序列的深度学习、三维(3D)蛋白质结构预测和基因组挖掘。后者的一个主要例子是发现了以前未知的CRISPR系统,它导致了变革性生物技术和治疗方法的发展。
CRISPR系统是微生物RNA引导的适应性免疫系统。它们由CRISPR阵列组成,该阵列编码产生向导的CRISPR RNA (crRNA);一个适应模块,将新的间隔器集成到CRISPR阵列中;以及干扰模块,该干扰模块由由crRNA引导的效应组件组成,该效应组件随后被切割到匹配的靶标。CRISPR效应物可以是1类CRISPR系统中的Cas蛋白复合物(例如Cascade),也可以是2类CRISPR系统中的单、多结构域蛋白(例如Cas9、Cas12或Cas13)。CRISPR系统固有的模块化和可编程性已经被用来开发一套RNA引导的分子技术,从Cas9介导的基因组编辑开始。
FLSHclust的设计与实现(图源自Science )
这个工具箱已经通过计算搜索得到扩展,发现了许多CRISPR系统。然而,现有的方法依赖于具有二次运行时间的算法,例如对所有比较和蛋白质聚类,这对于挖掘包含数十亿蛋白质的指数增长数据集来说很快变得不切实际。线性缩放聚类方法,如LinClust,可以解决其中的一些问题,但是产生的高度相似序列的小聚类限制了研究深层进化关系的能力。蛋白质结构域谱,如PFAM,可以用来识别广泛丰富的关联,但它们将远程同源物分组,这导致虚假的关联而缺失罕见的关联。
发现数百个罕见的以前未被发现的CRISPR系统,具有敏感的,可扩展的CRISPR关联管道(图源自Science )
为了解决这些限制并利用已知蛋白质结构和功能多样性的爆炸性增长,该研究开发了快速基于位置敏感哈希的聚类(FLSHclust)(发音为“flash clust”),这是一种线性缩放的并行深度聚类算法,O(N logN)。FLSHclust可以处理数十亿个蛋白质,能够对庞大的、指数级增长的序列数据库进行有效分析。该研究应用FLSHclust来鉴定以前未被鉴定的CRISPR系统,包括候选的VII型CRISPR系统,生成RNA引导蛋白目录,扩展我们对这些系统的生物学和进化的理解,并为开发新的生物技术提供起点。
在一项近日发表于《通讯-地球》的研究中,科学家探究了微生物如何在地球最恶劣的水下环境中存活。他们分析了脂质生物标志物——这类特殊脂肪分子能反映生物活性,以此揭示这些生物体的生存策略。该地点的pH值高达......
近日,中国医学科学院北京协和医院赵海涛团队与中国医学科学院蛋白质组研究中心/基础医学研究所质谱中心孙伟团队携手攻关,在胆管癌治疗领域取得重大突破。他们的研究首次将尿液蛋白质组学与单细胞、空间转录组学相......
在人体肠道深处栖息着熙熙攘攘的微生物群落,每种微生物都在食物消化过程中扮演特定角色。其中存在一种能产生甲烷的特殊微生物,美国亚利桑那州立大学最新研究表明,这种产生甲烷的微生物可能影响人体从摄入食物中提......
近日,东北林业大学生态学院团队在生态系统多功能性的微生物维持机制方面取得新进展。该研究揭示了土壤微生物通过调整高产-资源获取-胁迫耐受生态对策来应对干旱的内在机制,从微生物生态对策的新视角阐明了生态系......
中南大学 2025年11月政府采购意向公开为便于供应商及时了解政府采购信息,根据《财政部关于开展政府采购意向公开工作的通知》(财库〔2020〕10号)等有关规定,现将中南大学2025年11月......
日本研究人员参与的一个国际团队近日在英国《自然-通讯》杂志发表论文说,一种蛋白质在实验鼠精子与卵子结合过程中发挥关键作用,由于人体内也有这种蛋白质,这项成果可能有助于诊疗男性不育。日本熊本大学和大阪大......
为什么不同生物在适应相似环境时,会独立演化出相似的功能?一项最新研究从蛋白质的“高阶特征”层面揭示了这一生命演化奥秘的重要机制。这项研究由中国科学院动物研究所邹征廷研究员团队完成,成功利用人工智能领域......
哺乳动物体内微生物及其携带的抗生素耐药基因(ARG)的跨宿主传播,是潜藏的重大公共卫生风险源。然而,现有研究面临多重技术瓶颈:低丰度微生物难以检测导致潜在病原漏报;大量未报道的微生物物种缺失限制了多样......
衰老对海马体(大脑中负责学习和记忆的区域)的影响尤为严重。如今,旧金山加州大学的研究人员发现了一种在该衰退过程中起核心作用的蛋白质。这项研究成果于8月19日发表在《自然—衰老》期刊上。科学家们确认FT......
持续的气候变暖造成多年冻土大面积融化。作为剧烈的冻土融化形式,热融塌陷会在短时间内改变植被、土壤和水文等过程,从而影响土壤微生物及其介导的碳过程。微生物碳利用效率是指微生物将吸收的碳分配至自身生长的比......