发布时间:2015-12-18 00:00 原文链接: 刘小乐教授:CRISPR高通量筛选的新算法

  高通量的CRISPR筛选,已在功能基因组学研究中显示出巨大的潜力。12月16日,华人女学者、哈佛大学公共卫生学院Dana-Farber癌症研究所的刘小乐教授,在国际著名学术期刊《Genome Biology》发表题为“Quality control, modeling, and visualization of CRISPR screens with MAGeCK-VISPR”的学术研究论文,为CRISPR筛选提出了一套综合质控(QC)、分析和可视化的工作流程――MAGeCK-VISPR。延伸阅读:刘小乐教授连发多项研究成果。

  CRISPR/Cas9系统是一种强大的遗传工程技术,可让我们以一种经济合算的方式,在大多数模式生物中直接修饰基因组位点。基于这一系统,最近开发的高通量CRISPR筛选技术,已经在功能基因组学研究中显示出巨大的潜力,从而让研究人员能够系统地识别与各种表型相关的基因。CRISPR筛选,既可以通过用CRISPR/Cas9的直接基因敲除进行,也可以用CRISPR和与激活或抑制效应物融合的dCas9(失去DNA切割活性的Cas9蛋白)干扰基因表达。

  虽然CRISPR筛选是一项强大的技术,但是它也产生了许多计算上的挑战,包括:(1)如何评价数据质量;(2)如何识别来自筛查的基因或通路命中以及评估其统计学意义;(3)如何有效地可视化和探讨筛选结果。直到现在,仍然还没有一种综合的质控(QC)、数据分析和可视化方法用于CRISPR筛选。

  已有研究开发出几种算法,用于基因芯片或高通量测序数据的筛选分析。这些算法是在两种条件对比的基础上设计出来的,但是,许多筛选是在几个时间点、在许多处理条件下或许多细胞系中进行的。此外,这些算法没有考虑单向导RNA(sgRNA)对靶基因的敲除效率。

  在这项研究中,研究人员提出了MAGeCK-VISPR来克服CRISPR筛选的计算挑战。MAGeCK-VISPR定义了一套QC测量,并通过最大似然估计方法(MAGeCK-MLE)扩展了MAGeCK算法,以在不同条件下调用必需的基因,同时考虑sgRNA的敲除效率。

  此外,MAGeCK-VISPR,为CRISPR筛选质量控制和分析结果的交互式探测,提供了一个基于Web的可视化框架(VISPR)。MAGeCK-VISPR采用一种Snakemake工作流程,以一种可扩展和可重复的方式,将MAGeCK和VISPR结合起来。

  随着CRISPR筛选变得越来越普遍,数据的复杂性(如批量效应),将是不可避免的,这就需要对有意义的下游分析进行适当的校正。现有的批量去除算法,已被广泛用于去除基因表达分析中的批量效应。在将来,这些算法可被整合到MAGeCK-VISPR流程中。从这以后,MAGeCK-VISPR将能够通过不同试验数据集之间的直接对比,确定癌症相关――以及疾病特异性的重要基因,从而为疾病和癌症的病理机制,提供新的治疗见解。

  注:刘小乐 (Xiaole Shirley Liu) 青年时代就读于天津南开中学, 1992 年考入北京大学生物系。 1994 年转学到美国史密斯女子学院 (Smith College) 双修生物化学和计算机科学, 三年后以最高拉丁荣誉毕业 (Summa Cum Laude, 授予全校积分最高的 1% 的毕业生)。2002 年于斯坦福大学取得生物医学信息学博士和计算机科学辅修博士学位后, 被直接聘为哈佛大学终身制助理教授。她目前担任哈佛大学公共卫生学院生物统计与计算生物学系的终身正教授、Dana-Farber 肿瘤研究所功能性癌症表观遗传组学中心主任, 和同济大学生物信息学系教授并长江学者讲座教授。

相关文章

“女娲”基因组计划发布第五项成果

近日,“女娲”基因组团队重点阐释了适应性选择下非编码调控元件对表型演化的影响,相关研究发表于《分子生物学与进化》。这项工作是中国科学院生物物理研究所徐涛院士、何顺民研究员牵头的“女娲”(NyuWa)中......

CRISPR基因编辑猪拟于2025年上市

据英国《新科学家》网站2月24日报道,国际育种公司Genus借助CRISPR技术,对猪进行了基因编辑,使其能避免患上猪繁殖与呼吸障碍综合征(PRRS)。相关论文发表于最新一期《CRISPR》杂志。该公......

CRISPR基因编辑猪拟于2025年上市

据英国《新科学家》网站2月24日报道,国际育种公司Genus借助CRISPR技术,对猪进行了基因编辑,使其能避免患上猪繁殖与呼吸障碍综合征(PRRS)。相关论文发表于最新一期《CRISPR》杂志。该公......

一生中患病的几率或可预测,十种慢性病遗传风险估算更接近临床

通过分析基因组中数百万个微小的遗传差异,就可预测一个人一生中患某种疾病的几率。在过去的10年中,研究人员为数十种疾病制定了风险评分,希望有一天患者能利用这些信息来降低患病风险。在《自然·医学》杂志最新......

揭秘基因组“暗物质”

记国家自然科学基金重大研究计划“基因信息传递过程中非编码RNA的调控作用机制”在人类遗传信息传递过程中,非编码RNA不参与编码蛋白质,占全部RNA的98%,如同宇宙中神秘的“暗物质”,是生命活动调控的......

高内涵成像分析系统为中医药现代化“插上翅膀”

中成药(中草药制品)主要是以中药材为原料,在中医药理论指导下,为了预防及治疗疾病的需要,按规定的处方和制剂工艺将其加工制成一定剂型(如丸、散、膏、丹等)的中药制品。中成药是历代医药学家经过千百年医疗实......

构建水稻基因组倒位变异图谱

近日,中国农业科学院深圳农业基因组研究所联合国内多家单位发布了迄今为止最大的水稻群体水平倒位变异图谱,并挖掘获得了新的水稻耐热优异等位基因,该研究对水稻育种改良具有重要意义。相关研究成果发表在《科学通......

2023年度CRISPR基因编辑领域十大研究进展,张锋实验室遥遥领先

这项研究凸显了CRISPR前所未有的多样性和灵活性,也表明了大多数CRISPR系统是罕见的,只在不寻常的细菌和古细菌中发现。随着可用来搜索数据库的不断增长,可能还有更多罕见系统被发现。诞生于2012年......

2023年度CRISPR基因编辑领域十大研究进展,张锋实验室遥遥领先

这项研究凸显了CRISPR前所未有的多样性和灵活性,也表明了大多数CRISPR系统是罕见的,只在不寻常的细菌和古细菌中发现。随着可用来搜索数据库的不断增长,可能还有更多罕见系统被发现。诞生于2012年......

基因组精确注释新方法:增强子鉴定新技术

近日,中国农业科学院深圳农业基因组研究所动物功能基因组学创新团队研发出增强子鉴定新技术。该技术与传统技术相比,平均分辨率提高了约10倍,为基因组的精确注释提供了新方法。相关研究成果发表在《核酸研究》(......