基因大数据走向临床应用,哪些问题要克服?
为了推动基因组研究在临床中的应用,多个国家层面的大规模研究项目已经开启。2014年英国发起了10万人基因组计划,美国和中国也宣布了百万人基因组数据相关计划。许多区域性的大数据计划也在进行中。例如,宾夕法尼亚州的盖辛格健康系统(GeisingerHealth System)和纽约的再生元制药公司合作,计划获取25万人的基因组测序数据。与此同时,世界各地越来越多的医院和服务供应商也开始对那些癌症或罕见遗传病患者进行基因组测序。 海量的数据会给计算分析和存储带来前所未有的压力,有分析估计,基因组学很快就能超过YouTube的数据量。但许多研究者认为,如今的大数据还不够丰富,不具有临床价值。盖辛格基因组医学研究院院长MarcWilliams说,“我不知道100万是否足够,但显然我们需要更多。” 变异数据应用到临床的挑战与实践 单核苷酸层面的突变 目前,许多研究机构主要采用外显子组测序,其相对于全基因组而言,可以减少近100倍......阅读全文
中国开放最新家蚕基因组研究数据
“我们通过网络,以开放的姿态与世界共享家蚕基因组最新研究成果”,中国家蚕基因组计划项目主持人、中国工程院院士向仲怀26日介绍,包含有最新研究数据的中国家蚕遗传数据库目前已收到来自国内外科研人员的访问25万余次。 向仲怀介绍,中国家蚕遗传数据库由西南大学家蚕基因研究团队和深圳华大基因研究院合
癌症研究人员联手汇集肿瘤基因组数据
研究人员希望,数据分享将为利用诸如这些脑部腺癌细胞等肿瘤的基因组信息带来更好的方法。 这是为大型癌症研究中心的很多病人提供的最新希望:“让我们测序你的肿瘤,或许我们能将其同击败这种恶性疾病的药物匹配。”不过,现实是基因组分析仍然仅为癌症病人提供了一小部分帮助。“我们多半时候不知道如何处理这些
基因组研究揭示人类大迁移之谜
《自然》日前发表的3篇论文报告了来自全球逾280个不同群体的个体高质量基因组。3项研究描述了通常研究覆盖不足的区域的基因多样性,共同为现代人类走出非洲的大迁移提供了新的认知。 人类种群由演化摇篮非洲向欧洲、亚洲和大洋洲扩张的时间和路线广受热议。一些模型显示,现今所有非非洲人的祖先都可追溯至单一
华大参与:复杂宏基因组数据的新分析法
当前分析宏基因组数据的大多数方法,都依赖于与参考基因组的对比,但是许多环境中的微生物多样性远远超过了参考数据库所覆盖的范围。将复杂的宏基因组数据从头划分为特定的生物学实体(如特定的菌株或病毒),在很大程度上仍然是一个未解决的问题。 在2014年7月6日的《Nature Biotechnolog
Secure-Federated-GWAS:打破数据壁垒,开启基因组研究新篇
在生命科学的广袤领域中,基因组关联研究(Genome-Wide Association Studies,GWAS)宛如一座灯塔,照亮了探索遗传变异与健康、疾病关系的道路。想象一下,若能整合全球各机构的基因数据进行研究,那将为攻克疑难病症、揭示生命奥秘带来多大的助力!然而,现实却如同一堵高墙,横亘在理
北京基因组所生命与健康大数据研究获进展
与健康大数据研究成果,包括生命组学数据资源建设成果(D14-20)、实时定量PCR内参基因知识库——ICG(Internal Control Genes;D121-126),甲基化数据库Methbank升级版(D288-295)以及基因组序列变异库——GVM(Genome Variation M
天津工生所等基因组数据整合研究获系列进展
随着人类基因组计划(Human genome project, HGP)和高通量生物芯片技术的成功研发,人们广泛利用高通量全基因组生物芯片的技术手段,采用全基因组关联研究(Genome-Wide Association Studies, GWAS)的方法筛选复杂疾病易感多态(Single Nuc
油菜害虫研究新突破:西北斑芫菁基因组数据发布
近日,中国农业科学院油料所(以下简称油料所)油料基因工程与转基因安全评价创新团队发布了油菜害虫西北斑芫菁染色体水平高质量基因组数据,明确该害虫含10条染色体和11687个蛋白编码基因,为研发害虫绿色防控新方法奠定了理论基础。相关成果发表在《科学数据》(Scientific Data)上。西北斑芫菁染
缺乏数据使用指导原则,基因组数据共享遇阻
基因组数据共享将生物医学研究推向快车道,但向公共领域发布的现有数据指南一方面承认免费和无条件使用数据的重要性,另一方面还未能解决这种重要性与数据生产者首次发布数据的“权利”之间的关系。 在美国能源部联合基因组研究所负责人Nikos Kyrpides看来,这种自相矛盾导致了数据生产者和数据使用
香港理大研究团队以数据模型助力疫情防控
原文地址:http://news.sciencenet.cn/htmlnews/2022/1/472656.shtm 【解说】香港新一波新冠疫情来势汹汹。日前,香港特区政府召开紧急会议并以“快、准、狠”措施,与奥密克戎病毒“竞赛”。在此关键时期,香港理工大学讲座教授史文中带领研究团队利用数据模型
香港理大研究团队以数据模型助力疫情防控
【解说】香港新一波新冠疫情来势汹汹。日前,香港特区政府召开紧急会议并以“快、准、狠”措施,与奥密克戎病毒“竞赛”。在此关键时期,香港理工大学讲座教授史文中带领研究团队利用数据模型预测香港奥密克戎病毒的扩散情况,冀助力特区政府防控疫情。 【同期】香港理工大学讲座教授 史文中 我们现在介绍一下我
研究填补三千年来中原人群古基因组数据空白
厦门大学人类学研究所、郑州大学考古与文化遗产学院等单位成功提取和测序了从西周、春秋、唐代到明清时期的中原地区38个古人的基因组,论证了3000年来中原地区人群遗传稳定性。该研究填补了中原人群距今3000年来的古基因组数据的部分空白。日前,相关研究成果发表在《科学通报》上。中原地区是中华文明的主要发祥
研究填补三千年来中原人群古基因组数据空白
厦门大学人类学研究所、郑州大学考古与文化遗产学院等单位成功提取和测序了从西周、春秋、唐代到明清时期的中原地区38个古人的基因组,论证了3000年来中原地区人群遗传稳定性。该研究填补了中原人群距今3000年来的古基因组数据的部分空白。日前,相关研究成果发表在《科学通报》上。中原地区是中华文明的主要发祥
基因组数据分析的“金标准”
五月十八日,美国安大略癌症研究所、俄勒冈健康与科学大学、赛智生物网络(Sage Bionetworks)、分布式DREAM 团体(Dialog for Reverse Engineering Assessment and Methods)和加州大学圣克鲁兹分校的癌症研究人员,在《Nature M
大模型驱动的基因组环形可视化生成研究获进展
近日,中国科学院计算机网络信息中心科研团队研发出大模型驱动的基因组环形可视化智能生成框架AuraGenome。AuraGenome突破“人工-脚本-静态”传统范式,开创“自然语言-智能体-交互”新模式,能够将基因组数据快速转化为高质量、可交互的可视化结果,并支持全流程的可追溯与复用。在急性髓系白血病
北京基因组所发布表观基因组数据库MethBank-3.0
中国科学院北京基因组研究所生命与健康大数据中心发布表观基因组数据库MethBank 3.0,并将其成果以MethBank 3.0: a database of DNA methylomes across a variety of species为题,在线发表在Nucleic Acids Rese
北京基因组所发布表观基因组数据库MethBank-3.0
中国科学院北京基因组研究所生命与健康大数据中心发布表观基因组数据库MethBank 3.0,并将其成果以MethBank 3.0: a database of DNA methylomes across a variety of species为题,在线发表在Nucleic Acids Rese
2019兰大新生数据大揭秘:近5000研究生新生入学
2019年,共有4939名本科新生以及4981名研究生新生迈入了兰州大学的校园(研究生新生人数首次超过本科生哦)他们都是来自哪里的呢?男女比例是怎样的?有没有同名同姓的人?
海洋大科学研究中心与多家单位合作推动数据共享
9月27日,中国科学院海洋大科学研究中心举办海洋时空数据与应用论坛。论坛期间,海洋大科学研究中心分别与中国航天系统科学与工程研究院、中国资源卫星应用中心、长光卫星技术有限公司、珠海欧比特宇航科技股份有限公司签署合作协议,推动数据共享。 根据协议,海洋大科学研究中心将与各合作方建立长期、稳定的战
美洲大蠊基因组测序完成
中科学院上海生命科学研究院植物生理生态研究所詹帅及同事对美洲大蠊进行了基因组测序和分析,表明在已测基因组的昆虫中,其基因组规模仅次于蝗虫。这项研究3月21日在线发表于《自然—通讯》,文章揭示了该物种成功适应城市环境的遗传学基础的相关洞察。 美洲大蠊(Periplaneta americana
研究人员发布全基因组单核苷酸变异数据库
10月22日,国际学术期刊Genome Biology 以PGG.SNV: understanding the evolutionary and medical implications of human single nucleotide variations in diverse popul
国家基因组科学数据中心公布数据资源整合挖掘体系
近日,国家基因组科学数据中心在国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表题为Database Resources of the National Genomics Data Center in 2020 的文章,以整体形式介绍基因组数据资源整合与挖掘体系建设
国际癌症基因组联盟公布逾1万个癌症基因组数据
国际癌症基因组联盟(International Cancer Genome Consortium,简称"ICGC")近日向科研界公布了超过1万个癌症基因组的数据。这些数据能更好地帮助全世界的癌症研究者从基因方面了解癌症,加快对癌症的研究并帮助更多癌症靶向治疗的发展。 安大略癌症研究所所
为何大家愿意公开自己基因组数据?
2007年,在诺贝尔奖得主James Watson共同发现DNA结构的54年之后,他成为了第一个完成个人基因组测序的人,当时这花费了近100万美元。但随着近年来测序成本的下降,到了测序先驱Craig Venter这里,已经可以在一个小时内,花不到100美元的钱就能得到个人基因组序列了。 这一市
又一灭绝物种全基因组数据解析
日前,吉林大学考古学院蔡大伟教授团队与西北农林科技大学动物科技学院姜雨教授团队在马属动物古DNA研究领域取得重要进展。该研究在国际上首次成功获取已灭绝马属动物奥氏马的高质量全基因组数据,重建了马属动物的演化历史。 马科动物自古以来就与人们的关系密切,对人类社会文明的发展产生了重大影响。中国家马起源
北京基因组所数据资源建设取得进展
近日,中国科学院北京基因组研究所生命与健康大数据中心团队研究论文在线发表于《核酸研究》期刊。该研究成果的发表是国内首次以数据中心为模式,整体发布我国生命组学数据资源建设情况,标志着生命与健康大数据中心建设取得实质性重要进展,也标志着我国建设综合性基因组数据资源获得国际同行认可。 生命与健康大数
基因组所完成开发RiceWiki数据库
近日,中国科学院北京基因组研究所章张研究员课题组与北京理工大学、中国林业科学研究院及华中农业大学合作开发完成RiceWiki数据库。该数据库是基于维基百科的水稻基因信息平台,是可编辑且内容公开的公众注释系统。研究成果在Nucleic Acids Research杂志发表。 水稻是人类重
北京基因组研究所Plant-cell基因组研究新成果
来自中科院北京基因组研究所、荷兰瓦赫宁根大学和中科院/马普学会等10多家机构的研究人员组成的一个研究小组,通过测序及分析醉蝶花(Tarenaya hassleriana)的基因组提供了关于十字花科植物繁殖性状和基因组进化的新认识。相关研究发表在植物学权威期刊The Plant Cell杂志上
基于八大基因组学数据库-构建迄今最完整的癌症eRNA图谱
增强子RNA(eRNA)是一种从增强子转录的非编码RNA。目前,科学家已经在人类细胞中鉴定出数以万计的eRNA,其中许多都在RNA转录过程中发挥重要作用,以介导靶基因的激活。在人类癌症中,癌基因或致癌信号通路的激活通常引起增强子的激活和eRNA的产生。例如,ESR1的激活可以整体上增加乳腺癌中e
Nature新文章解析三大基因组
发表在最新一期(12月19日)《自然》(Nature)杂志上的一篇新文章,揭示了三个重要生物――水蛭(leech)、海蠕虫(Capitella teleta)和青贝(limpet)基因组。通过这一研究,来自莱斯大学、加州大学伯克利分校和美国能源部联合基因组研究所(JGI)的科学家们将冠轮动物