一种基于数据挖掘的计算机自动识别饱和脂肪烃的方法

《分析化学》2008年05期 一种基于数据挖掘的计算机自动识别饱和脂肪烃的方法 张良晓;梁逸曾;曾茂茂;曾映旭;陈爱明;高海燕;王亚敏;吴海 通过对Nist107标准物质中饱和脂肪烃的质谱数据进行挖掘,发现了新的饱和脂肪烃的谱图特征。利用这些特征设置分步问答,使用MatLab编程实现并优化建立了自动识别饱和脂肪烃的方法。利用库内分子量小于450的标准质谱数据和本实验室测定的齿叶铁线莲(根)挥发油数据进行检验。库内检验结果表明:第一类错误(弃真错误)率为0.503%,第二类错误(存伪错误)率为0.008%。正构烷烃的误识率为0。实验数据验证结果表明:此法能准确识别饱和脂肪烃,用于识别正构烷烃时可克服因夹角余弦相似匹配中相似度接近而无法正确定性的缺点,为植物挥发成分测定、汽油样品的PONA分析和空气颗粒物中饱和脂肪烃的识别和总量的......阅读全文

生物信息分析数据挖掘

DNA芯片技术能够在基因组水平分析基因表达,检测许多基因的转录水平及在不同条件下的基因转录变化,显示反映特征组织类型、发育阶段、环境条件应答、遗传改变的基因谱。基因芯片产生了海量的数据,仅仅进行差异表达分析还远远不够,如何管理分析这些数据、从中挖掘信息已经成为利用这一技术的新的难点。芯片数据大量出现

冰岛基因公司数据挖掘计划泡汤

图片来源:基因解码公司  因采集冰岛人DNA用于发现基因和疾病之间关系而著名的基因解码公司遇到了一个棘手问题。近日,《科学》杂志报道称,冰岛负责监督数据保密性的国家机构驳回了基因解码公司的请求——该公司希望可以使用计算机方法分析该国的宗系记录,以估算28万名并未同意参与该公司的研究,

“AI+大数据”推动数据挖掘走向数智化治理

  5月20日,阿里巴巴副总裁、阿里云计算平台负责人贾扬清在媒体沟通会上表示,经过近20年的发展,人们对大数据的利用已从早期的数据挖掘进化为集数据分析、数据管理、数据协同为一体的综合治理,在这一进程中,大数据与人工智能(AI)技术的融合居功甚伟。 贾扬清提到,数字经济迅猛发展,不断丰富、增长的数

欧盟拟改革版权法促进数据挖掘

   近日,欧盟委员会宣布了一个被期待已久的提案,帮助研究人员更容易地从研究论文中获得数据。目前,软件能快速分析数百万篇在线文章和数据集。科学家希望这种文本和数据挖掘技术(TDM)能揭露科学知识模型和产生新假设。  但该领域一直受版权法的限制。在欧盟,这种数据挖掘工作需要获得论文版权所有者的许可。为

公众环保投诉大数据挖掘研究取得进展

  随着我国城市化水平不断提高,居民对生活品质诉求日益增强,公众环境意识显著提升,环境保护投诉的数量随之增加。区别于自上而下的传统环境监测网络,环保投诉直接来自于公众,具有快速直接反应城市环境问题、包含丰富的环境信息等特点。目前,网络投诉这类非结构化的文本数据多采用人工处理,效率较低,缺乏快速和自动

基因大数据深度挖掘,我们将面临挑战

  在日前于北京召开的第四届全国功能基因组学高峰论坛上,众多与会专家就基因技术发展方向及面临的机遇与挑战进行了深入交流。作为一种新型基因检测技术,基因测序能从血液或唾液中分析测定基因全序列,预测罹患多种疾病的可能性、个体的行为特征及行为合理性。基因测序技术能锁定个人病变基因,予以提前预防和治疗。  

2014年国际数据挖掘大会在深圳召开

  12月15日上午,由中科院深圳先进技术研究院参与主办的第十四届国际电气电子工程师计算机协会数据挖掘国际会议在深圳召开。中国工程院院士、国家自然科学基金委副主任高文,深圳市副市长陈彪,中科院深圳先进院院长樊建平等出席。  据悉,这是该项顶级会议首次登陆中国大陆举办,吸引了海内外500多名专家参会。

我国学者成功挖掘和识别哺乳动物环形RNA功能

  2019年3月19日,国际学术期刊Cell Reports 在线发表了中国科学院北京生命科学研究院计算基因组学实验室赵方庆团队题为“Expanded expression landscape and prioritization of circular RNAs in mammals”的最新研究

肿瘤基因专家致力挖掘单细胞大数据潜能

  近年来,随着测序技术的迅猛发展,单细胞测序技术已逐渐走入人们视野。2013年,单细胞测序技术成为《自然》评选的“Method of the Year”。大多数的基于NGS的基因检测,都是在大量细胞宏观水平上,对整个细胞群进行遗传分析。单细胞测序技术则是在单个细胞的水平上,对其遗传物质进行检测,从

源资信息科技:数据挖掘和通路分析专家

  2010年全国质谱大会暨第三届世界华人质谱研讨会于2010年7月30日~8月1日期间在吉林长春顺利召开,源资信息科技(上海)有限公司在此次大会上主要向与会者介绍了高级化学分析软件(ACD/labs)及系统生物学中的GeneGo软件,引起了与会专家、参会代表及各大仪器厂商的极大兴趣。

基因测序:数据深度挖掘和解读难题待解

  作为一种新型基因检测技术,基因测序能够从血液或唾液中分析测定基因全序列,预测罹患多种疾病的可能性,个体的行为特征及行为合理。基因测序技术能锁定个人病变基因,提前预防和治疗。正因如此,今年华大基因的上市,就引发了资本市场的热烈追捧。  在日前在京召开的第四届全国功能基因组学高峰论坛上,与会的众多专

基因测序:数据深度挖掘和解读难题待解

   作为一种新型基因检测技术,基因测序能够从血液或唾液中分析测定基因全序列,预测罹患多种疾病的可能性,个体的行为特征及行为合理。基因测序技术能锁定个人病变基因,提前预防和治疗。正因如此,今年华大基因的上市,就引发了资本市场的热烈追捧。  在日前在京召开的第四届全国功能基因组学高峰论坛上,与会的众多

烷烃的命名

  碳链最长称某烷,靠近支链把号编。简单在前同相并,其间应划一短线。 解释: 1、碳链最长称某烷:意思是说选定分子里最长的碳链做主链,并按主链上碳原子数目称为"某烷"。 2、靠近支链把号编:意思是说把主链里离支链较近的一端作为起点,用1、2、3……等数字给主链的各碳原子编号定位以确

国家基因组科学数据中心公布数据资源整合挖掘体系

  近日,国家基因组科学数据中心在国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表题为Database Resources of the National Genomics Data Center in 2020 的文章,以整体形式介绍基因组数据资源整合与挖掘体系建设

单细胞数据挖掘算法方面取得新进展

图 SEVtras高效识别单细胞转录组数据中的胞外小囊泡  在国家自然科学基金项目(批准号:32025009、32130020等)资助下,中国科学院北京生命科学研究院赵方庆团队在单细胞数据挖掘算法方面取得新进展,研究成果以“SEVtras识别单细胞转录组中液滴分辨率的胞外小囊泡(SEVtras de

人工智能与数据挖掘驱动的肿瘤新药研发

  人工智能作为一种旨在模拟、延伸和扩展人的智能的科学,人工智能正在以前所未有的广度和越来越快的速度改变着世界的面貌。而在普瑞基准创始人季序我和梁晗看来,人工智能可以帮助我们更好地回答那些医学中最为本质的问题,对于新药研发、临床诊疗和医学基础研究,都有着不可估量的价值。 道路  在癌症诊治的过程中,

探索塑造宇宙的无形力量-——欧几里得任务挖掘首批“数据金矿”

2025年3月,欧洲空间局(ESA)的欧几里得任务发布了首批勘测数据,为科学界揭开了深空区域的壮丽景象。此次发布的数据以三幅马赛克图的形式呈现,覆盖了广阔的天空区域,展示了数十万个形状和大小各异的星系,并首次对380000多个星系以及500个引力透镜候选者进行了分类调查。ESA科学主任卡罗尔·蒙代尔

应用风向风速仪深入挖掘气象大数据应用潜力

当前,随着特色农业、精准农业、设施农业的深入推进,农业领域种植结构发生了重大的调整,种植方式在不断转变,种植的规模和集约化程度都在不断增加,此时要确保农业稳产高产,做好农业气象灾害的监测预报工作是很要必要的。应用风向风速仪等专业的农业气象仪器来进行气象环境的监测和数据采集,可以进一步深入挖掘气象大数

美国立卫生研究院投巨资奖励大数据挖掘

   ENIGMA项目将收集数千张大脑图像。  为了驯服生物实验室辛苦得出的数据洪流,美国国立卫生研究院(NIH)近日宣布,今年投资3200万美元设立一个奖项,以推动研究人员开发分析和使用生物学大数据库的方法。  该奖项出自NIH去年启动的大数据知识(BD2K)创新计划。NIH认为应当投入更多资源帮

GEN:大数据挖掘对癌症治疗的四大影响

  2016年1月在瑞士达沃斯召开的世界经济论坛上的一个panel讨论中,美国副总统Joe Biden当场要求临床医生和研究者举例表示人类在抗击癌症中突破的障碍。当几个重要话题浮现时,最重要的议题是“大数据”,具体而言,即“大数据”的收集、分析和应用。  研究者表示:“大数据”是有效的,这是因为有重

深圳先进院发表数据聚类挖掘技术最新研究成果

  近日,中国科学院深圳先进技术研究院高性能计算研究中心客座研究生魏丹的研究成果A novel hierarchical clustering algorithm for gene sequences发表在BMC Bioinformatics期刊,并被SCI检索(006EI)。   

城市环境所等构建水环境动态数据挖掘框架

  水环境动态性是环境科学和生态学在水域生态系统的主要交叉研究主题之一。根据水域生态系统边界特征,水环境动态性关联机制包括外部和内部两方面,一是从环境科学角度看水环境动态性受到系统外部因素的驱动,例如流域内气候水文和人类活动叠加作用下水体环境变化;二是从生态学角度看水环境动态性与系统内部水生生物之间

人工智能“牵手”医疗产业-挖掘数据价值-推动基础研究

   当人工智能与医疗产业相结合,将会对社会发展带来怎样的改变?日前,智慧自主医疗系统联合研究中心在清华大学启动,有业界人士表示,医疗数据的积累和梳理是智慧医疗的基础,当前我国医疗数据不完整、利用率低、系统化弱的现状亟待重视。通过对医疗信息化的深度挖掘,能够提高资源资金分配效率,帮助医生找到患病的因

生物大数据挖掘寻找控制蛋白质死亡之门的钥匙

  蛋白质是自然界中最神秘的物质之一,几乎所有的生命活动都有它的身影。正如人有生死,生物体内的蛋白质也有出生与死亡。蛋白质的出生是一个精准的从脱氧核糖核酸(DNA)转录得到的信使核糖核酸(mRNA)进而翻译合成蛋白质的过程。当蛋白质的功能使命完成后,需要被及时降解掉(死亡),否则,蛋白质过早或者过晚

Benchmarker一种可靠的对GWAS数据进行挖掘的算法

  全基因组关联研究(GWAS)针对大量人群寻找有助于常见的多基因特征(如身高或肥胖)的基因。这些综合性研究经常发现大量微小的遗传变异,这些变异在高龄,肥胖等人群中更常发生。但这种相关性并不一定意味着因果关系的存在。  虽然有许多计算算法可用于帮助提取GWAS结果,但很难知道选择哪一种。研究人员在《

植物多组学数据驱动的上下游调控因子挖掘平台发布

  9月8日,The Plant Journal 期刊在线发表中国科学院分子植物科学卓越创新中心/植物生理生态研究所张一婧研究组搭建的挖掘植物基因及基因组位点上下游调控因子的网络平台,论文题为Plant Regulomics: A Data‐driven Interface for Retrievi

单细胞数据细胞分类与功能挖掘的基因分析法介绍

  接触过单细胞转录组数据的小伙伴们都知道,数据的核心结果在于根据每个细胞的基因表达数据,来对细胞进行分群分类。现有通用的分析思路如下:首先根据转录组稀疏矩阵,通过计算和分析,找到不同的细胞Cluster,并找到每一类集群的Marker基因。根据已有对细胞特定Marker基因的认识,来对细胞可能的集

中科院成立大数据挖掘与知识管理重点实验室

  3月20日上午,中国科学院大数据挖掘与知识管理重点实验室在京举行了揭牌仪式。中科院党组副书记方新到会宣读了中科院关于成立大数据挖掘与知识管理重点实验室的通知。  该重点实验室依托于中国科学院大学组建,聚集了中科院虚拟经济与数据科学研究中心和国科大数学科学学院、计算机与控制学院、管理学院的相关人才

单细胞数据细胞分类与功能挖掘的基因分析法介绍

接触过单细胞转录组数据的小伙伴们都知道,数据的核心结果在于根据每个细胞的基因表达数据,来对细胞进行分群分类。现有通用的分析思路如下:首先根据转录组稀疏矩阵,通过计算和分析,找到不同的细胞Cluster,并找到每一类集群的Marker基因。根据已有对细胞特定Marker基因的认识,来对细胞可能的集群进

单细胞数据细胞分类与功能挖掘的基因分析法介绍

  接触过单细胞转录组数据的小伙伴们都知道,数据的核心结果在于根据每个细胞的基因表达数据,来对细胞进行分群分类。现有通用的分析思路如下:首先根据转录组稀疏矩阵,通过计算和分析,找到不同的细胞Cluster,并找到每一类集群的Marker基因。根据已有对细胞特定Marker基因的认识,来对细胞可能的集