软件所青联举办“大数据”交流研讨会

研讨交流 3月7日下午,由中科院软件研究所青年联合会和软件所团委主办的“大数据”交流研讨会举行。本次交流研讨会旨在通过头脑风暴、聚焦和研讨的方式促进青年科技工作者在大数据领域的相互交流,分享经验与资源,推动大数据领域的学科交叉与合作。来自软件所多个部门的20余位青年职工参加了研讨。研讨会由软件所青年联合会副主席杨达主持。 参会人员分别介绍了对大数据的看法,以及正在从事或希望从事的与大数据相关的研究,包括:软件用户行为数据挖掘以及淘宝网合作数据挖掘的工作;大数据在自然语言处理、实体关系抽取方面研究;智慧城市检索与数据库建设方面研究;交通数据、物联网数据分析挖掘方面研究;物联网传感时效性数据分析、异常识别方面研究;软件过程数据挖掘与软件质量预测方面研究;大数据可视分析和数据关系发掘方面研究;非结构化数据处理,大规模视频数据自动分析处理技术方面研究;大数据相关流程控制方面研究;大数据关系挖掘、自动推理方面研究;......阅读全文

中国BIGD跻身国际生物组学数据库

  测序技术的发展将生命科学领域带入组学时代,海量的数据产出成为常态。组学是将基因、蛋白及代谢物等生物分子以整体为单位进行系统性的研究,基因组学、蛋白质组学和代谢物组学等相应产生。相较于此前以个体为单位的研究,组学最主要的特征就是大数据。随着组学数据的产出,搭建组学数据库,实现海量信息的存储、整合及

上海有机所推出含氟试剂数据库

有机氟化合物由于独特的理化和生物性能,在医药、农药、先进材料等领域发挥作用。含氟试剂是发展有机氟化合物合成方法的基础,也是氟化学领域发展的基石。然而,含氟试剂的结构、性质、功能等信息分散于文献中,不便于合成化学家查找和使用。因此,亟需专业平台来全面了解和积累含氟试剂的结构、性质、功能等信息。近日,中

化学键能数据库iBonD在京发布

  3月15日,清华大学基础分子科学中心和南开大学元素有机化学国家重点实验室程津培教授研究组在京发布了国际上首个涵盖全面、数据可靠、使用快捷方便、专业权威的网络版化学键能数据库iBonD1.0版。  键能是化学领域中最基础参数之一,因该参数直接反映出化合物的稳定性以及判断化学反应是否能发生,从而成为

天津工生所举行TotalPatentZL数据库培训

  为提高TotalPatent数据库在科研中的实际使用效果,7月13日,中科院天津工业生物技术研究所信息资源中心特邀LexisNexis北方区培训讲师岳亭为职工和研究生进行TotalPatent数据库培训。   岳亭介绍了TotalPatent数据库的内容、功能及检索方法,从

中国盐湖资源与环境科学数据库建成

  9日,中国科学院青海盐湖研究所历时6年建成的中国盐湖资源与环境科学数据库通过科技部验收,这也是中国唯一数据量最大的盐湖资源与环境科学基础数据共享系统。           盐湖资源是中国西部地区特色资源之一,也是中国具有相对国际优势的无机矿产资源,其中的钾、锂、硼、铷、铯等资源

英政府设数据库保留无罪者DNA

  据《自然》网站报道,今年早些时候,英国政府曾计划将无罪的普通人的DNA保留在其大型公安数据库中,一时间引起舆论纷纷。欧洲人权法庭后来裁决,无罪者的DNA不应该被保留。   近日据英国媒体报道,从一些泄露出来的电子邮件得知,英国政府仍然决定保留无罪者的DNA,但时间不是之前所称的12年,而是6年

武汉将建温室气体排放因子数据库

  武汉碳减排协会今天发布消息称,作为国家确定的7个碳排放权交易试点之一的武汉碳交易系统今年内将全面上线。   武汉碳减排协会会长程致舜说,交易系统技术层面的准备已经完成,不同物品在各环节的碳排放量都可以清楚地查询到。   据介绍,根据与法国波尔多市签署的友城合作协议,一个中法温室气体排放试点评

“中国科学引文数据库”将面向全球推出

中国科学院国家科学图书馆近日与美国汤姆森科技信息集团共同宣布,将联手向全球推出“中国科学引文数据库”(CSCD),该数据库将依托ISI Web of Knowledge平台,让全世界更多的科研人员了解中国的科研发展及动态。 “中国科学引文数据库”由中国科学院历时20年组织研发,作为国内首个引文数据库

法律纠纷延迟大型毒性数据库启动

  研究人员表示,一个包含近万种化学物质的大型健康风险数据库或将让预测此前不存在任何数据的千万种消费化学品的毒性变得更加容易。但相关法律争议却意味着,他们不能像希望的那样公开这一数据库。 一个包含近万种化学物质的药物毒性数据库或能减少动物安全测试的需求。  “这个数据库具有能够挽救数百万动物的潜力

各种模式生物必需基因在线数据库

Essential Genes are the genes that are indispensable to sustain cellular life. The functions encoded by essential genes are considered as a foundation

欧盟酒精饮料地理标志进入公共数据库

  欧委会官网7月26日消息。公共数据库“eAmbrosia -欧盟地理标志注册”于2019年4月推出,现包含了在欧盟注册的烈酒地理标志(GIs)。可获取信息包括烈酒地理标志的应用、发布或注册状态,以及它们受到官方保护的法律依据。eAmbrosia的设计目标是成为欧盟地理标志(EU GIs)的一站式

欧盟酒精饮料地理标志进入公共数据库

  欧委会官网7月26日消息。公共数据库“eAmbrosia -欧盟地理标志注册”于2019年4月推出,现包含了在欧盟注册的烈酒地理标志(GIs)。可获取信息包括烈酒地理标志的应用、发布或注册状态,以及它们受到官方保护的法律依据。eAmbrosia的设计目标是成为欧盟地理标志(EU GIs)的一站式

全球最大癌症基因数据库发布

  美国国家癌症研究所(NCI)科学家发布了有史以来规模最大的癌症相关基因变异数据库,为研究者们提供了迄今为止最全面的方式,搞清楚如何将治疗药物靶向疾病。   周一NCI在一份声明中称,基于基因组学研究的新数据库,将对全球开放获取,预计将有助于研究人员加快新药的开发,同时能够更

中国盐湖资源与环境科学数据库建成

  9日,中国科学院青海盐湖研究所历时6年建成的中国盐湖资源与环境科学数据库通过科技部验收,这也是中国唯一数据量最大的盐湖资源与环境科学基础数据共享系统。  盐湖资源是中国西部地区特色资源之一,也是中国具有相对国际优势的无机矿产资源,其中的钾、锂、硼、铷、铯等资源成分关系国家的资源安全和战略安全,对

首个CRISPR/Cas9靶序列数据库

  近期,来自美国国立卫生研究院和瑞典乌普萨拉大学的研究人员,在国际著名学术期刊《Nucleic Acids Research》上发表的一项研究中,首次提出了一个已在斑马鱼中经过实验验证的CRISPR/Cas9靶序列数据库。  CRISPR及CRISPR相关蛋白(Cas9),是在古细菌和细菌中发现的

研究发布大豆多维组学数据库SoyOmics

  大豆(Glycine max (L.) Merr.)是重要的粮油作物之一,其产量提升、品质改进关乎全球人口的需求和利益。高通量测序技术的发展促使大豆组学研究不断深入。实现大豆多维组学数据的整合分析,将会为大豆遗传育种提供有力支持。  近日,中国科学院遗传与发育生物学研究所田志喜团队联合北京基因组

基因组所完成开发RiceWiki数据库

  近日,中国科学院北京基因组研究所章张研究员课题组与北京理工大学、中国林业科学研究院及华中农业大学合作开发完成RiceWiki数据库。该数据库是基于维基百科的水稻基因信息平台,是可编辑且内容公开的公众注释系统。研究成果在Nucleic Acids Research杂志发表。   水稻是人类重

“中医药临床证据数据库”正式启动

  4月22日,中医药临床证据数据库”启动仪式在杭州举行。国家食品药品监督管理局原副局长任德权、中国工程院院士、天津中医药大学校长张伯礼、李兰娟院士、李幼平教授、牛津大学临床实验中心和流行病学研究中心主任、牛津大学中国项目主任陈铮明教授及出席第二届循证中医药学国际论坛大会的数百名代表共同参与见证。中

我国建成污染源信息数据库

  在召开的“全国污染源普查总结表彰电视电话会议”上,环保部部长周生贤说,首次全国污染源普查进行了规模空前的入户登记、调查核实,全面掌握了我国污染源排放的基本情况,建立了统一的全国污染源信息数据库,完善了环境统计方式方法等。   “普查成果来之不易,需把成果转化好、应用好。”周生贤强

分析数据的处理——可疑数据的取舍

1. Q-检验法 (3~10次测定适用,且只有一个可疑数据)  (1) 将各数据从小到大排列:x1, x2, x3……xn ;   (2)计算  (x大-x小),  即  (xn -x1);   (3)计算    ( x可-x邻),   (4)计算舍弃商  Q 计 =ô x可-x邻ô/ xn -x1

科学家开发完成水稻多组学数据整合和信息共享数据库

  水稻不仅是世界近一半人口的主要粮食作物,同时也是一种重要的模式生物。高通量测序技术的迅速发展促进了水稻组学数据的广泛积累,使深入研究控制水稻重要农艺性状、种质资源多样性以及水稻驯化过程的机制成为可能。为此,研究人员构建了相关的水稻数据库,主要包括RAP-DB(日本农业生物资源研究所构建的水稻注释

谷歌致力于基因数据市场,整合Tute-Genomics基因数据库

  谷歌希望凭借人类基因组云端服务Google Genomics在基因组研究市场占有一席之地,如今,公司正忙于用最好的工具来填满这个工具箱。   Google Genomics是谷歌2013年推出的一项云端服务,帮助大学实验室和医院等机构将患者或科研对象的生物基因储存到云端上,推进人类基因组信息的存

数据密集型科研与数据科学研讨会在云南召开

   研讨会现场   12月4日至6日,由国际科技数据委员会CODATA中国全国委员会主办,中国科学院昆明植物研究所承办的“数据密集型科研与数据科学研讨暨CODATA中委会人才团队建设启动会”在云南腾冲召开。来自中国科学院各研究所、北京大学、北京科技大学、复旦大学、国际数据管理协会

探索塑造宇宙的无形力量-——欧几里得任务挖掘首批“数据金矿”

2025年3月,欧洲空间局(ESA)的欧几里得任务发布了首批勘测数据,为科学界揭开了深空区域的壮丽景象。此次发布的数据以三幅马赛克图的形式呈现,覆盖了广阔的天空区域,展示了数十万个形状和大小各异的星系,并首次对380000多个星系以及500个引力透镜候选者进行了分类调查。ESA科学主任卡罗尔·蒙代尔

应用风向风速仪深入挖掘气象大数据应用潜力

当前,随着特色农业、精准农业、设施农业的深入推进,农业领域种植结构发生了重大的调整,种植方式在不断转变,种植的规模和集约化程度都在不断增加,此时要确保农业稳产高产,做好农业气象灾害的监测预报工作是很要必要的。应用风向风速仪等专业的农业气象仪器来进行气象环境的监测和数据采集,可以进一步深入挖掘气象大数

美国立卫生研究院投巨资奖励大数据挖掘

   ENIGMA项目将收集数千张大脑图像。  为了驯服生物实验室辛苦得出的数据洪流,美国国立卫生研究院(NIH)近日宣布,今年投资3200万美元设立一个奖项,以推动研究人员开发分析和使用生物学大数据库的方法。  该奖项出自NIH去年启动的大数据知识(BD2K)创新计划。NIH认为应当投入更多资源帮

GEN:大数据挖掘对癌症治疗的四大影响

  2016年1月在瑞士达沃斯召开的世界经济论坛上的一个panel讨论中,美国副总统Joe Biden当场要求临床医生和研究者举例表示人类在抗击癌症中突破的障碍。当几个重要话题浮现时,最重要的议题是“大数据”,具体而言,即“大数据”的收集、分析和应用。  研究者表示:“大数据”是有效的,这是因为有重

微生物领域数据库及其分析系统建设研究取得进展

中国科学院计算机网络信息中心大数据技术与应用发展部与中科院微生物研究所等,在微生物领域数据库及其分析系统建设方面取得新进展,提出了一种利用语义网技术构建知识图谱的方法,可将冠状病毒相关的毒株、基因组、蛋白序列、蛋白结构、抗体、文献和ZL等多源异构数据映射至资源描述框架(RDF),并构建了基于语义网框

门上希和夫:深耕环境物质分析-AIQS数据库应用更广泛

  分析测试百科网讯 2017年3月31日,由中国环境科学学会环境化学分会主办、中国科学院生态环境研究中心和岛津企业管理(中国)有限公司共同协办的“全国环境行业专家高峰论坛”在杭州城中香格里拉大酒店召开。在本次会议上,北九州市立大学/环境技术研究所的门上希和夫教授带来《日本环境中化学物质的分析方法》

分析数据的处理——分析数据的显著性检验

1. 平均值()与标准值(m)之间的显著性检验 —— 检查方法的准确度                   (20)若     t计 ³ t0.95, n  则 与 m 有显著性差异(方法不可靠)             t计 < t0.95, n  则 与 m 无显著性差异(方法可靠)2. 两组平