软件所青联举办“大数据”交流研讨会

研讨交流 3月7日下午,由中科院软件研究所青年联合会和软件所团委主办的“大数据”交流研讨会举行。本次交流研讨会旨在通过头脑风暴、聚焦和研讨的方式促进青年科技工作者在大数据领域的相互交流,分享经验与资源,推动大数据领域的学科交叉与合作。来自软件所多个部门的20余位青年职工参加了研讨。研讨会由软件所青年联合会副主席杨达主持。 参会人员分别介绍了对大数据的看法,以及正在从事或希望从事的与大数据相关的研究,包括:软件用户行为数据挖掘以及淘宝网合作数据挖掘的工作;大数据在自然语言处理、实体关系抽取方面研究;智慧城市检索与数据库建设方面研究;交通数据、物联网数据分析挖掘方面研究;物联网传感时效性数据分析、异常识别方面研究;软件过程数据挖掘与软件质量预测方面研究;大数据可视分析和数据关系发掘方面研究;非结构化数据处理,大规模视频数据自动分析处理技术方面研究;大数据相关流程控制方面研究;大数据关系挖掘、自动推理方面研究;......阅读全文

生物信息分析数据挖掘

DNA芯片技术能够在基因组水平分析基因表达,检测许多基因的转录水平及在不同条件下的基因转录变化,显示反映特征组织类型、发育阶段、环境条件应答、遗传改变的基因谱。基因芯片产生了海量的数据,仅仅进行差异表达分析还远远不够,如何管理分析这些数据、从中挖掘信息已经成为利用这一技术的新的难点。芯片数据大量出现

期刊数据库更新

图片来源:B. DOUTHITT/SCIENCE 期刊影响因子多年来备受批评,认为其扭曲了学术出版。近日,美国宾夕法尼亚州克拉尼特分析公司推出了其期刊引用报告(JCR)数据库的更新版本,并表示它提供了理解期刊特征和受众的背景信息。 影响因子代表期刊文章的引用次数,除以其两

期刊数据库更新

图片来源:B. DOUTHITT/SCIENCE 期刊影响因子多年来备受批评,认为其扭曲了学术出版。近日,美国宾夕法尼亚州克拉尼特分析公司推出了其期刊引用报告(JCR)数据库的更新版本,并表示它提供了理解期刊特征和受众的背景信息。 影响因子代表期刊文章的引用次数,除以其两年间发表

源资信息科技:数据挖掘和通路分析专家

  2010年全国质谱大会暨第三届世界华人质谱研讨会于2010年7月30日~8月1日期间在吉林长春顺利召开,源资信息科技(上海)有限公司在此次大会上主要向与会者介绍了高级化学分析软件(ACD/labs)及系统生物学中的GeneGo软件,引起了与会专家、参会代表及各大仪器厂商的极大兴趣。

“AI+大数据”推动数据挖掘走向数智化治理

  5月20日,阿里巴巴副总裁、阿里云计算平台负责人贾扬清在媒体沟通会上表示,经过近20年的发展,人们对大数据的利用已从早期的数据挖掘进化为集数据分析、数据管理、数据协同为一体的综合治理,在这一进程中,大数据与人工智能(AI)技术的融合居功甚伟。 贾扬清提到,数字经济迅猛发展,不断丰富、增长的数

核酸数据库的概念

中文名称核酸数据库英文名称nucleic acid data bank定  义DNA、RNA序列的资料库,主要包括已知序列名称、DNA或RNA全序列及其特性,如启动区、起始和终止密码的位置、编码区、限制酶切位点以及推导的翻译产物蛋白质序列等。应用学科生物化学与分子生物学(一级学科),方法与技术(二级

GenBank数据库概述(一)

1. GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。是NIH遗传序列数据库,一个所有可以公开获得的DNA序列的注释过的收集。GenBank同日本和欧洲分子生物学实验室的DNA数据库共同构成了国际核酸序列数据库合作。唯一人类基因序列集合(UniGene),人类基因组基因图

GenBank数据库概述(四)

NCBI站点地图---其他基因组数据介绍:1、 小鼠基因组 1) 小鼠基因组资源向导 :把从各个中心来的各种小鼠相关的资源整合在一起,包括序列,图谱,和克隆信息以及指向小鼠种系和突变资源的指针。 2) 小鼠基因组测序:小鼠基因组计划的测序进展,HTG序列contigs(可以用大小和染色体号来浏览)由

GenBank数据库概述(三)

结构: 1、 结构主页 — 关于NCBI结构小组的一般信息和他们的研究计划,另外也可以访问分子模型数据库(MMDB)和用来搜索和显示结构的相关工具。 2、 MMDB:分子模型数据库 — 一个关于三维生物分子结构的数据库,结构来自于X-ray晶体衍射和NMR色谱分析。MMDB是来源于Brook

GenBank数据库概述(二)

FTP GenBank and Daily Updates:1. GenBank普通文件格式 — 参见GenBank记录样本和在GenBank公布通知中的详细描述,下载大多数最近的完全公告和日常积累或非积累更新数据。 2. ASN.1格式 — 摘要句法记号1,国际标准组织(ISO)数据表示格式,下载

研究开发表观组关联分析数据库

  近日,由中国科学院北京基因组研究所国家基因组科学数据中心开发的人类表观组关联分析数据库EWAS Data Hub正式上线。该项研究成果以EWAS Data Hub: a resource of DNA methylation array data and metadata 为题在国际学术期刊《

冰岛基因公司数据挖掘计划泡汤

图片来源:基因解码公司  因采集冰岛人DNA用于发现基因和疾病之间关系而著名的基因解码公司遇到了一个棘手问题。近日,《科学》杂志报道称,冰岛负责监督数据保密性的国家机构驳回了基因解码公司的请求——该公司希望可以使用计算机方法分析该国的宗系记录,以估算28万名并未同意参与该公司的研究,

QP2010农药数据库

Shimadzu气质联用的多种农药库 QP2010农药数据库

汉语语言产生数据库发表

原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517976.shtm

生命科学常用数据库

The NationalCenter for Biotechnology Information. http://www.ncbi.nlm.nih.gov/National Center for GenomeResources.http://www.ncgr.org/ncgr/ncgr.html T

美国更新食品掺假数据库

  9月5日食品安全新闻网消息,美国药典委员会(USP)更新了食品掺假数据库(FFD2.0)。食品掺假数据库主要为行业、监管部门以及消费者预防和应对食品掺假事件发生提供技术支持。最新的FFD2.0涵盖了科研文献、媒体信息、食品监管记录、司法裁决记录中涉及食品掺假事件的各种信息。新版食品掺假数据库将于

拉曼光谱免费数据库

拉曼数据库在物质鉴定和化学分析方面具有重要的作用。关于拉曼数据,我们一般会关注两个峰的位置,分别是D峰和G峰。D峰和G-峰均是C原子晶体的 Raman特征峰,分别在1350cm-1和 1580 cm-1附近,D峰反应的是晶格的碳缺陷,G峰反应的是材料的碳化程度。I(D) / I(G) 是 D峰和G峰

2014年国际数据挖掘大会在深圳召开

  12月15日上午,由中科院深圳先进技术研究院参与主办的第十四届国际电气电子工程师计算机协会数据挖掘国际会议在深圳召开。中国工程院院士、国家自然科学基金委副主任高文,深圳市副市长陈彪,中科院深圳先进院院长樊建平等出席。  据悉,这是该项顶级会议首次登陆中国大陆举办,吸引了海内外500多名专家参会。

欧盟拟改革版权法促进数据挖掘

   近日,欧盟委员会宣布了一个被期待已久的提案,帮助研究人员更容易地从研究论文中获得数据。目前,软件能快速分析数百万篇在线文章和数据集。科学家希望这种文本和数据挖掘技术(TDM)能揭露科学知识模型和产生新假设。  但该领域一直受版权法的限制。在欧盟,这种数据挖掘工作需要获得论文版权所有者的许可。为

基因大数据深度挖掘,我们将面临挑战

  在日前于北京召开的第四届全国功能基因组学高峰论坛上,众多与会专家就基因技术发展方向及面临的机遇与挑战进行了深入交流。作为一种新型基因检测技术,基因测序能从血液或唾液中分析测定基因全序列,预测罹患多种疾病的可能性、个体的行为特征及行为合理性。基因测序技术能锁定个人病变基因,予以提前预防和治疗。  

公众环保投诉大数据挖掘研究取得进展

  随着我国城市化水平不断提高,居民对生活品质诉求日益增强,公众环境意识显著提升,环境保护投诉的数量随之增加。区别于自上而下的传统环境监测网络,环保投诉直接来自于公众,具有快速直接反应城市环境问题、包含丰富的环境信息等特点。目前,网络投诉这类非结构化的文本数据多采用人工处理,效率较低,缺乏快速和自动

国家基因组科学数据中心公布数据资源整合挖掘体系

  近日,国家基因组科学数据中心在国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表题为Database Resources of the National Genomics Data Center in 2020 的文章,以整体形式介绍基因组数据资源整合与挖掘体系建设

英国启动细胞产品试验数据库

  英国细胞治疗产品行业现在拥有了一个数据库,该数据库囊括了该国所有正在进行之中的临床试验项目。建立这个数据库的目的是要扩大研究合作,将更多的早期试验推进到后期开发阶段。   囊括21个研究项目   这个数据库包括21个细胞治疗研究项目,由英国细胞疗法中心(CTC)发起,并得到了英国技术战略委员

盐湖资源环境信息数据库建成

  日前,中国科学院青海盐湖研究所在科技部基础专项、中科院“百人计划”等项目的支持下,立足柴达木盆地盐湖资源优势,历时6年建成的盐湖资源与环境科学基础数据共享数据库正式通过科技部验收。这标志着目前我国数据量最大的盐湖资源与环境科学基础数据共享系统正式建成,并对基于科学数据的盐湖资源合理利用、长远决策

国内首个向量数据库标准发布

  11月15日,中国信通院联合腾讯云计算(北京)有限责任公司、中移(苏州)软件技术有限公司等多家企业共同编制的、国内首个向量数据库标准正式发布,将为我国向量数据库研发、测试及选型提供重要参考,推动我国人工智能产业高质量发展。  向量数据能够从多个维度记录事物特征,是人工智能时代的基础数据形式。人工

“敦煌遗书数据库”建成投用

  3月10日,在十四届全国人大二次会议甘肃代表团开放团组活动上,敦煌研究院党委委员、保护研究部副部长汪万福代表介绍,该院“流失海外敦煌文物数字化复原项目”迈出实质步伐,“敦煌遗书数据库”业已建成投用。  汪万福说,敦煌研究院还组建了甘肃省敦煌文物保护研究中心,建成国内首座文物保护领域多场耦合实验室

siRNA数据库与设计工具

siRNA DatabaseSearchable database of Silencer ™ Validated and Pre-designed siRNAs to >34,000 human, mouse, and rat targets. All siRNAs in the database

植物生物学研究数据库

实验概要植物生物学研究数据库实验步骤http://bioinf.scri.sari.ac.uk/cgi-bin/plant_snorna/home 英国 Top 植物种的snoRNA基因数据库。 综合 http://bioinformatics.psb.ugent.be/webtools/plant

生命科学国外重要数据库

EMBL数据库结构EMBL数据库的基本单位也是序列条目,包括核甘酸碱基排列顺序和注释两部分。序列条目由字段组成,每个字段由标识字起始,后面为该字段的具体说明。有些字段又分若干次子字段,以次标识字或特性表说明符开始,最后以双斜杠“//”作本序列条目结束标记。条目的关键字包括ID(序列名称),DE(序列

北京正在建罕见病数据库

  今日,2014第三届中国罕见病高峰论坛在京举办。北京医学会罕见病分会副主任王琳在论坛中透露,北京正在建立罕见病病例登记系统和病人数据库,尝试单病种追踪调研和罕见病诊治地图的设置。  王琳介绍,中国目前所应用的罕见病相关数据都是基于欧盟、美国等地所提供的资料。“而国内到现在也没有对本国进行过罕见病