刘禹:大数据有大智慧
除了“物联网”和“云计算”,IT业又出现了一个新名词——大数据。如今,大数据甚至引起了工商界和金融界的高度关注,人们认为大数据将为数据应用和决策支持提供有效帮助,成为物联网和云计算内在的灵魂和必然的发展趋势。 大数据目前尚没有统一的定义,通常被认为是一种数据量很大、数据形式多样化的非结构化数据。 这里我们先弄清楚几个概念,结构化数据、半结构化数据和非结构化数据。结构化数据可以在关系数据库中找到,多年来一直主导着IT应用;半结构化数据包括电子邮件、文字处理文件以及大量发布在网络上的新闻等,以内容为基础,这也是谷歌和百度存在的理由;而非结构化数据广泛存在于社交网络、物联网、电子商务之中。伴随着社交网络、移动计算和传感器等新技术不断产生,有报告称,超过85%的数据属于非结构化数据。 很多人相信这些庞大的异构数据中蕴含着巨大财富——企业如果能在这些非结构化数据中挖掘知识并与业务融合......阅读全文
研究开发表观组关联分析数据库
近日,由中国科学院北京基因组研究所国家基因组科学数据中心开发的人类表观组关联分析数据库EWAS Data Hub正式上线。该项研究成果以EWAS Data Hub: a resource of DNA methylation array data and metadata 为题在国际学术期刊《核
中国盐湖资源与环境科学数据库建成
9日,中国科学院青海盐湖研究所历时6年建成的中国盐湖资源与环境科学数据库通过科技部验收,这也是中国唯一数据量最大的盐湖资源与环境科学基础数据共享系统。 盐湖资源是中国西部地区特色资源之一,也是中国具有相对国际优势的无机矿产资源,其中的钾、锂、硼、铷、铯等资源成分关系国家的资源安全和战略安全,对
研究发布大豆多维组学数据库SoyOmics
大豆(Glycine max (L.) Merr.)是重要的粮油作物之一,其产量提升、品质改进关乎全球人口的需求和利益。高通量测序技术的发展促使大豆组学研究不断深入。实现大豆多维组学数据的整合分析,将会为大豆遗传育种提供有力支持。 近日,中国科学院遗传与发育生物学研究所田志喜团队联合北京基因组
我国建成污染源信息数据库
在召开的“全国污染源普查总结表彰电视电话会议”上,环保部部长周生贤说,首次全国污染源普查进行了规模空前的入户登记、调查核实,全面掌握了我国污染源排放的基本情况,建立了统一的全国污染源信息数据库,完善了环境统计方式方法等。 “普查成果来之不易,需把成果转化好、应用好。”周生贤强
基因组所完成开发RiceWiki数据库
近日,中国科学院北京基因组研究所章张研究员课题组与北京理工大学、中国林业科学研究院及华中农业大学合作开发完成RiceWiki数据库。该数据库是基于维基百科的水稻基因信息平台,是可编辑且内容公开的公众注释系统。研究成果在Nucleic Acids Research杂志发表。 水稻是人类重
英政府设数据库保留无罪者DNA
据《自然》网站报道,今年早些时候,英国政府曾计划将无罪的普通人的DNA保留在其大型公安数据库中,一时间引起舆论纷纷。欧洲人权法庭后来裁决,无罪者的DNA不应该被保留。 近日据英国媒体报道,从一些泄露出来的电子邮件得知,英国政府仍然决定保留无罪者的DNA,但时间不是之前所称的12年,而是6年
欧盟酒精饮料地理标志进入公共数据库
欧委会官网7月26日消息。公共数据库“eAmbrosia -欧盟地理标志注册”于2019年4月推出,现包含了在欧盟注册的烈酒地理标志(GIs)。可获取信息包括烈酒地理标志的应用、发布或注册状态,以及它们受到官方保护的法律依据。eAmbrosia的设计目标是成为欧盟地理标志(EU GIs)的一站式
欧盟酒精饮料地理标志进入公共数据库
欧委会官网7月26日消息。公共数据库“eAmbrosia -欧盟地理标志注册”于2019年4月推出,现包含了在欧盟注册的烈酒地理标志(GIs)。可获取信息包括烈酒地理标志的应用、发布或注册状态,以及它们受到官方保护的法律依据。eAmbrosia的设计目标是成为欧盟地理标志(EU GIs)的一站式
中国BIGD跻身国际生物组学数据库
测序技术的发展将生命科学领域带入组学时代,海量的数据产出成为常态。组学是将基因、蛋白及代谢物等生物分子以整体为单位进行系统性的研究,基因组学、蛋白质组学和代谢物组学等相应产生。相较于此前以个体为单位的研究,组学最主要的特征就是大数据。随着组学数据的产出,搭建组学数据库,实现海量信息的存储、整合及
上海有机所推出含氟试剂数据库
有机氟化合物由于独特的理化和生物性能,在医药、农药、先进材料等领域发挥作用。含氟试剂是发展有机氟化合物合成方法的基础,也是氟化学领域发展的基石。然而,含氟试剂的结构、性质、功能等信息分散于文献中,不便于合成化学家查找和使用。因此,亟需专业平台来全面了解和积累含氟试剂的结构、性质、功能等信息。近日,中
中国盐湖资源与环境科学数据库建成
9日,中国科学院青海盐湖研究所历时6年建成的中国盐湖资源与环境科学数据库通过科技部验收,这也是中国唯一数据量最大的盐湖资源与环境科学基础数据共享系统。 盐湖资源是中国西部地区特色资源之一,也是中国具有相对国际优势的无机矿产资源,其中的钾、锂、硼、铷、铯等资源
TPC:中国数据库性能破世界纪录
原文地址:http://news.sciencenet.cn/htmlnews/2023/3/497431.shtm
科学家开发出集合人类血液中化合物的可视化数据库!
日前,一项刊登在国际杂志Nucleic Acids Research上的研究报告中,来自日本东北大学的研究人员通过收集5000名志愿者的血液样本,开发出了集合血液代谢物的数据库,目前该数据库将免费提供给全世界的研究人员。 代谢产物和蛋白质能够控制机体内部多个生理学过程,同时还能阐明细胞和其周围
日本药企三巨头合作建立健康成人生物标志物综合数据库
日本药企三巨头武田(Takeda)、安斯泰来(Astellas)、第一三共制药(Daiichi Sankyo)近日宣布达成战略联盟,三方已签署一项研究协议,将广泛地获取并分析基于健康成人志愿者的基础性生物标志物数据,以优化并加速创新药物的开发。 生物标志物可用于患者的甄别(stratifica
蛋白合成微信学术交流之如何从数据库找合适的化合物
体系相关 A:http://biocomp.chem.uw.edu.pl/CABSdock/这个网站的结果怎么比较啊? 殷赋科技:我还没用过呢,只是在网上搜索到的。你那计算完了,有什么结果啊? A: 殷赋科技:没有打分之类的东西? A:只给了结果,但没看到这样排序
数据平台让水稻更易“读懂”-以水稻为研究对象的数据库
水稻生物学数据库众多、信息量大,但大多是生物学原始数据;国内传统种质资源数据库鲜有二次开发功能;国内缺少整合多学科数据的集成性数据库……如何从海量数据中挖掘有用信息提供给农业科研工作者,一直是个难题。中国水稻研究所鄂志国、王磊、庄杰云等创建了“国家水稻数据中心”(http://www.riced
液质方法包巡礼:全氟和多氟烷基化合物-PFAS-MRM-数据库
前言若要实验室分析工作得心应手,除了性能优异的硬件,功能强大的软件也是尤为重要。作为提高工作效率、将分析人员从繁重的方法摸索过程中解放出来的利器,液质方法包的出现降低了质谱分析门槛、提高了实验室分析通量。液质分析方法包一般包括预先设置好的方法文件,包括LC分离条件,MS离子源参数,优化的MRM参数
从互联网到物联网-我国将拓展万亿级战略产业
从6月22日在上海开幕的2010中国国际物联网大会上了解到,物联网将成为全球信息通信行业的万亿元级新兴产业。到2020年之前,全球接入物联网的终端将达到500亿个。我国作为全球互联网大国,未来将围绕物联网产业链,在政策市场、技术标准、商业应用等方面重点突破,打造全球产业高地。 物联网
互联网“生”出个物联网-或成泄露隐私的密集地
人不在家,家里煤气泄漏了空调忘关了你也马上能知道;坐在家里,就可以知道地里某块农田的土壤是否健康……这些,就是物联网的功劳。 日前,有专家表示,只需三到五年时间,传感网(俗称物联网)就会全面进入人们的生活,改变人们的生活方式。不过,记者也了解到,物联网模式还在探索中,技术上以及信息安全方面
Nucleic-Acids-Research发布最全面的microRNA数据库
基因是蛋白质的蓝图,而microRNA可以帮助细胞决定是否要根据这些蓝图制造蛋白。研究者们常常会面临这样的问题:某个与疾病有关的基因受到哪些microRNA的调控?或者,患者体内发现的某种microRNA负责调控什么基因?这些问题的答案,可以帮助医生和研究者们操纵机体中的致病蛋白水平(尤其是癌症
大型衰老相关基因表达谱数据库建成
英国《自然·通讯》杂志30日发表的一项研究称,包括人类在内的4个物种的大型衰老相关基因表达谱数据库建成。德国科学家团队分析数据后发现,衰老相关基因的表达变化与退行性慢性病相关基因的表达变化轨迹一致,但与癌症的相反。 对衰老及衰老相关疾病的研究,一直是人类医学的难题。但随着“衰老基因”的确定,衰
DNA数据库:游走在科学与伦理的边缘
你可以抛弃你的电脑,并留下你的手机在家里,但你不能逃脱你的DNA,因为他是属于你的唯一特征,但是现在它被越来越多的贡献给了某些政府当局。 世界各国当局政府打着打击恐怖主义和犯罪的旗号,正在搜集数以百万计公民的遗传信息。以美国为代表,最高法院近期就备份了许多被捕嫌疑人的DNA数据信息。英国警
中国启动人乳头状瘤病毒数据库
中国内地每年新发宫颈癌13万多例,死亡超过3万例。目前,中国各地已陆续开展筛查宫颈癌的高危型人乳头瘤病毒分型检测,但全国尚没有系统、完整的基础数据,严重影响预防性疫苗和治疗疫苗的研发。6月5日宣告启动“中国人乳头状瘤病毒(HPV)数据库”将有望使这一问题得到解决。 由中国卫生部医药卫生科技发展
安捷伦在ASMS上发布多款软件和数据库
分析测试百科网讯 正在进行的2016美国ASMS会议上,安捷伦发布展出了一系列质谱系统、软件和技术。除了硬件之外,本次会议上安捷伦也更新了一些重要的软件工具和数据库。 安捷伦MassHunter BioConfirm 软件有了全新的药物-抗体计算器,这使得非专家级液质用户能够表征抗体
Science:全球首个活人脑细胞数据库公布
据美国《科学》杂志在线版29日消息称,艾伦脑科学研究所日前公布了全球首个活人大脑细胞数据库,该数据库信息可公开获取。在人类理解大脑的道路上,这一成就为科学家提供了深入探究人脑的重要资源,同时以前所未有的独特性,帮助医学界确定健康与患病大脑之间的不同。 2002年,微软公司共同创始人之一保罗·艾
科学家构建出中国种子性状数据库
植物性状是表征环境适应策略与资源分配模式的关键指标,为理解物种分布、群落构建及生态系统功能提供了重要基础。近年来,全球及区域尺度的植物性状数据库不断完善,推动了宏观生态学、功能生态学及生物多样性保护等领域的发展。然而,现有数据库主要聚焦于叶片等生长器官,种子、果实等繁殖器官的记录相对不足,形成显著的
玉米考种系统的相关数据库简析
考种是玉米作物遗传育种过程中一个重要的环节,考种的项目、种类繁多且涉及不同的品 种,产生大量的有关玉米性状的数据,这些性状数据需要收集、整理、记录、统计、分析、存储,如何从众多的考种的数据中,筛选出需要的品种,对提高玉米育种工作效率是极为重要的。近年来计算机技术发展迅速,出现了各种面向用户需求的计算
金融机构批量迁移,国产数据库“东风”起
数据库、操作系统和芯片,被视为现代信息技术领域的三大核心,是基础软件“皇冠上的明珠”。随着我国自研数据库能力不断提升,持续经受考验,从银行到保险公司,从到制造企业到新零售行业,越来越多的企业开始将核心业务系统搭载到国产数据库之上。 两年内或迎“起飞” 数据库是计算机系统中用于存储、管理和组织
苏州大学建成服装用人体数据库
近日,由苏州大学承担的“中国服装用人体数据库建设”项目通过了中国纺织工业联合会的鉴定。鉴定专家认为,该项目为实现智能化人体信息数据的产业化应用提供了很好的技术支撑。 人体轮廓数据,又称体表尺寸,是服装制作的依据,构建相关数据库系统则成为服装行业急需的基础设施。但我国人口众多,数据采集
多组学数据库“齐聚荟”-助力油菜“全能”竞技
油菜产业集观赏、蜜源、生态、经济作物等多种功能于一身,是新兴的“全能选手”。围绕油菜,我国科学家近年来实现了从理论、技术、产品到转化的链式创新,推动了我国油菜基础研究与应用步入世界第一方阵。 然而,如何将基础研究中长期积累的资源和多组学数据优势转化成育种优势,仍是当前乃至未来很长一段时期油