新软件首次实现自动检测蛋白质组数据
莱布尼茨学会分析科学研究所的研究人员将可能解决现代生命科学的重要难题:在大量的蛋白质原始数据组中自动检测公开的数据库中未被开发利用的数据。由于数据格式多样、数量庞大,精确查找这些数据一直以来都相当复杂。莱布尼茨学会分析科学研究所的研究人员在最新一期《自然生物技术》(“Natrue Biotechnology”)期刊中表示已研发出新软件,可以自动将数据转化为统一格式并同时开展评估和运用。 现今重要的数据分析手段之一是质谱分析法,从诸如细胞或组织的繁杂大生物分子中分析各自组成及其数量和变化。通过质谱分析法可以将混合物的不同成分根据质量分离出来,从而得到其浓度和组成。通过这一方法,科学家们虽然可以分析大量样本,但已存在的数据在实际操作中被再次分析和使用的难度很大。大部分数据仍然处于未开发状态,其价值也尚未被世人充分利用。 莱布尼茨学会分析科学研究所的科研人员为此开发出了“多肽振动筛”程序。这个程序原本只用于捕捉大量原始数据。很......阅读全文
首届科学数据大会探讨“科研大数据与数据科学”
2月24日,首届科学数据大会在中国科学院大学国际会议中心举行。包括中科院院士郭华东、陈润生,中国工程院院士汪懋华在内的400多名专家、青年科研人员参会。 中科院副院长、国际科技数据委员会(CODATA)中国全国委员会主席丁仲礼向会议发来贺信。他在贺信中表示,科研大数据和数据科学的作用越来越
科学数据,如何科学管理
《科学数据管理办法》(以下简称《办法》),2018年1月经中央深改组审议通过,近日由国务院办公厅正式印发。《办法》旨在进一步加强和规范科学数据管理,保障科学数据安全,提高开放共享水平,更好地为国家科技创新、经济社会发展和国家安全提供支撑。 这是我国第一次在国家层面出台科学数据管理办法。当前,为
科学数据,如何科学管理
《科学数据管理办法》(以下简称《办法》),2018年1月经中央深改组审议通过,近日由国务院办公厅正式印发。《办法》旨在进一步加强和规范科学数据管理,保障科学数据安全,提高开放共享水平,更好地为国家科技创新、经济社会发展和国家安全提供支撑。 这是我国第一次在国家层面出台科学数据管理办法。当前,为
《中国科学数据》:从根源唤醒沉睡的数据
近年来,因“原始数据丢失,工作无法重复”造成的撤稿事件屡见不鲜。 2020年1月,2018年诺贝尔化学奖得主Frances H. Arnold撤掉了2019年5月发表在《科学》上的一篇论文,原因是缺失了关键的原始数据,致使研究成果无法重复。 “只发表论文不公开研究数据,可能会导致科学研究
分析数据的处理——分析数据的显著性检验
1. 平均值()与标准值(m)之间的显著性检验 —— 检查方法的准确度 (20)若 t计 ³ t0.95, n 则 与 m 有显著性差异(方法不可靠) t计 < t0.95, n 则 与 m 无显著性差异(方法可靠)2. 两组平
分析数据的处理——可疑数据的取舍
1. Q-检验法 (3~10次测定适用,且只有一个可疑数据) (1) 将各数据从小到大排列:x1, x2, x3……xn ; (2)计算 (x大-x小), 即 (xn -x1); (3)计算 ( x可-x邻), (4)计算舍弃商 Q 计 =ô x可-x邻ô/ xn -x1
spss怎样分析数据
spss数据分析的五种方法:1、线性模型;点击分析,一般线性模型,单变量,设置因变量和固定因子,点击确定即可。2、图表分析。3、回归分析,点击分析,打开回归,设置自变量和因变量数据,点击确定即可。4、直方图分析。5、统计分析。SPSS(Statistical Product and Service
分析数据的处理
一. 有效数字及其运算规则 1. 有效数字的意义和位数 (1)有效数字:所有准确数字和一位可疑数字(实际能测到的数字) (2)有效位数及数据中的“ 0 ” 1.0005, 五位有效数字 0.5000, 31.05% 四位有效数字 0.0540, 1.86
让科学大数据“跑”起来
“一直以来,科研数据的开放共享,在国内外都是科学大数据领域的‘老大难’问题。”8月25日,在上海召开的第三届科学数据大会上,国家科技基础条件平台中心主任叶玉江再度抛出这个问题。 相对于商业大数据,科学数据领域更容易形成“烟囱林立”的局面。“这和科学数据的特殊性有关。”叶玉江在接受科技日报记
让科学大数据“跑”起来
“一直以来,科研数据的开放共享,在国内外都是科学大数据领域的‘老大难’问题。”8月25日,在上海召开的第三届科学数据大会上,国家科技基础条件平台中心主任叶玉江再度抛出这个问题。 相对于商业大数据,科学数据领域更容易形成“烟囱林立”的局面。“这和科学数据的特殊性有关。”叶玉江在接受科技日报记者
数据学与数据科学国际研讨会在京举办
5月29日至30日,由中国科学院虚拟经济与数据挖掘研究中心主办的主题为“探讨数据科学的原理、结构与应用”的“第二届数据学与数据科学国际研讨会”在北京举行。原全国人大副委员长、中国科学院虚拟经济与数据科学研究中心主任、中国科学院研究生院管理学院院长成思危先生担任本次会议的荣誉主席,中国科学院虚拟经
第九届科学数据大会暨科学数据中心发展论坛在成都召开
近日,第九届(2024)科学数据大会暨科学数据中心发展论坛在成都召开。本次大会主题“科学数据与开放科学”,为期4天,共设置42场分会,中国科学院院士杨卫担任大会主席。会议由国际科学理事会数据委员会(CODATA)中国全国委员会主办,中国信息协会、中国科学院成都文献情报中心、中国科学院计算机网络信息中
237个科学数据集揭开人口与健康大数据“面纱”
2017年1月4日,国家人口与健康科学数据共享平台科技资源发布会暨2016健康医疗大数据创新应用与发展峰会在京举行,本次会议主题为“医学科学数据共享,推进健康中国建设”。王陇德院士、陈可冀院士、刘德培院士、曹雪涛院士、金力院士等40余名权威专家以及国家科技部和卫生计生委有关领导出席发布会,会议
科学家研究认为:大数据时代“小数据”仍有未来
原文地址:http://news.sciencenet.cn/htmlnews/2023/7/504106.shtm大数据时代,“小数据”有未来吗?武汉纺织大学数理科学学院江健教授团队与美国密歇根州立大学Guo-wei Wei教授团队共同研究认为:“有!”相关研究成果日前在线发表在国际期刊《化学评论
大数据时代:海量数据为科学研究带来重大机遇
“大数据的概念听上去和云计算一样,有些‘高大上’,但是大数据绝不是一个空泛的口号,事实上它不仅改变了人们的生存面貌,更为科学研究带来重大的机遇。”中国科学院遥感与数字地球所研究员郭华东说。 依托海量的数据状态和云级别的数据处理能力,大数据以其Volume(大量)、Velocity(高速)、Va
生物信息分析数据挖掘
DNA芯片技术能够在基因组水平分析基因表达,检测许多基因的转录水平及在不同条件下的基因转录变化,显示反映特征组织类型、发育阶段、环境条件应答、遗传改变的基因谱。基因芯片产生了海量的数据,仅仅进行差异表达分析还远远不够,如何管理分析这些数据、从中挖掘信息已经成为利用这一技术的新的难点。芯片数据大量出现
临床生化数据简要分析
1.检验前质量控制 :取样中的错误:采血时不顺利可导致溶血;标本量不足,取材时间不当,标本容器不适当,取样位置不当,标本储存不当,体位的影响,口服药物的影响等。溶血会影响很多项目: 影响比较明显的有ALT,AST,CKMB,LDH,GGT,血钾,铁, 使某些结果假性偏高或假性降低,无法准确测定;
数据的显示与分析
流式细胞仪收集细胞产生的各种电讯号,最终以数字及图式形式表示。每种讯号(除外前向散射光信号)都包括峰值脉冲信号和面积脉冲信号两种。峰值脉冲信号指的是脉冲的高度;面积脉冲信号指的是电压脉冲曲线内区域的大小。一、参数流式细胞仪的数据参数是指仪器采集的用于分析的信号,包括:1.前向散射光(线性、对数)FS
临床生化数据简要分析
1.检验前质量控制 :取样中的错误:采血时不顺利可导致溶血;标本量不足,取材时间不当,标本容器不适当,取样位置不当,标本储存不当,体位的影响,口服药物的影响等。溶血会影响很多项目: 影响比较明显的有ALT,AST,CKMB,LDH,GGT,血钾,铁, 使某些结果假性偏高或假性降低,无法准确测定;
沉睡的“科学大数据”如何唤醒
6月8日,国际科技数据委员会主办的“大数据与科学发现国际研讨会”开幕,近百位科学家共聚一堂,研讨如何唤醒沉睡的“科学大数据”。大数据已经进入社会的各个层面,科学,商业,社会管理等等,无不都在探索大数据带来的价值。统计作为一门研究数据的科学,在大数据时代下其作用和地位也在随之提高。 今年3月
生命科学常用数据库
The NationalCenter for Biotechnology Information. http://www.ncbi.nlm.nih.gov/National Center for GenomeResources.http://www.ncgr.org/ncgr/ncgr.html T
香山科学会议研讨“科学大数据的前沿问题”
以“科学大数据的前沿问题”为主题的第507次香山科学会议2014年10月22~24日在北京举行。本次会议旨在明晰科学大数据发展趋势,总结出对科学大数据前沿问题的共识和具有学科生长点意义的非共识问题,分析目前国内现状,对未来科学大数据与数据科学的发展方向达成共识,为我国在科学大数据领域的发展及有关
2014大数据与数据科学进展主题论坛在京举行
12月27日,2014年大数据与数据科学进展主题论坛在京举行。包括徐宗本等5位院士在内的来自学界、商界和政府部门的60多名专家学者参加了论坛,围绕今年国际上大数据与数据科学的最新进展和面临的挑战展开了研讨。 本次论坛由中国计算机学会主办,中国计算机学会大数据专家委员会、中科院虚拟经济与数据科学
第八届科学数据大会在青岛启幕-探究科学数据与科研新范式
原文地址:http://news.sciencenet.cn/htmlnews/2023/4/499491.shtm
上海启动科学数据开源开放平台建设
原文地址:http://news.sciencenet.cn/htmlnews/2023/4/497836.shtm
科学研究部门优化数据存贮空间
和企业一样,大型研究机构也正在为日益增长的非结构化数据困惑不已,运用正确的文档存贮解决方案,能够创造出显著的存储空间。 科 学研究部门的数据保存必须保证安全,以备时隔数十年后还能方便准确地调用。有些数据和研究方法还要保存在公开的档案里,以便能够重复这些研究项目和进行结 果检验。研究
《科学数据引用》国家标准正式发布
近日,国家标准化管理委员会通过官方网站发布《中华人民共和国国家标准公告(2017年第32号)》(http://www.sac.gov.cn/gzfw/ggcx/gjbzgg/201732/),中国科学院计算机网络信息中心主持研制的《信息技术 科学数据引用》(GB/T 35294-2017)正式发
WHO加入科学数据开放共享“S计划”
8月29日,世界卫生组织(WHO)宣布加入由欧盟牵头旨在免费获取由公共资金资助的科研论文“S计划”,成为“S联盟”(Coalition-S)的一员,要求在世卫组织资助下产生的科研论文自发表之日起实现免费在线阅读。 世卫组织是联合国系统中第一个加入“S联盟”的机构,是对“S计划”的强力支持。世卫
生命科学国外重要数据库
EMBL数据库结构EMBL数据库的基本单位也是序列条目,包括核甘酸碱基排列顺序和注释两部分。序列条目由字段组成,每个字段由标识字起始,后面为该字段的具体说明。有些字段又分若干次子字段,以次标识字或特性表说明符开始,最后以双斜杠“//”作本序列条目结束标记。条目的关键字包括ID(序列名称),DE(序列
数据分析介绍(II)-Cytoscape
本期为大家介绍一个开放源码的生物资讯软件 –Cytoscape,它可以建构可视化的分子交互作用网络,并可将已有的基因表达信息(gene expression profiles) 整合进此网络中,轻易观察分子间 (蛋白质—蛋白质 或 蛋白质—DNA…) 的关联性。 Cytoscape 是