梅宏院士:大数据理论和技术发展仍处于早期阶段

4月8日,在南开大学数据科学与大数据技术论坛上,我国大数据领域知名专家、中国科学院院士梅宏应邀作题为“大数据——回顾与展望”的主旨报告。他在报告中全面回顾了大数据技术的产生和发展历程,介绍了世界各国的大数据战略,指出大数据领域将面临的技术挑战,并展望了新的热点将对大数据战略带来的冲击。 梅宏在报告中指出,大数据业已成为人类认识复杂系统的新思维、新手段,成为促进经济转型增长的新引擎,成为提升国家综合能力和保障国家安全的新利器,成为提升政府治理能力的新途径,其重要性已经成为各界共识。开源成为大数据技术的主流,大数据分析方法、大数据管理与处理技术是大数据面临的两类主要技术挑战。 梅宏介绍道,描述性分析(发生了什么)、预测性分析(可能发生什么)、指导性分析(选择做什么)是大数据应用的三个层次。当前,描述性、预测性应用较多,指导性应用较少;基于单一数据源和已存在数据集的应用较多,基于多源多态数据和主动收集数据的应用较少;模型导向类......阅读全文

生物学家借助数据科学破解生命奥秘

  自2000年人类基因组图谱绘制后,生物学研究迈入全新的“组学”时代,科学家们争先恐后地测序各种有机生物的基因组或蛋白质组。  现在,即使一些简单的实验都会产生大量数据,而从“背景噪音”中获得想要的结果则成为了一大挑战。美国趣味科学网站近日报道指出,计算机技术正帮助科学家们征服这些数据大山,甚至提

孙九林院士:科学数据是重要战略资源

  国务院办公厅日前印发《科学数据管理办法》(以下简称《办法》),我非常高兴。作为科技工作者,我为科学数据共享鼓与呼了几十年,相信《办法》对其他科技工作者也是极大鼓舞。  数据共享应用是国际通行经验。比如美国,20世纪70年代就开始建立数据自由方面的法规,90年代开始提出数据开放共享的概念,建了9个

地球大数据科学工程专项完成南极科考

  近期,中国科学院战略性先导科技专项(A类)“地球大数据科学工程”完成对南极半岛的科学考察,取得预期成效。  针对三极(北极、南极和青藏高原)的特殊地理位置,考虑其对全球变化和地球系统科学的研究意义,地球大数据专项设立了时空三极环境项目,从地球大数据视角,首次将三极作为一个整体,开展系统性、关联性

福建上杭中止公布检测数据-污染数据算机密?

  紫金矿业污水事故发生后,福建上杭县环境监测站中止公布可能致癌的六价铬检测数据。上杭县官员表示,这个数据是机密(央视7月22日报道)。  按照《环境信息公开办法》,企业排放数据要长期公开,企业污染环境数据,环保部门也应该公开。但上杭县官方却违反法律与自身职责,打着“机

中科信息取得基于元数据的数据存储专利

  2024年9月4日,中科院成都信息技术股份有限公司取得一项名为“基于元数据的数据存储方法、装置、设备及存储介质“,授权公告号CN117312319B,申请日期为2023年10月。  专利摘要显示,本申请公开了一种基于元数据的数据存储方法、装置、设备及存储介质,所述数据存储方法包括以下步骤:获取统

闵应骅:大数据时代聊聊小数据

  现在好像人人都爱说“大数据”,就像平时我去开会,不是用大数据分析这个,就是用大数据建构那个。可是我最近看《美国计算机学会通讯》(CACM)上面提到了几次小数据,我觉得大家也有必要了解一下这个有趣的概念。  什么是小数据?小数据就是个体化的数据,是我们每个个体的数字化信息。比如我天天都喝一两酒,突

《科学数据管理办法》发布:科学家期盼细则跟进

卫星上天、大科学装置崛起、大科学项目启动……近年来,我国受世界瞩目的科技项目越来越多,除了挑战高难度的工程技术、科学问题,它们更大的价值或许是普通人想不到的———源源不断产生大量的科学数据。 大量一手科学数据是一种极其重要的战略性资源。但杂乱无章堆放的数据很难被加以利用并产生价值。如何让与日俱增

“火星快车”号数据图显示:红色星球上有条大裂缝

基于拍摄数据制作而成的火星蛇形“疤痕”图。图片来源:欧空局官网科技日报北京7月17日电 (记者张梦然)基于欧洲空间局(以下简称“欧空局”)“火星快车”号的高分辨率立体相机HRSC的数据,研究人员最新获得了一张惊人的图像:一个黑暗的、不平坦的裂缝,宛如一道蛇形“疤痕”,划破了火星地面。相关图像近日已发

韦布望远镜首批数据揭示大质量星系群

原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494395.shtm

境外临床实验数据共享,进口药或将大降价

  为贯彻落实中共中央办公厅、国务院办公厅《关于深化审评审批制度改革鼓励药品医疗器械创新的意见》(厅字〔2017〕42号),加强对接受药品境外临床试验数据工作的指导和规范,国家药品监督管理局组织制定了《接受药品境外临床试验数据的技术指导原则》,现予发布。  特此通告。  附件:接受药品境外临床试验数

GEN:大数据挖掘对癌症治疗的四大影响

  2016年1月在瑞士达沃斯召开的世界经济论坛上的一个panel讨论中,美国副总统Joe Biden当场要求临床医生和研究者举例表示人类在抗击癌症中突破的障碍。当几个重要话题浮现时,最重要的议题是“大数据”,具体而言,即“大数据”的收集、分析和应用。  研究者表示:“大数据”是有效的,这是因为有重

期刊对Western-Blot数据要求的四大要点

则责任自负2018年,PubMed 中共有194,262 篇蛋白相关的论文,其中有16,196(8.3%)篇用到了 WB。WB 的使用比例在过去30年中稳定在8%到9%左右,而更为现代和准确的蛋白质谱技术(MS),在过去十年中应用比例则稳定在4%,仅仅是WB的一半。四十年后的今天,WB依旧是应用

期刊对Western-Blot数据要求的四大要点

  2018年,PubMed 中共有194,262 篇蛋白相关的论文,其中有16,196(8.3%)篇用到了 WB。WB 的使用比例在过去30年中稳定在8%到9%左右,而更为现代和准确的蛋白质谱技术(MS),在过去十年中应用比例则稳定在4%,仅仅是WB的一半。四十年后的今天,WB依旧是应用率最高的蛋

我国2022数据产量占全球10.5% 加速数据资源优势转化-推动数据要素价值释放

  随着数据基础制度的逐一落实,我国迎来了数据要素政策和环境的黄金发展期,从“数据大国”向“数据强国”加速迈进。  国家互联网信息办公室发布的《数字中国发展报告(2022年)》显示,2022年,我国大数据产业规模达1.57万亿元,同比增长18%;数据产量达8.1ZB,同比增长22.7%,占全球数据总

Immune-Cell-Atlas-基准数据集是否存在数据偏差?

任何数据集都可能存在一定程度的数据偏差,Immune Cell Atlas 基准数据集也不例外。 可能存在的潜在数据偏差包括:  1. 样本偏差:数据集所包含的样本可能来自特定的人群、地区或研究机构,不能完全代表整个人群的免疫细胞特征。  2. 技术偏差:不同的实验技术、测序平台和操作流程可能

分析数据的处理——分析数据的显著性检验

1. 平均值()与标准值(m)之间的显著性检验 —— 检查方法的准确度                   (20)若     t计 ³ t0.95, n  则 与 m 有显著性差异(方法不可靠)             t计 < t0.95, n  则 与 m 无显著性差异(方法可靠)2. 两组平

串口数据转换为CAN数据之后是怎样的?(二)

假设配置的转换成的CAN报文帧信息为“标准帧”,配置的帧ID1,ID0分别为“0x01,0x23”,串行帧的数据为01,02,03,04,05,06,07,08共8个字节,那么转换格式如图5。CAN报文的帧ID为0x0123(用户配置),帧信息:标准帧(用户配置),串行帧中的数据部分将不作任何修改地

《中国气象大数据(2018)》发布-气象数据开放效益显著

   12月4日,中国气象局发布《中国气象大数据(2018)》。该报告显示,开放共享的气象数据已广泛应用于交通运输、新能源、农业、移动互联软件开发和服务、公共管理等领域,效益显著。  气象大数据是指在气象领域中,围绕智能预报和智慧服务,从气象数据采集、加工处理、预报预测、共享服务、存储归档等气象业务

串口数据转换为CAN数据之后是怎样的?(一)

MCU没有CAN或CAN接口数量不够怎么办?目前市面上有串口转CAN的相关模块或设备,但大家知道串口转CAN是如何实现的吗?转换后的帧格式是如何的?本文将为大家详细介绍串口经过转换后的CAN帧格式与注意事项。适用场景串口转CAN模块在什么时候需要用到呢?一是老产品面临升级,需要用到CAN总线通信,但

肌苷的分子结构数据和计算化学数据

  1、分子结构数据  摩尔折射率:58.89  摩尔体积(cm3/mol):128.6  等张比容(90.2K):411.3  表面张力(dyne/cm):104.4  极化率(10-24cm3):23.34 [2]  2、计算化学数据  疏水参数计算参考值(XlogP):无  氢键供体数量:4 

国家数据局:多措并举推进“数据要素×”行动落地

    1月7日,国家数据局局长刘烈宏在出席主题为“增长动能中国探索”的第二十五届北大光华新年论坛时表示,将数据作为生产要素,是我国首次提出的重大理论创新。国家数据局正在推进的重点工作之一,就是充分发挥数据的基础资源作用和创新引擎作用,不断做强做优做大我国数字经济。    国家数据局1月4日发布消息

监测司司长:虚假数据比没有数据更可怕

  3月26日,生态环境部举行3月例行新闻发布会。生态环境部生态环境监测司司长蒋火华出席发布会,介绍我国生态环境监测工作进展情况。生态环境部宣教司司长、新闻发言人裴晓菲主持发布会,通报近期生态环境保护重点工作进展,并共同回答了记者提问。新闻发布会现场  介绍生态环境监测工作情况生态环境部生态环境监测

如何评估-Immune-Cell-Atlas-基准数据集的数据偏差?

评估 Immune Cell Atlas 基准数据集的数据偏差可以考虑以下几个方面:  1. 样本特征分析    - 检查样本的来源,包括种族、年龄、性别、地理位置等分布情况,判断是否存在不均衡或过度集中的现象。  2. 实验方法和技术一致性    - 了解样本采集、细胞分离、测序平台和实验

泼尼松龙的分子结构数据和计算化学数据

  1、泼尼松龙的分子结构数据:  摩尔折射率:95.48  摩尔体积(cm3/mol):274.7  等张比容(90.2K):766.8  表面张力(dyne/cm):60.7  极化率(10-24cm3):37.85 [1]  2、泼尼松龙计算化学数据:  疏水参数计算参考值(XlogP):1.

呼吁数据共享!数据烂手里,何谈研究话语权?

  导 读  在大气、海洋、冰川等需要国际合作的研究领域,中国普遍缺乏拿得出手的高质量数据。问题出在了哪里?  “我们国家在数据方面基本没有话语权。”  在谈到IPCC报告里鲜有来自中国的数据时,A学者不无感慨地告诉《知识分子》。这位要求匿名的研究者举例说,在2013年第五次IPCC报告中,为决策者

机载激光雷达(Lidar)数据采集及数据处理

  近年来,网络通讯技术、计算机技术、激光测距技术及GPS技术等技术的不断发展成熟,机载激光雷达技术正蓬勃发展,欧美等一些发达国家逐步研制出很多种机载激光雷达测量系统,主要包括 LeicaALS50,Optech等等,它的应用已超国遥感所覆盖的范围和传统测量,成为一种特有的数据获取方式。   一、机

甲硫氨酸的分子结构数据和计算化学数据

  一、甲硫氨酸的分子结构数据:  摩尔折射率:38.26  摩尔体积(cm3/mol):123.7  等张比容(90.2K):329.9  表面张力(dyne/cm):50.5  极化率(10-24cm3):15.17 [1]  二、甲硫氨酸的计算化学数据:  疏水参数计算参考值(XlogP):无

光谱大数据来自耿耿星河-海量数据世界分享

LAMOST望远镜内部拼接镜面。LAMOST望远镜全景。  ■走近中国大科学工程   黑暗的燕山之巅,瞪着一只亮闪闪的眼——郭守敬望远镜(LAMOST),3月底,其获得的首批220万条巡天光谱数据正式向世界发布。  LAMOST是光谱加工厂,每个观测夜经“流水线”生产出万余条天体

BET和孔径分布数据测出来了,数据怎么处理

先做一个N2吸附测试,得到吸附等温线;然后用不同的计算模型分析表面积和孔径分布; 2)比表面积可以看BET数据或langmuir数据,大部分人喜欢用BET数据; 3)孔径分布可以参考DFT、HK或BJH数据,这个由材料的孔径确定。

孙九林等:科学家要促进科学数据共享和流动

  “科学数据不仅有科研价值,它还有社会价值和经济价值。只有在共享平台上实现数据的共享和流动,数据才能不断升值。”在9月17日召开的973 计划资源环境领域项目数据汇交工作会议上,数十位在研项目研究骨干、项目汇交联络人和主管部门领导共同研究科学数据的汇交与共享工作。中国工程院院士、数据