徐宗本院士谈大数据:不能只存储不分析

“大数据是信息技术的基础技术,其最大的价值是形成基于事实数据的方法论。大数据不能只存储,不分析。”23日,中国科学院院士、中国科学院信息技术科学部副主任徐宗本在第一届湘江大数据创新峰会上如是说。 当天,包括国内大数据知名专家学者、业内精英、企业代表等在内的500余人齐聚一堂,共话大数据的未来发展。 徐宗本认为,大数据是以文字、图片、视频、音频等形式集结在一起的复杂数据集,具有海量性、时变性、异构性、分布性等特点,真实世界的数据(碎片)量达到一定程度就可以反映出其真实面貌,是一个从量变到质变的过程。 “我们现有的数据采集、传输、存储、处理与分析技术已无法适应需要,至于未来大数据要用什么样的计算语言,目前尚不清楚。”徐宗本表示,看大数据不要沉浮在表面,要理解它背后蕴藏的含义,读懂单位、行业等数据是未来的基本需要。 徐宗本以一家城市火锅店为例,经营者除了要了解行业数据之外,店面周围的人口分布数据、气象数据等界内界外数据都需......阅读全文

数据真实性饱受质疑-环境数据造假歪风待刹

  日前,福建省环保厅披露,福建馥华食品有限公司等10家企业涉嫌篡改、伪造污染源监测数据,企业内的污染源自动监控设备不正常运行,弄虚作假。  对此类问题,环保部多次要求严肃处理,被称为“史上最严”的新环保法,也已于2015年1月1日开始施行。但是,环境监测数据造假这个老问题,似乎依旧还很严重。原因何

“AI+大数据”推动数据挖掘走向数智化治理

  5月20日,阿里巴巴副总裁、阿里云计算平台负责人贾扬清在媒体沟通会上表示,经过近20年的发展,人们对大数据的利用已从早期的数据挖掘进化为集数据分析、数据管理、数据协同为一体的综合治理,在这一进程中,大数据与人工智能(AI)技术的融合居功甚伟。 贾扬清提到,数字经济迅猛发展,不断丰富、增长的数

大数据时代:海量数据为科学研究带来重大机遇

  “大数据的概念听上去和云计算一样,有些‘高大上’,但是大数据绝不是一个空泛的口号,事实上它不仅改变了人们的生存面貌,更为科学研究带来重大的机遇。”中国科学院遥感与数字地球所研究员郭华东说。  依托海量的数据状态和云级别的数据处理能力,大数据以其Volume(大量)、Velocity(高速)、Va

激光粒度仪测量数据与筛分测量数据差异问题浅析

 激光粒度仪测量数据与筛分测量数据差异问题浅析  粒度分布的测量方法有很多种,如:筛分法、沉降法、图像法、激光散射法粒、库尔特法等。在实验室的应用中,筛分法和激光散射法是比较常用的两种粒径测量手段。但是一直以来,这两种方法测量的可比性存在较多问题。  1、筛分法原理及优缺点  筛分法是颗粒粒径测量中

京津冀大数据走廊-互联互通打破数据壁垒

  前不久,全国首个跨区域类大数据综合试验区——京津冀大数据综合试验区建设正式启动。北京强化创新和引导,天津强化带动和支撑,河北强化承接和转化……京津冀加强政策顶层设计,以打造大数据协同发展功能格局。  2017年起,京津冀将在环保、交通、旅游等重点领域试点示范率先启动,到年底,数据开放、产业对接框

中学智能数据解决方案:用大数据打造智能教学

   规模达20万平方米的第74届中国教育装备展示会于5月11日在四川成都举办,从1980年举办至今,教育装备展被誉为教育装备市场的风向标,成为我国乃至世界教育装备行业规模大、影响广、专业性强的品牌展会。一起科技参加此次展会,向外界展示更新的中学产品业务。 本次教育装备展将成为史上较大,也是西博城今

2025深圳数据展|2025深圳数据云箱展览会

2025深圳国际数据中心展览会 Shenzhen International Data Center technology and Equipment Exhibition 参展咨询:021-5416 3212   大会负责人:李经理 136 5198 39782025年4月9-11日参展咨询:02

环境监测数据造假起底:企业伪造数据花样多

  “前不久,我们通过在线监测,发现一家企业的排放数据超出正常范围,系统也自动报警。但到企业调查时,他们死不承认。最后通过调阅现场监控视频,只用了几帧图片,就证明有人做了手脚。到了这个程度,这家企业的负责人不得不承认篡改了数据。”去年12月29日,河南省环境在线监控中心执法人员赵娜对《第一财经日报》

【分享】激光粒度仪测量数据与筛分测量数据差异问题

  粒度分布的测量方法有很多种,如:筛分法、沉降法、图像法、激光散射法粒、库尔特法等。在实验室的应用中,筛分法和激光散射法是比较常用的两种粒径测量手段。但是一直以来,这两种方法测量的可比性存在较多问题。  1、筛分法原理及优缺点  筛分法是颗粒粒径测量中最为通用也最为直观的方法。  筛分的实现非常简

科学家构建涵盖五大植物类群的150+物种参考代谢组及数据库

  11月11日,中国科学院分子植物科学卓越创新中心李轩团队在《核酸研究》(Nucleic Acids Research)上,在线发表了题为RefMetaPlant: reference metabolome database for plants across five major phyla的研

北京PM2.5数据昨起发布-手机版数据明年上线

  在蓝天白云的映衬下,身披节日盛装的天安门广场蔚然壮观,国庆主花坛“祝福祖国”更显喜庆。 本报记者 饶强摄  昨天,本市首批20个监测站点PM2.5监测设备开始试运行,东城东四等站点从昨天11时起的PM2.5监测数据已经实时发布在空气质量发布平台(www.bjmemc.com.cn

邬贺铨院士:大数据应当追求数据精确而非大而全

  在目前的南方大规模降雨中,百度、阿里巴巴等多家公司利用大数据,即时发布武汉等城市街道积雨状况的地图,提醒出行市民提前避让。这显示了大数据的巨大威力和前景。  在日前举办的中国大数据产业峰会暨中国电子商务创新发展峰会上,中国工程院院士、中国互联网协会理事长邬贺铨向记者表示,大数据不能追求以大盖全,

质谱仪数据处理的分析离子流累积测量数据的处理

离子流累积测量数据的处理质谱测量中,将需要测量的质量峰按顺序采集一遍称为一个循环或称一个扫描(scan),几个循环划成一组,取一组数据(平均值与标准偏差),多组数据进行统计计算后得到最终结果(平均值与标准偏差)。平均值和标准偏差的计算公式为:离子流累积测量要求在测量的间隙同时测量本底数据,用累积数据

国家数据局:公共数据开发利用政策很快就会出台

 7月4日,在2024全球数字经济大会——数据要素高层论坛上,国家数据局数据资源司副司长张慧星表示,正在加快研究制定数据资源开发利用政策文件,针对公共数据、企业数据、个人数据不同属性特点分类施策,部分政策很快就会出台。  近日,国家数据局党组书记、局长刘烈宏表示,将以制度建设为主线,今年陆续推出数据

数据应用环境项目“数据资源中心建设”子项目通过验收

  12月30日,中科院计算机网络信息中心在北京召开了中科院“十一五”信息化专项“数据应用环境建设与服务”项目的“数据资源中心建设”子项目验收会议。来自北京航空航天大学、清华大学、中国地震局、中科院相关院所等单位的7名专家组成专家组。   网络中心科学数据中心主任、中科院数据应用环境建设与服务项目

关于咪唑的分子结构数据和计算化学数据介绍

   一、咪唑的的分子结构数据:  摩尔折射率:18.77 [3]  摩尔体积(m3/mol):60.9 [3]  等张比容(90.2K):161.0 [3]  表面张力(dyne/cm):48.6 [3]  极化率(10-24cm3):7.44 [3]  二、咪唑的的计算化学数据:  1.疏水参数

国家数据局发文-部署智慧城市-涉及大数据、人工智能

  4月2日,国家数据局发布《深化智慧城市发展推进城市全域数字化转型的指导意见(征求意见稿)》(下称《指导意见》),向社会公开征求意见。  《指导意见》提出,2027年,全国城市全域数字化转型取得明显成效,形成一批横向打通、纵向贯通、各具特色的宜居、韧性、智慧城市。城市数字经济创新活跃,数字治理高效

质谱仪质谱仪数据处理的分析离子流测量数据的处理

离子流累积测量数据的处理质谱测量中,将需要测量的质量峰按顺序采集一遍称为一个循环或称一个扫描(scan),几个循环划成一组,取一组数据(平均值与标准偏差),多组数据进行统计计算后得到最终结果(平均值与标准偏差)。平均值和标准偏差的计算公式为:离子流累积测量要求在测量的间隙同时测量本底数据,用累积数据

质谱仪质谱仪数据处理的分析扫描质谱数据的处理

对于逐点扫描得到的一段质谱数据,数据处理的首要任务是峰位置的判别。其实质是峰数据与既有模型的匹配过程,这与质谱仪的特性、扫描参数以及数据的统计信息等多种因素有关系。简单情况下,连续几个数据都大于设定的阈值(如最大值5%)即可认为该段数据是峰数据,而剩余的数据可认为是本底。在峰位置判别的基础上,根据本

卫健委不再统计数据,大数据到底可靠么?

  昨天,国家卫健委网站上发布了一份公告:“从即日起,不再发布每日疫情信息,将由中国疾控中心发布相关疫情信息,供参考和研究使用”。  事实上,“新十条”公布以来,核酸检测从“应检尽检”变成了“愿检尽检”,之后,开始有人觉察到卫健委发布的感染数据与自己身边不断出现新冠阳性亲朋的实际情况严重背离。  作

2025深圳数据展|2025深圳数据中心维护展览会

2025深圳国际数据中心展览会 Shenzhen International Data Center technology and Equipment Exhibition 参展咨询:021-5416 3212   大会负责人:李经理 136 5198 39782025年4月9-11日参展咨询:02

2025深圳数据展|2025深圳绿色数据中心展览会

2025深圳国际数据中心展览会 Shenzhen International Data Center technology and Equipment Exhibition 参展咨询:021-5416 3212   大会负责人:李经理 136 5198 39782025年4月9-11日参展咨询:02

药品研究色谱数据工作站及色谱数据管理要求

  本文规定了药品注册申报研究工作采用的色谱数据工作站的基本要求和色谱数据的管理要求。同时,为保证色谱数据的完整性和可靠性,色谱数据工作站需建立信息安全管理体系。  1、色谱数据工作站基本要求  色谱数据工作站获得的色谱数据应当可靠、安全、完整、可溯源。  鼓励采用经规范和系统验证的色谱数据工作站进

质谱仪数据处理的操作规范扫描质谱数据的处理

对于逐点扫描得到的一段质谱数据,数据处理的首要任务是峰位置的判别。其实质是峰数据与既有模型的匹配过程,这与质谱仪的特性、扫描参数以及数据的统计信息等多种因素有关系。简单情况下,连续几个数据都大于设定的阈值(如最大值5%)即可认为该段数据是峰数据,而剩余的数据可认为是本底。在峰位置判别的基础上,根据本

药品研究色谱数据工作站及色谱数据管理要求

1、色谱数据工作站基本要求      色谱数据工作站获得的色谱数据应当可靠、安全、完整、可溯源。      鼓励采用经规范和系统验证的色谱数据工作站进行研究工作。      色谱数据工作站验证可由工作站制造商进行,注册申请人依据工作站制造商的评估和验证报告对工作站获得色谱数据的完整性、可靠性、安全性

微生物组大数据搜索引擎入选中国医药生物技术十大进展

   目前,中科院青岛生物能源与过程研究所研发的“微生物组大数据搜索引擎”(Microbiome Search Engine; MSE)入选“2016年中国医药生物技术十大进展”。   微生物组(又称“菌群”)在人体中与生俱来,与人体健康息息相关。因此,对海量微生物组“大数据”的搜索与挖掘,有助于认

智能“大数据”护航春运

  站在西安高铁北站进站口,60岁的陕西蓝田县农民李玉琴拉着丈夫张志祥的袖口,不停向里面张望。这是她第一次乘坐高铁,目的地是首都北京。   “儿子挣钱了,叫我们到北京逛逛。”老两口言语里既紧张又憧憬。   “火车票放在上面,身份证放在下面。”坐过几次火车的张志祥站在自动检票机入口处,一边听着语

期刊数据库更新

图片来源:B. DOUTHITT/SCIENCE 期刊影响因子多年来备受批评,认为其扭曲了学术出版。近日,美国宾夕法尼亚州克拉尼特分析公司推出了其期刊引用报告(JCR)数据库的更新版本,并表示它提供了理解期刊特征和受众的背景信息。 影响因子代表期刊文章的引用次数,除以其两

腺苷的计算化学数据

疏水参数计算参考值(XlogP):无氢键供体数量:4氢键受体数量:8可旋转化学键数量:2互变异构体数量:3拓扑分子极性表面积:140重原子数量:19表面电荷:0复杂度:335同位素原子数量:0确定原子立构中心数量:4不确定原子立构中心数量:0确定化学键立构中心数量:0不确定化学键立构中心数量:0

尿囊素的计算化学数据

1.疏水参数计算参考值(XlogP):-2.22.氢键供体数量:43.氢键受体数量:34.可旋转化学键数量:15.互变异构体数量:246.拓扑分子极性表面积:1137.重原子数量:118.表面电荷:09.复杂度:22510.同位素原子数量:011.确定原子立构中心数量:012.不确定原子立构中心数量