徐宗本院士谈大数据:不能只存储不分析

“大数据是信息技术的基础技术,其最大的价值是形成基于事实数据的方法论。大数据不能只存储,不分析。”23日,中国科学院院士、中国科学院信息技术科学部副主任徐宗本在第一届湘江大数据创新峰会上如是说。 当天,包括国内大数据知名专家学者、业内精英、企业代表等在内的500余人齐聚一堂,共话大数据的未来发展。 徐宗本认为,大数据是以文字、图片、视频、音频等形式集结在一起的复杂数据集,具有海量性、时变性、异构性、分布性等特点,真实世界的数据(碎片)量达到一定程度就可以反映出其真实面貌,是一个从量变到质变的过程。 “我们现有的数据采集、传输、存储、处理与分析技术已无法适应需要,至于未来大数据要用什么样的计算语言,目前尚不清楚。”徐宗本表示,看大数据不要沉浮在表面,要理解它背后蕴藏的含义,读懂单位、行业等数据是未来的基本需要。 徐宗本以一家城市火锅店为例,经营者除了要了解行业数据之外,店面周围的人口分布数据、气象数据等界内界外数据都需......阅读全文

水德浮游生物大数据平台的使用与数据分析方法

水德浮游生物大数据平台 目前,绝大多数海洋和淡水生态领域的研究机构和业务监测单位,对浮游生物的研究手段还停留在人工镜检及手工测定的阶段,这样经常导致操作过程繁琐、工作量巨大、分析结果滞后,而且需要资深专业技术人员。此平台用于对浮游生物样品进行快速安全清洗、扫描成像、种类鉴定、数量统计、大小测量、生物

关于环戊烷的毒理学数据和生态学数据介绍

  一、毒理学数据  急性毒性  LD50:11400mg/kg(大鼠经口)  LC50:106g/m3(大鼠吸入)  二、生态学数据  生态毒性 LC50:100mg/L(96h)(鱼)  非生物降解性空气中,当羟基自由基浓度为5.00×105个/cm3时,降解半衰期为66h(理论)。  该物质对

数据平台让水稻更易“读懂”-以水稻为研究对象的数据库

  水稻生物学数据库众多、信息量大,但大多是生物学原始数据;国内传统种质资源数据库鲜有二次开发功能;国内缺少整合多学科数据的集成性数据库……如何从海量数据中挖掘有用信息提供给农业科研工作者,一直是个难题。中国水稻研究所鄂志国、王磊、庄杰云等创建了“国家水稻数据中心”(http://www.riced

国家基因组科学数据中心公布数据资源整合挖掘体系

  近日,国家基因组科学数据中心在国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表题为Database Resources of the National Genomics Data Center in 2020 的文章,以整体形式介绍基因组数据资源整合与挖掘体系建设

北京大数据研究院成立拟推动数据研究成果转化

  8月27日,国内首个整合了政府、大学和市场三方面资源的大数据研究机构——北京大数据研究院今天在北京大学揭牌。北京大数据研究院是在北京市委市政府的支持与指导下,由中关村管委会、海淀区政府、北京大学、北京工业大学四方共同支持中科院院士、北京大学教授鄂维南牵头筹建。目标是吸引国际一流大数据研究人员来京

深圳数据交易所揭牌-数据交易额突破11亿元

图为深圳数据交易所揭牌暨数据交易成果发布活动现场。 陈文 摄  11月15日,由国家发展和改革委员会、广东省政府指导,深圳市政府主办的深圳数据交易所揭牌暨数据交易成果发布活动15日在深圳举行。据悉,深圳数据交易所累计交易额突破11亿元。  据了解,深圳数据交易所成立伊始,便实现国内首单场内跨境数据交

如何选择合适的数据增强方法来处理单细胞测序数据?

选择合适的数据增强方法来处理单细胞测序数据可以考虑以下几个方面:了解数据特点分析单细胞测序数据的特征,包括基因数量、细胞类型分布、数据的方差和均值等。这有助于确定哪种数据增强方法可能更适合数据的固有模式。考虑生物学合理性确保所选择的数据增强方法在生物学上是合理的。例如,对于基因表达数据,增强操作不应

近红外光谱分析方法研究——从传统数据到大数据

红外光谱分析技术作为一种绿色分析技术,在许多领域中已得到广泛应用。  随着应用的深入和拓展,近红外光谱的数据类型逐渐从传统数据变成近红外光谱大数据。本文总结了近红外光谱的预处理、奇异样本筛选、多元校正和模型转移等技术及其在相关领域的应用。对近红外光谱大数据分析技术的初步研究,包括近红外光谱在工业品在

如何将紫外吸收的数据转化为紫外可见漫反射的数据

漫反射可以用漫反射吸光度:A=log[1/R∞]=-log[1+K/S-sqrt((K/S)^2+2*(K/S))]R∞是样品无穷厚的反射率,不易测得,可用相对反射率替代,即硫酸钡或烟熏氧化镁作为标准,其R∞约等于1.还可以用Kubelka-Monk(K-M)函数F(R∞)=(1-R∞)^2/(2*

厦大尝试AI大模型破译甲骨文

近日,厦门大学信息学院自然语言处理实验室教授史晓东团队申报的“基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型”入选“探元计划2024”“创新探索型项目”TOP10榜单。基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型。厦门大学供图甲骨文也被称作“殷墟文字”,距今已有三千多年历史,是世界四大古文

天瑞仪器点评:大蓝图、大产品、大合力

  行业龙头。天瑞仪器是靠研发和创新驱动的国内高端分析仪器龙头,在RoHS 为主的环境保护市场、贵金属检测等工业测试与分析市场已经建立了领先优势,致力于开拓更广泛的在大健康领域的应用;自主研发和外延扩张并举向环保、食品安全、生命科学等大健康相关领域拓展是公司的长期发展战略。  大蓝图。外延扩张稳步前

评论:要大科学装置,更要大科研队伍

打造国家实验室,是上海加快建设具有全球影响力的科创中心、围绕张江综合性国家科学中心建设的一项新使命。发达国家的国家实验室是如何运作管理的?能给上海带来怎样的启示?本报今起推出分析,希望对上海的国家实验室建设有所借鉴。 国家实验室是一种世界通行的科研基地形式,兴起和发展于二战前后,主要围绕国

强调五大创新,呈现五大特点

   2019年度国家科学技术奖共评选出296个项目和12名科技专家。此次奖励工作强调了5大创新举措;获奖项目呈现出5大特点。  五大创新举措  一,全面实行提名制。  2019年进一步完善实名制,认真落实中央对于“三评”改革精神,精简提名材料,简化各类证明,切实减轻科研人员负担。  二,首次在自然

3大主题会场-8位大咖说食品

   历经多年的分析和监控,我国食品质量安全已取得了举世瞩目的成就。十四五规划提出全面推进健康中国建设,把保障人民健康放在优先发展的战略位置;提出坚持创新驱动发展全面塑造发展新优势,在加强原创性引领性科技攻关瞄准包括生命健康在内的前沿领域,实施一批具有前瞻性、战略性的国家重大科技项目。这些战略规划标

高校科研经费管理:法大还是文件大

   一边是挤占挪用、虚列支出,一边是管得太死、效率低下。《经济参考报》记者获悉,目前高校科研经费管理的突出矛盾和问题集中在结余经费、劳务费和间接补偿的制度设计和执行过程中。  科研人员建议,应统筹设计科研费用支出范围,在实现激励的同时,还应发挥组建稳定科研队伍的作用,赋予科研团队更大“钱的自主权”

唾液酸的物性数据

性状:无色结晶。熔点(ºC):185-187(分解)比旋光度(º,C=2,水中 ):-32溶解性:溶于水和甲醇,微溶乙醇,不溶于乙醚,丙酮和氯仿。

甲醛检测数据怎么看

装修空气检测流程:严格按照GB/T18883-2002及GB50325-2010标准,检测人员上门采集空气样本、实验室检测分析、高级工程师审核签字、出具检测报告;周期约3-4工作日。1、实验室测试甲醛等污染物的重要性:新房甲醛检测关乎您和家人的生命健康,必须经验严谨复杂的实验过程,方能得到科学的检测

数据揭示女性疼痛不被重视

女性得到止痛药的概率低于男性图片来源:Natalia Gdovskaia/Getty一项对比研究发现,医生对男女疼痛患者区别对待,他们会让女性患者等候更长时间,且更不容易获得止痛药物。这项研究于8月5日发表在《美国国家科学院院刊》,强调了无意识偏见如何影响我们对他人疼痛的认识。论文的作者之一,耶路撒

NASA数据用于全球作物预测

  美国宇航局(NASA)首颗致力于测量土壤含水量的卫星的数据,现在被美国农业部用于监测全球农田并进行商品预测。SMAP采集的5月16~18日数据的绘图。  土壤湿度主—被动探测卫星(SMAP)任务于2015年启动,用于帮助绘制全球土壤含水量图。现在,美国宇航局戈达德太空飞行中心的一个团队开发了一些

褐煤酸的计算化学数据

1、 疏水参数计算参考值(XlogP):12.92、 氢键供体数量:13、 氢键受体数量:24、 可旋转化学键数量:265、 互变异构体数量:6、 拓扑分子极性表面积(TPSA):37.37、 重原子数量:308、 表面电荷:09、 复杂度:32710、 同位素原子数量:011、 确定原子立构中心数

组胺的分子结构数据

1.疏水参数计算参考值(XlogP):无2.氢键供体数量:2 3.氢键受体数量:2 4.可旋转化学键数量:2 5.互变异构体数量:26.拓扑分子极性表面积:54.77.重原子数量:8 8.表面电荷:0 9.复杂度:64.7 10.同位素原子数量:0 11.确定原子立构中心数量:0 12.不确定原子立

溴酚蓝的分子结构数据

1、 摩尔折射率:123.262、 摩尔体积(cm3/mol):304.53、 等张比容(90.2K):893.74、 表面张力(dyne/cm):74.15、 极化率(10-24cm3):48.86

环孢菌素A的计算化学数据

疏水参数计算参考值(XlogP):7.5氢键供体数量:5氢键受体数量:12可旋转化学键数量:15互变异构体数量:16拓扑分子极性表面积(TPSA):279重原子数量:85表面电荷:0复杂度: 2330同位素原子数量:0确定原子立构中心数量:12不确定原子立构中心数量:0确定化学键立构中心数量:1不确

条码扫描数据采集器

  目前市面上的条码扫描数据采集器品牌众多,性能规格各不相同,价格不等,很多用户不知如何才能买到质量好、放心的产品。接下来,给大家分析选购工业级移动手持终端的原则。  选择条码扫描数据采集器生产厂家时,我们需要了解厂家的生产能力、产品的品质、公司整体的创新能力、以及售后服务等情况。条码扫描数据采集器

泼尼松龙的计算化学数据

1、疏水参数计算参考值(XlogP):1.62、氢键供体数量:33、氢键受体数量:54、可旋转化学键数量:25、互变异构体数量:96、拓扑分子极性表面积(TPSA):94.87、重原子数量:268、表面电荷:09、复杂度:72410、同位素原子数量:011、确定原子立构中心数量:712、不确定原子立

玉米素的计算化学数据

1.疏水参数计算参考值(XlogP):0.72.氢键供体数量:33.氢键受体数量:54.可旋转化学键数量:45.互变异构体数量:86.拓扑分子极性表面积:86.77.重原子数量:168.表面电荷:09.复杂度:25810.同位素原子数量:011.确定原子立构中心数量:012.不确定原子立构中心数量:

蟾毒色胺的分子结构数据

摩尔折射率:62.94摩尔体积(cm3/mol):173.3等张比容(90.2K):467.5表面张力(dyne/cm):52.8极化率(10-24cm3):24.95

精胺的毒理学数据

急性毒性:大鼠腹腔LD50:33 mg/kg;大鼠静脉LD50:65 mg/kg;小鼠口经LD30:650 mg/kg;小鼠腹腔LDLo:8 mg/kg;小鼠皮下注射LD30:280 mg/kg;小鼠静脉LD50:56 mg/kg。

尿囊素的分子结构数据

1、 摩尔折射率:33.422、 摩尔体积(cm3/mol):95.73、 等张比容(90.2K):288.54、 表面张力(dyne/cm):82.65、 极化率(10-24cm3):13.24

肌氨酸的计算化学数据

1. 疏水参数计算参考值(XlogP):无2. 氢键供体数量:2  3. 氢键受体数量:3 4. 可旋转化学键数量:2 5. 互变异构体数量:无6. 拓扑分子极性表面积:49.3  7. 重原子数量:6 8. 表面电荷:0 9. 复杂度:52.8 10. 同位素原子数量:0 11. 确定原子立构中心