利用深度学习对短文本产品名称分类的研究

一、研究背景 在数字化浪潮的冲击下,基于产品质量安全监管的信息化基础,运用大数据、自然语言处理、机器学习等技术,让信息横向在不同区域间、纵向在各级市场监管部门流通,是一个有重要意义且需要我们在业务支撑工作中不断思考的议题。 为了实现数据赋能,一方面要实现数据的持续有效汇集,另一方面要加强数据分析挖掘能力,从而有效感知数据。目前产品质量监督抽查的数据来源主要包括国家监督抽查和地方监督抽查,从抽查特点看,国家监督抽查侧重在舆情关注度较高、风险隐患较大的产品领域开展,而地方监督抽查聚焦区域内的重要业态,具有产品覆盖范围广、数据量大的特点,是产品质量监测工作体系的重要数据组成,占监督抽查数据总量的90%以上,数据中隐藏着大量行业、地区监管薄弱点和质量提升重点的信息。然而开展数据分析首先需要准确标识产品分类,才能实现区域间产品质量安全信息的共享和业务协同。2018年以来,上报的地方监督抽查数据达到176万批次1 ,产品命名超......阅读全文

数据密集时代,科研信息化如何优化升级

原文地址:http://news.sciencenet.cn/htmlnews/2023/11/512050.shtm   《中国科研信息化蓝皮书2022》,中国科学院等编,电子工业出版社2023年10月出版,定价:298元 ■本报记者 胡珉琦 近期,中国科学院联合教育部、科学

单细胞数据挖掘算法方面取得新进展

图 SEVtras高效识别单细胞转录组数据中的胞外小囊泡  在国家自然科学基金项目(批准号:32025009、32130020等)资助下,中国科学院北京生命科学研究院赵方庆团队在单细胞数据挖掘算法方面取得新进展,研究成果以“SEVtras识别单细胞转录组中液滴分辨率的胞外小囊泡(SEVtras de

环境产业业数据采集的逐步信息化-站上“云端”

  如今,随着环境产业数据采集的逐步信息化,不仅让环境管理部门、环境企业及时掌握了更多的数据与信息,更达成了优化环境管理的基础。在大数据、“互联网+”等智能技术和理念已成为治理能力现代化重要手段的同时,未来还需尽快制定环保数据资源服务产业政策,培育和扶持一批大数据服务企业  

信息化和数据化为抓手,提升检验检测技术能力

  2022年6月26日,第24届科协年会系列活动精彩继续。由中国检验检测学会、湖南省检验检测学会、岳麓高新技术产业开发区(湖南省检验检测特色产业园)主办的“入湘行动”检验检测数字化座谈会在湖南省科学技术协会举办。这次座谈会的主要议题是以信息化建设和数据利用为抓手,努力提升检验检测技术能力,为检测检

生命大数据──样本数字化多组学层次的生命健康大数据

  2015 年初,奥巴马提出精准医学计划,意在大规模测定癌症病人的全基因组,获得大数据,挖掘癌症驱动基因,实现个性化精准用药,解决癌症对人类的威胁。2016 年初,拜登的癌症登月计划(Cancer Moonshot 2020)使精准医学计划正式落地。精准医学很快红遍全球,在世界各地、在国内也迅速催

微软的医疗布局:瞄准医疗信息化与基因数据

  2018年,微软陆续在iOS、Android、Windows商店中删除了HealthVault Insights——由微软在2017年2月与Healtcare NExT同时推出的一款为特定患者提供长期呵护和康复计划的软件。  这一措施并不意味着微软退出个人护理领域,相反,这表明Microsoft

Benchmarker一种可靠的对GWAS数据进行挖掘的算法

  全基因组关联研究(GWAS)针对大量人群寻找有助于常见的多基因特征(如身高或肥胖)的基因。这些综合性研究经常发现大量微小的遗传变异,这些变异在高龄,肥胖等人群中更常发生。但这种相关性并不一定意味着因果关系的存在。  虽然有许多计算算法可用于帮助提取GWAS结果,但很难知道选择哪一种。研究人员在《

注水算法

迭代注水算法是由Wei Yu提出的,它是一种多用户功率分配算法。这是一种自私算法,当接收端和发送端没有共享信道信息时,它的实现非常简单,复杂度低。但是,当信道上有共享信 息,需要共享信道,这是网络拓扑就会出现远近效应,这就产生了非平衡状态,引起用户间信号干扰,信息传输效率下降。       迭代注水

双向扫描算法和电梯调度算法区别

双向扫描算法和电梯调度算法区别:1、双向扫描(SCAN)算法不仅考虑到欲访问的磁道与当前磁道间的距离,更优先考虑的是磁头,当前的移动方向。例如,当磁头正在自里向外移动时,SCAN算法所考虑的下一个访问对象应足其欲访问的磁道既在当前磁道之外,又是距离最近的。这样自里向外地访问直至再无更外的磁道需要访问

长六改发射场的“超级大脑”

3月29日17时50分,我国成功发射长征六号改(以下简称长六改)运载火箭。此次任务,是长六改运载火箭首飞,也是某新型发射工位首次亮相。  该新型发射工位采用多种自主可控的先进技术和算法,信息化、智能化水平大幅提升。智慧发射场系统就是该工位的“超级大脑”。  在“超级大脑”的指挥下,长六改运载火箭发射

大数据+智能算法有望治愈抑郁症和精神类疾病

  近几年,多个大型而长期的脑研究项目问世,包括投资60亿美元的“美国脑计划(US BRAIN Initiative)”、欧盟投资10亿欧元的“人类脑计划(HBP)”;中国和日本也都在2016年初发布了重大的脑科学项目,希望能通过研究猴子来理解人脑。2016年,“脑科学与类脑研究”被“十三五”规划纲

基于变体GRU预处理网络数据包的入侵检测优化算法

  在网络空间中,用入侵检测(Intrusion Detection System,IDS)判断网络数据包是否包含攻击对于防范网络攻击和保护信息安全具有重要意义。现有的IDS算法存在两个问题,一是利用人工经验大量提取的特征无法准确描述网络数据包;二是神经网络结构复杂、内存占用大、功耗大。  中国科学

大数据成为反腐利器-新算法体系精准发现疑似问题线索

  如何从碎片化、结构化的电子政务大数据中发现疑似问题线索?  中科院计算所的研究团队经过长期研究找到了答案。  “在不同电子政务系统产生的偶然数据中蕴含着具体人、具体事的必然章法和趋势。”在中科院计算所研究员方金云看来,大数据具有使小恶小善振荡放大的力量,有助于从电子政务数据中精准发现疑似问题线索

加速新药研发!新算法助力质谱数据准确高效预测小分子

  小分子的鉴定是生命科学一项关键任务。质谱(mass spectrometry,MS)可用于分析化合物成分,高通量质谱技术能够从数十万个环境中收集小分子的串联质谱。然而,现有的方法是基于化学领域的知识,无法解释小分子质谱中的许多峰。  卡内基梅隆大学和俄罗斯圣彼得堡国立大学的研究人员提出一种算法—

数字化时代的科学仪器行业:揭秘消耗品企业数字化现状

  2020年,一场疫情如疾风暴雨般催生了企业数字化转型的浪潮。宛如一道历史的分水岭,将我们的命运导向一个全新的方向。企业们也纷纷加快了自身数字化进程的步伐,仿佛在追逐一场生死存亡的竞跑。  与此同时,中国已将数字化提升至国家战略的高度,将其视为了实现强国之梦的关键一环。   传统制造业是现代化产业

2023全球人工智能开发者先锋大会在沪开幕

原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494584.shtm 中新网上海2月25日电 (记者 郑莹莹)2023全球人工智能开发者先锋大会(GAIDC)25日在上海临港开幕,大会以“向光而行的AI开发者”为主题。 开幕式上,上海国际算法创

提升数字化治理水平-大数据助力社会治理创新论坛召开

   “提升数字化治理水平,更重要的是要加大数字化或者智能化运用的力度和深度。”9月28日,由中国国际大数据产业博览会组委会主办的“永不落幕的数博会”2020系列活动——“大数据助力社会治理创新论坛”在北京举行,国务院发展研究中心公共管理与人力资源研究所所长李建伟在活动上如是说。  在论坛活动上,与

昆明动物所开发出适用于高通量异质性数据算法

  挖掘肿瘤大数据有助于识别和总结肿瘤发生、发展过程的分子变化规律。然而,肿瘤组织高度异质性、批次效应等因素是肿瘤数据分析的重要难题,而目前常用的转录组数据分析方法对于肿瘤离群值极度敏感,容易产生假阴性结果。针对此,中国科学院昆明动物研究所科研人员开发了一种新的不依赖均一化、非参的高维大数据分析算法

高效的集合卡尔曼滤波热层电离层数据同化算法

  全球导航卫星系统、短波通信等无线电波在传播过程中会受到地球的高层大气(电离层/热层)的折射、散射影响,因此对高层大气的日常监测和预报具有重要意义。电离层是高层大气的电离成分,受太阳辐射条件控制,这意味着它不能太长时间地“记住”过去,通常只有2-3小时的提前预报时间。热层是高层大气的中性成分,受太

香山科学会议聚焦“信息技术推进国家治理现代化”

  “在数字化与智能化时代背景下,加强国家治理现代化研究,对加快实现中国式现代化意义重大。随着数字化社会系统的复杂性增加,更加需要从系统科学的视角,对信息技术如何推进国家治理现代化进行系统分析与深入探讨。”近日,在香山科学会议第S70次学术讨论会上,会议执行主席、中国科学院信息科学学部主任、中国科学

麦穗图像数据库在于农业生产和研究现场的AI算法测试...

麦穗图像数据库在于农业生产和研究现场的AI算法测试的应用Plant Phenomics | 小麦麦穗自动检测大规模图像数据库:为可用于农业生产和研究现场的AI算法测试奠基在国际协作下,来自7个国家、9个研究机构的十几名研究人员创建了基于提高通用性的图像来自动检测小麦麦穗的大规模数据库。构建了用于小麦

加强数字乡村建设,让农业“更智慧”

由黑龙江省人民政府、国家发展和改革委员会、科学技术部、工业和信息化部共同主办的2022世界5G大会将于8月10日至12日在黑龙江省哈尔滨市召开。  中国工程院院士、国家农业信息化工程技术研究中心主任赵春江在接受科技日报记者专访时表示:“当前,5G技术正处于大规模落地普及时期,其与农业的有效结合,将对

基质效应的算法

化学分析中,基质指的是样品中被分析物以外的组分。基质常常对分析物的分析过程有显著的干扰,并影响分析结果的准确性。例如,溶液的离子强度会对分析物活度系数有影响,这些影响和干扰被称为基质效应(matrix effect)。去除方法  目前最常用的去除基质效应的方法是,通过已知分析物浓度的标准样品,同时尽

缺陷检测算法

基本两个步骤:1、缺陷检出,算法较多,本人认为是不变矩阵法和主成分分析法;2、缺陷识别和分类,多数使用BP神经网络进行训练,提高识别率。

周勇教授:“分块集成算法为大数据分析提供可发展前景”

  我们正处于数据呈现井喷式增长的时代,大数据已成为当前前沿研究和应用的热点问题,随着社会经济与科技活动变得日益互联多元,形成海量超高维的数据资源,这些资源与现代信息技术的结合极大地推动了大数据产业链的形成,科学技术的进步。在现代生活的各个领域,大数据的价值日益突显,例如,越来越多的机构收集存储并分

地面激光雷达数据为基础的叶倾角和方位角提取算法研究

叶片角度分布(Leaf Angle Distribution,LAD)包括叶倾角分布和方位角分布,是描述植被冠层结构的一个重要参数。由于叶片角度分布对植被冠层中光线的传输过程和光合有效辐射的分布有着显著的影响,因此它在陆地生态系统冠层生产力和碳循环研究中具有十分重要的作用。然而,传统测量设备和方法往

2023年中国体外诊断(IVD)仪器行业转型升级现状发展分析

 行业主要上市公司:迈普医学(301033);迪瑞医疗(300396);昊海生科(688366);翔宇医疗(688626);科美诊断(688468)等本文核心数据:业务结构优化动态;产业信息化管理布局;数字化转型布局;低碳化/绿色转型1、中国体外诊断仪器行业升级发展路径:行业升级发展四个基本路径中国

未来三年算力基础设施建设量化指标明确-专家:利好四大下游应用领域

  工业和信息化部官网显示,10月8日,工业和信息化部、中央网信办、教育部、国家卫生健康委、中国人民银行、国务院国资委等六部门联合印发《算力基础设施高质量发展行动计划》(下称《行动计划》),明确了未来三年算力基础设施发展的具体目标。  四方面提出  到2025年发展量化指标  《行动计划》从计算力、

营造良好生态-推进教育数字化转型发展

原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494233.shtm 数字技术改变着社会主体之间的连接、沟通、互动与交易方式,重组生产组织模式,将形成与工业社会不同的社会运转机制。数字技术不仅拓展了社会单元连接的边界,重组了社会生产组织模式,也带来

广东省药品检验所积极打造数字化检验检测新模式

  近年来,广东省药品检验所以信息化建设和数据利用为抓手,努力提升检验技术能力,通过四个方面打造数字化检验检测模式:  一是统一认识,创新应用,以检验业务为核心,坚持药检信息化发展道路。该所始终坚持以创新行业应用作为信息化建设的路径,积极学习其他行业的经验,大胆引进新技术、新项目,实现了多个行业信息