压缩算法为大语言模型“瘦身”

据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。团队举例称,当人们使用ChatGPT时,请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行LLM,就需要对这些LLM进行压缩。CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。......阅读全文

人工智能新模型可解码DNA隐藏“语言”

DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上

文斐:研究解决大型语言模型的存储瓶颈问题

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/497858.shtm“由于半导体器件的物理限制,摩尔定律已经难以为继;今后计算机芯片的效率提升将主要来源于体系架构的创新。”华南理工大学计算机科学与工程学院原院长、广东省计算机学会理事长韩国强对《中国科学

机器学习算法助力新模型实现羊肉精准溯源

近日,中国农业科学院农产品加工研究所肉品科学与营养工程创新团队将非靶向代谢组学与机器学习方法相结合,成功构建了羊肉产地精准判别模型,为羊肉产地精准溯源提供了新方法。相关研究成果发表于《食品化学X》(Food Chemistry: X)。受肉羊品种和饲养环境影响,羊肉品质具有鲜明的地域特征,因此地理标

面对大模型应用门槛高-如何大模型发挥更大价值?

原文地址:http://news.sciencenet.cn/htmlnews/2022/9/485510.shtm 人工智能预训练大模型的研发,面临着数据规模大、数据质量参差不齐、模型体积大、训练难度高、算力需求大等一系列挑战。在这样的背景下,如何加速大模型的产业落地,让大模型发挥更大价值?

MOFormer:无需3D结构、基于Transformer的预测语言模型

金属有机框架(MOF)是具有高比表面积、高孔隙率和结构可设计的结晶性多孔材料,可用于气体吸附、气体储存、气体分离、催化剂等领域。  然而,MOF 的化学空间非常巨大。发现适合特定应用的最佳 MOF 需要对无数潜在候选材料进行高效、准确的搜索。快速且低成本地为特定任务选择性能最佳的 MOF 一直具有挑

科学家评估大型语言模型回答医学问题的能力

  图为研究团队的方法和现有技术的比较。Flan-PaLM540B模型在MedQA,MedMCQA和PubMedQA数据集上均超过了以往最先进的SOTA,每列上方显示的是准确率百分比。  你在网上搜过“我哪哪疼是不是得了啥啥病”吗?答案可能不尽如人意。但随着ChatGPT等大型自然语言模型(LLM)

警惕AI技术泡沫-梅宏院士呼吁建立完善治理体系

“智能是人类区别于其他动物的专有特征,特别是认知能力,我们可以接受机器在感知能力方面超越人类,但对机器认知智能的研发,需要高度审慎。从科技伦理的视角来看,我们为什么要去造出一个替代我们认知的东西?”11月22日,在以“跨越边界的科技伦理”为主题的第二届中国科技伦理高峰论坛上,中国科学院院士、北京大学

新人工智能模型和算法揭开肿瘤基因内在交互关系

近日,《自然》子刊 NPJ Precision Oncology发表了中国科学院大学张正军教授团队等关于一类新型人工智能AI模型和算法并应用到结直肠癌关键基因识别的研究成果。研究发现,由组织样本识别出的4个基因及其交互关系就可以完全识别结直肠癌。这四个基因使用了来自与世界不同地区不同人种不同研究目标

抢抓大模型行业机会

  机器人在7月6日举行的2023世界人工智能大会展会现场进行投篮表演。大会展示包括大模型、芯片、机器人、智能驾驶等领域的科技成果。 新华社记者 方 喆摄  今年以来,自ChatGPT发布后,多家企业先后发布了自己的大模型产品,业内称之为“百模大战”。与此同时,产业界对大模型的关注点也在发生变化,从

AI大模型“拿捏”电池寿命

作为现代生活中不可或缺的能源载体,电池的重要性不言而喻。从清晨唤醒我们的闹钟,到随身携带的手机、平板电脑等智能设备,无一不依赖于电池提供的稳定电力。此外,随着科技的发展,电动汽车、无人机等新兴领域也广泛应用了各类高性能电池,推动了绿色出行和智能科技的进步。因此,电池不仅极大地便利了我们的日常生活,还

崖州湾国家实验室联合发布首个种业大语言模型

人工智能技术能给“农业芯片”带来怎样的助力?国内首个种业大语言模型的推出,或许可以给出全新的探索路径。据崖州湾国家实验室最新发布消息,崖州湾国家实验室精准设计与智造团队联合中国农业大学、上海人工智能实验室共同发布首个种业大语言模型“丰登” ,英文名称Large Language Model for

厦大尝试AI大模型破译甲骨文

近日,厦门大学信息学院自然语言处理实验室教授史晓东团队申报的“基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型”入选“探元计划2024”“创新探索型项目”TOP10榜单。基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型。厦门大学供图甲骨文也被称作“殷墟文字”,距今已有三千多年历史,是世界四大古文

我国在统计物理思想的确定性算法求解压缩取得进展

  近期, 理论物理研究所周海军研究员等对基于统计物理思想的确定性算法求解压缩感知问题进行了深入的研究,取得了阶段性的突破进展,论文于2018年2月28日发表于国际电气和电子工程师协会的综合性学报 IEEE Access上。  压缩感知是一种新型数据采集和储存方法,于2004年由陶哲轩等学者提出并引

剑桥学者称语言仍是全球科研交流一大障碍

  尽管在当前的信息时代,学术交流已达空前便捷水平,但对于每年发布的大量科研论文和书籍等资料,语言仍会在各国学者交流时造成不小障碍。  剑桥大学日前发表报告说,全球主要科研期刊大多以英语作为出版语言,但仍有不少研究成果是以英语以外的语言发表。不管哪种语言,当科研成果只以单一一种语言发表时,对知识的传

释放AI大模型促消费潜力

  今年的《政府工作报告》提出持续推进“人工智能+”行动,旨在抓住人工智能技术突破机遇,使我国数字技术与制造优势、市场规模优势充分结合,推动人工智能大模型广泛应用,真正赋能千行百业、走进千家万户。在构建新发展格局战略背景下,AI大模型在激活内需市场、促进消费升级等方面充满“模”力。  随着人工智能技

伏羲系列气象大模型2.0面世

中新社上海6月3日电 (记者 陈静)3日,“走进智能气象”主题活动暨智能气象创新生态联盟成立仪式在上海举办。全新升级、面向产业应用的伏羲系列气象大模型2.0(下文简称:“伏羲”2.0)面世,以“伏羲”2.0为核心的智能气象创新生态联盟同期成立。“伏羲”是人工智能驱动的次季节尺度气象大模型,可提供42

大模型热要多点冷思考

  行业大模型聚焦特定领域、针对特定场景、解决特定问题,能结合企业自身独特优势去精耕细作并赋能行业,从而形成差异化优势。走向细分领域才有更多机会,综合考虑行业专业性、持续迭代和综合成本等因素,行业大模型更容易实现商业价值落地。  用“百模大战”来形容当下人工智能大模型的火热程度一点也不夸张。数据显示

中科闻歌发布雅意大模型

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502201.shtm

首个量子领域大模型上线了!

  百度量子计算研究所所长段润尧介绍,该量子领域大模型是在百度文心一言的基础上,使用量子领域高质量数据进行更有针对性的训练和优化而成的。它能更好地理解量子知识,执行量子领域相关任务。  据介绍,百度量子领域大模型将充分发挥技术协同效应,并提升现有大模型在训练速度、模型性能、交互效率等各个方面的能力。

“大模型不是万能的”

“大模型不是万能的,不能过度神话它。”这句话,《中国科学报》记者今年在不同场合听到多次。最近一次,是在“CCF太原大模型赋能文物古建保护与传承论坛”上。自2022年底OpenAI推出大语言模型产品ChatGPT以来,世界仿佛一下子“觉醒”到大模型时代——不仅各“大厂”都在奋力发展大模型,喊出了“所有

北京加快大模型应用落地见效

7月1日,2024全球数字经济大会人工智能专题论坛在中关村国家自主创新示范区会议中心举办。记者从论坛获悉,北京已发布的大模型产品有71个,约占全国一半,人工智能产业高地建设成效显著。未来,北京将加快实现大模型应用落地见效。人工智能在数字经济产业发展中具有很强的“头雁”效应,以大模型为代表的生成式人工

轴向压缩柱具备的八大优点

轴向压缩指制备柱装填时活塞的压缩方向是纵轴面,这是相对于径向压缩和环形压缩而言的。其中轴向压缩成本最低,效果最高。轴向压缩柱的优点:   1、采用领先的结构设计、操作灵活方便、体积小、外形美观等;   2、活塞升降速度快捷平稳,液流分配均匀,密封性能好,耐压高,稳压时间长等;   3、装填过程简单易

科研团队成功利用人工智能蛋白语言模型揭示生命演化奥秘

  为什么不同生物在适应相似环境时,会独立演化出相似的功能?一项最新研究从蛋白质的“高阶特征”层面揭示了这一生命演化奥秘的重要机制。  这项研究由中国科学院动物研究所邹征廷研究员团队完成,成功利用人工智能领域的蛋白语言模型,揭示了蛋白高阶特征在功能适应性趋同演化中的关键作用,为理解生命演化之谜提供了

崖州湾国家实验室联合发布首个种业大语言模型“丰登”

4月28日,崖州湾国家实验室精准设计与智造团队与中国农业大学、上海人工智能实验室共同发布首个种业大语言模型“丰登”。该模型集成了先进的人工智能技术与大数据分析,对海量来自不同渠道的育种科研文献、技术书籍及网络资源进行深度解析和索引,在品种选育过程、农艺性状描述、栽培技术推荐和历史推广区域查询等四大应

提高大语言模型可信度,新方法助生成式AI破除“幻觉”

人工智能(AI)在给出准确答案的同时,也会有一些“胡乱输出”令人难辨真假,这被称为“幻觉”(hallucination)。而新一期《自然》杂志发表的一项研究报道了一种新方法,能检测大语言模型(LLM)产生的“幻觉”,即该方法能测量生成回答的含义的不确定性,或能提升LLM输出答案的可靠性。类似Chat

研究提出纳米尺度最优等效超晶胞原子模型算法

近日,西安交通大学电气工程学院新型储能与能量转换纳米材料研究中心肖冰教授课题组提出了基于高熵及多相材料介观尺度原子无序排布特征进行映射的算法来构建底层纳米尺度最优等效超晶胞原子模型的全新逆向结构缩放算法,实现对已有外延建模算法原理性突破。相关研究成果发表于《计算机物理通讯》上。逆向结构映射设缩放计算

为什么这种算法能改善近红外模型在仪器间的转移效果?

  近日,技术生物所吴跃进研究员课题组发展了一种近红外光谱技术方向的新算法,该算法可有效改善近红外模型在仪器间的转移效果。相关工作已经被光谱学期刊Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy接收并在线发表。采用

研究提出纳米尺度最优等效超晶胞原子模型算法

近日,西安交通大学电气工程学院新型储能与能量转换纳米材料研究中心肖冰教授课题组提出了基于高熵及多相材料介观尺度原子无序排布特征进行映射的算法来构建底层纳米尺度最优等效超晶胞原子模型的全新逆向结构缩放算法,实现对已有外延建模算法原理性突破。相关研究成果发表于《计算机物理通讯》上。逆向结构映射设缩放计算

国内首个渔业大模型范蠡大模型1.0发布

  6月15日,范蠡大模型1.0 发布暨新质生产力推动京津冀现代渔业发展研讨会在京举行。会上发布了国内首个渔业大模型范蠡大模型1.0。  范蠡大模型1.0由国家数字渔业创新中心主任、中国农业大学信息与电气工程学院教授李道亮团队联合中国联通、中国电信、中国移动三家运营商,以及全国主要水产院校和科研机构

国内首个渔业大模型范蠡大模型1.0发布

6月15日,范蠡大模型1.0 发布暨新质生产力推动京津冀现代渔业发展研讨会在京举行。会上发布了国内首个渔业大模型范蠡大模型1.0。范蠡大模型1.0由国家数字渔业创新中心主任、中国农业大学信息与电气工程学院教授李道亮团队联合中国联通、中国电信、中国移动三家运营商,以及全国主要水产院校和科研机构共同研发