《中医药大模型评测标准》发布
近日,中医药交叉学科和智能科学大会在中国中医科学院举办,大会主题为“AI创新中医发展、数智均衡医疗资源”。国家中医药管理局副局长、中国中医科学院院长、中国工程院院士黄璐琦表示,中医药传承数千年,积累了海量的中医诊疗医案、处方等数据,但由于中医药名词术语与一般文本差别较大,挖掘其隐藏的知识、规律和经验存在极大困难,阻碍了中医药的传承创新。中医药与人工智能融合创新,既是历史必然与时代刚需,更是守正创新的必由之路。“中医药大模型将传统中医与现代科技相结合,可为临床、科研提供便利,但在大模型研发应用中,也存在模型训练测评体系不健全、应用场景适用范围不可知、模型临床应用效果评估难、模型运行稳定性难保障等问题,亟需建立大模型评测技术与应用标准。”中国中医科学院中医基础理论研究所副所长赵宇平说。大会发布了《中医药大模型评测标准》,该标准主要覆盖场景丰富度、能力支持度、应用成熟度三大能力域,关注中医药大模型应用场景的覆盖广度、中医药大模型的全流......阅读全文
《中医药大模型评测标准》发布
近日,中医药交叉学科和智能科学大会在中国中医科学院举办,大会主题为“AI创新中医发展、数智均衡医疗资源”。国家中医药管理局副局长、中国中医科学院院长、中国工程院院士黄璐琦表示,中医药传承数千年,积累了海量的中医诊疗医案、处方等数据,但由于中医药名词术语与一般文本差别较大,挖掘其隐藏的知识、规律和经验
国内首批大模型标准评测结果公布,4家通过
原文地址:http://news.sciencenet.cn/htmlnews/2023/12/514789.shtm12月22日,在全国信息技术标准化技术委员会人工智能分委会全体会议上,国内首个官方“大模型标准符合性评测”结果公布。结果显示,首批有四家公司的大模型产品通过该评测,分别为百度文心一言
商汤大模型多个评测表现超ChatGPT
本报讯 (记者沈湫莎)商汤科技近日公布了自研中文语言大模型“商量SenseChat 2.0”在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。评测显示,“商量”在这三个测试集中的表现均领先ChatGPT,实现了我国语言大模型研究的突破。 全球三大权威语言模型测评基准
商汤大模型“商量”多个评测表现超ChatGPT
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503362.shtm
上海发布“书生·浦语”大模型:评测表现优秀
“书生·浦语”联合团队选取了20余项评测对其进行检验,其中包含全球最具影响力的四个综合性考试评测集,对“书生·浦语”、清华大学的GLM-130B、Meta的LLaMA-65B、OpenAI的ChatGPT和GPT-4进行了全面测试。6月7日,上海人工智能实验室(上海AI实验室)、商汤科技联合香港中文
谁是最会做题大模型?“高考评测”来了
2024年全国高考的“硝烟”刚刚散去不久,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国内最权威的考试之一,高考覆盖各类学科及题型,同时在开考前属于“绝密”,非常适合用来作为考查大模型智能水平
评测成绩比肩GPT4,商汤日日新大模型再升级
原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517164.shtm近日,商汤科技发布“日日新SenseNova 4.0”,多维度升级了大模型体系。据介绍,日日新SenseNova 4.0 具备更广泛的知识覆盖、更稳定的推理能力、更优秀的长文本理解力、
IDC、智源最新一期大模型评测结果出炉
6月17日记者获悉,由北京智源研究院(以下简称智源)打造的FlagEval天秤大模型评测平台实现了全面升级,并公布202406期FlagEval模型评测排行榜单。最新一期榜单显示,百度文心大模型、字节跳动“云雀”和“豆包”大模型的综合评分在闭源对话模型中位列前三,GPT-4o、百川、零一万物、k
IDC、智源最新一期大模型评测结果出炉
6月17日记者获悉,由北京智源研究院(以下简称智源)打造的FlagEval天秤大模型评测平台实现了全面升级,并公布202406期FlagEval模型评测排行榜单。最新一期榜单显示,百度文心大模型、字节跳动“云雀”和“豆包”大模型的综合评分在闭源对话模型中位列前三,GPT-4o、百川、零一万物、kim
中医药人工智能大模型正式启动
6月15日,在横琴粤澳深度合作区举行的中医药广东省实验室(以下简称横琴实验室)第一届学术委员会第一次会议暨首届横琴中医药科技创新大会上,中医药横琴大模型、中药新药智能自动化融合创新平台同时启动。这也是该实验室揭牌半年来取得的新进展。2023年12月,横琴实验室正式揭牌成立,成为广东省实验室体系中的一
辛烷值的评测标准
不同化学结构的烃类,具有不同的抗爆震能力。异辛烷(2,2,4-三甲基戊烷)的抗爆性较好,辛烷值给定为100。正庚烷的抗爆性差,给定为0。汽油辛烷值的测定是以异辛烷和正庚烷为标准燃料,按标准条件,在实验室标准单缸汽油机上用对比法进行的。调节标准燃料组成的比例,使标准燃料产生的爆震强度与试样相同,此
讯飞星火在一项评测中获评“最聪明”国产大模型
原文地址:http://news.sciencenet.cn/htmlnews/2023/8/506755.shtm
第一!医渡科技大模型登顶上海AI实验室权威评测榜
5月9日,面向中文医疗大语言模型的开放评测平台MedBench更新评测榜单,医渡科技大模型(评测名:HH-YIDU-Med)以综合得分61.3分的出色成绩登顶榜首,成为榜单中首个综合评分超过60的医疗大模型。MedBench评测榜单节选 MedBench是由上海AI实验室和上海市数字医学创新中
AI赋能未来药学,数智岐黄中医药大模型发布
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/516371.shtm1月19日,由华东师范大学主办的“AI赋能下的未来药学产学研发展论坛暨华东师范大学药学学科发展大会”在沪召开。会上发布了“数智岐黄”中医药大模型,该大模型由华东师范大学、上海中医药大学
构建生长育肥猪常用能量饲料营养价值评测模型
原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494455.shtm记者2月23日从中国科学院亚热带农业生态研究所获悉,由中国工程院院士、该所首席研究员印遇龙科研团队黄瑞林研究员主持的“生长育肥猪常用能量饲料原料营养价值评定与预测方程建立”项目,已先后
全面走向“人工智能+”-国内首个汽车大模型标准发布
中国信息通信研究院(简称“中国信通院”)今天(28日)发布了国内首个汽车大模型标准。 标准主要涵盖三个能力域,其中场景丰富度侧重评估汽车大模型对智能座舱和自动驾驶等细分场景的支持情况,能力支持度重点关注汽车大模型在感知、理解、推理、生成等人工智能技术能力上的表现,应用成熟度主要评估汽车大模型在
面对大模型应用门槛高-如何大模型发挥更大价值?
原文地址:http://news.sciencenet.cn/htmlnews/2022/9/485510.shtm 人工智能预训练大模型的研发,面临着数据规模大、数据质量参差不齐、模型体积大、训练难度高、算力需求大等一系列挑战。在这样的背景下,如何加速大模型的产业落地,让大模型发挥更大价值?
μ介子实验大搬家-有望颠覆粒子物理学标准模型
研究人员为储存环制定旅行路线。 要去一个新地点,GPS导航仪会告诉你应该怎样走。如果你询问它如何从美国纽约厄普顿到芝加哥西郊,它会告诉你沿着80号州际公路一直向西行驶14个小时即可,而不是花费6周时间乘驳船沿东海岸向南航行,绕过佛罗里达州,穿过墨西哥湾,沿密西西比河溯流而上。 然而当
抢抓大模型行业机会
机器人在7月6日举行的2023世界人工智能大会展会现场进行投篮表演。大会展示包括大模型、芯片、机器人、智能驾驶等领域的科技成果。 新华社记者 方 喆摄 今年以来,自ChatGPT发布后,多家企业先后发布了自己的大模型产品,业内称之为“百模大战”。与此同时,产业界对大模型的关注点也在发生变化,从
AI大模型“拿捏”电池寿命
作为现代生活中不可或缺的能源载体,电池的重要性不言而喻。从清晨唤醒我们的闹钟,到随身携带的手机、平板电脑等智能设备,无一不依赖于电池提供的稳定电力。此外,随着科技的发展,电动汽车、无人机等新兴领域也广泛应用了各类高性能电池,推动了绿色出行和智能科技的进步。因此,电池不仅极大地便利了我们的日常生活,还
权威AI基准评测发榜
6月30日,全球权威AI基准评测MLPerf最新V2.0训练评测成绩榜单公布。浪潮AI服务器表现优异,继两月前在MLPerf V2.0数据中心推理评测中斩获全部冠军后,本次又在MLPerf V2.0单机训练性能继续保持领先。 据了解,本次MLPerf 评测吸引了包括谷歌、NVIDIA、浪潮信息
109项中医药团体标准发布
26日,中华中医药学会联合中国中药协会、中国针灸学会、中国民族医药学会和中国药膳研究会在京发布109项中医药团体标准。对规范中医药临床诊疗、基本术语及评价方法等意义重大。 中华中医药学会发布《中医临床诊疗指南编制通则》等32项标准,明确中医临床诊疗指南制定的程序、方法、结构,同时在借鉴国际通用
百度文心大模型3.5已内测应用,实测得分超ChatGPT
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503251.shtm 6月20日消息,据内部人士透露,百度文心大模型3.5版本已内测可用。早在5月末中关村论坛上,百度创始人、董事长兼CEO李彦宏透露,百度大模型产品“文心一言”的“母本”将迎来3.5
实测得分超ChatGPT!百度文心大模型3.5版内测应用
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503256.shtm 6月20日消息,据内部人士透露,百度文心大模型3.5版本已内测可用。早在5月末中关村论坛上,百度创始人、董事长兼CEO李彦宏透露,百度大模型产品“文心一言”的“母本”将迎来3.5
什么是标准大气模型
关于大气分布模型张捍卫李彬华杨磊铁琼仙冒蔚中国科学院国家天文台云南天文台云南昆明’昆明理工大学云南昆明’摘要简述了大气垂直分布情况和高空探测方法分析了目前只能采用球对称大气分布模型的原因论证了随观测站、随方位而异的天文大气折射实测模型和折射延迟改正模型已经包含了观测站上空大气实际分布的非球对称特性不
厦大尝试AI大模型破译甲骨文
近日,厦门大学信息学院自然语言处理实验室教授史晓东团队申报的“基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型”入选“探元计划2024”“创新探索型项目”TOP10榜单。基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型。厦门大学供图甲骨文也被称作“殷墟文字”,距今已有三千多年历史,是世界四大古文
GS-Junior、MiSeq和PGM-三大主流基因组测序仪对比评测
新一代基因组测序技术(Next-Generation Sequencing Technology)可谓掀开了生命科学新的篇章,不仅促进了许多研究方向的复苏或蓬勃发展,也为大众化基因组测序带来了希望,但是对于不熟悉测序技术的科研人员来说,要从这个竞争激烈的行业过热宣传中找到自己想要的测序仪,并
AI参加高考,为何偏科严重
大模型参加高考,能考多少分?近日,科技创新交流平台极客公园发布高考新课标Ⅰ卷大模型评测报告,在参试大模型中,GPT-4o以562分的成绩排名文科第一。参加评测的8款国产大模型中,字节跳动旗下的豆包成绩是542.5分,其后依次是百度文心一言4.0的537.5分和百川智能“百小应”的521分。本次大模型
释放AI大模型促消费潜力
今年的《政府工作报告》提出持续推进“人工智能+”行动,旨在抓住人工智能技术突破机遇,使我国数字技术与制造优势、市场规模优势充分结合,推动人工智能大模型广泛应用,真正赋能千行百业、走进千家万户。在构建新发展格局战略背景下,AI大模型在激活内需市场、促进消费升级等方面充满“模”力。 随着人工智能技
“大模型不是万能的”
“大模型不是万能的,不能过度神话它。”这句话,《中国科学报》记者今年在不同场合听到多次。最近一次,是在“CCF太原大模型赋能文物古建保护与传承论坛”上。自2022年底OpenAI推出大语言模型产品ChatGPT以来,世界仿佛一下子“觉醒”到大模型时代——不仅各“大厂”都在奋力发展大模型,喊出了“所有