国内首批大模型标准评测结果公布,4家通过
原文地址:http://news.sciencenet.cn/htmlnews/2023/12/514789.shtm12月22日,在全国信息技术标准化技术委员会人工智能分委会全体会议上,国内首个官方“大模型标准符合性评测”结果公布。结果显示,首批有四家公司的大模型产品通过该评测,分别为百度文心一言、腾讯混元大模型、360智脑大模型和阿里通义千问。 首批通过评测的4家单位代表领取证书 图源:中国电子技术标准化研究院 ?......阅读全文
商汤大模型多个评测表现超ChatGPT
本报讯 (记者沈湫莎)商汤科技近日公布了自研中文语言大模型“商量SenseChat 2.0”在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。评测显示,“商量”在这三个测试集中的表现均领先ChatGPT,实现了我国语言大模型研究的突破。 全球三大权威语言模型测评基准
《中医药大模型评测标准》发布
近日,中医药交叉学科和智能科学大会在中国中医科学院举办,大会主题为“AI创新中医发展、数智均衡医疗资源”。国家中医药管理局副局长、中国中医科学院院长、中国工程院院士黄璐琦表示,中医药传承数千年,积累了海量的中医诊疗医案、处方等数据,但由于中医药名词术语与一般文本差别较大,挖掘其隐藏的知识、规律和经验
商汤大模型“商量”多个评测表现超ChatGPT
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503362.shtm
谁是最会做题大模型?“高考评测”来了
2024年全国高考的“硝烟”刚刚散去不久,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国内最权威的考试之一,高考覆盖各类学科及题型,同时在开考前属于“绝密”,非常适合用来作为考查大模型智能水平
上海发布“书生·浦语”大模型:评测表现优秀
“书生·浦语”联合团队选取了20余项评测对其进行检验,其中包含全球最具影响力的四个综合性考试评测集,对“书生·浦语”、清华大学的GLM-130B、Meta的LLaMA-65B、OpenAI的ChatGPT和GPT-4进行了全面测试。6月7日,上海人工智能实验室(上海AI实验室)、商汤科技联合香港中文
国内首批大模型标准评测结果公布,4家通过
原文地址:http://news.sciencenet.cn/htmlnews/2023/12/514789.shtm12月22日,在全国信息技术标准化技术委员会人工智能分委会全体会议上,国内首个官方“大模型标准符合性评测”结果公布。结果显示,首批有四家公司的大模型产品通过该评测,分别为百度文心一言
构建生长育肥猪常用能量饲料营养价值评测模型
原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494455.shtm记者2月23日从中国科学院亚热带农业生态研究所获悉,由中国工程院院士、该所首席研究员印遇龙科研团队黄瑞林研究员主持的“生长育肥猪常用能量饲料原料营养价值评定与预测方程建立”项目,已先后
评测成绩比肩GPT4,商汤日日新大模型再升级
原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517164.shtm近日,商汤科技发布“日日新SenseNova 4.0”,多维度升级了大模型体系。据介绍,日日新SenseNova 4.0 具备更广泛的知识覆盖、更稳定的推理能力、更优秀的长文本理解力、
IDC、智源最新一期大模型评测结果出炉
6月17日记者获悉,由北京智源研究院(以下简称智源)打造的FlagEval天秤大模型评测平台实现了全面升级,并公布202406期FlagEval模型评测排行榜单。最新一期榜单显示,百度文心大模型、字节跳动“云雀”和“豆包”大模型的综合评分在闭源对话模型中位列前三,GPT-4o、百川、零一万物、k
IDC、智源最新一期大模型评测结果出炉
6月17日记者获悉,由北京智源研究院(以下简称智源)打造的FlagEval天秤大模型评测平台实现了全面升级,并公布202406期FlagEval模型评测排行榜单。最新一期榜单显示,百度文心大模型、字节跳动“云雀”和“豆包”大模型的综合评分在闭源对话模型中位列前三,GPT-4o、百川、零一万物、kim
讯飞星火在一项评测中获评“最聪明”国产大模型
原文地址:http://news.sciencenet.cn/htmlnews/2023/8/506755.shtm
权威AI基准评测发榜
6月30日,全球权威AI基准评测MLPerf最新V2.0训练评测成绩榜单公布。浪潮AI服务器表现优异,继两月前在MLPerf V2.0数据中心推理评测中斩获全部冠军后,本次又在MLPerf V2.0单机训练性能继续保持领先。 据了解,本次MLPerf 评测吸引了包括谷歌、NVIDIA、浪潮信息
第一!医渡科技大模型登顶上海AI实验室权威评测榜
5月9日,面向中文医疗大语言模型的开放评测平台MedBench更新评测榜单,医渡科技大模型(评测名:HH-YIDU-Med)以综合得分61.3分的出色成绩登顶榜首,成为榜单中首个综合评分超过60的医疗大模型。MedBench评测榜单节选 MedBench是由上海AI实验室和上海市数字医学创新中
辛烷值的评测标准
不同化学结构的烃类,具有不同的抗爆震能力。异辛烷(2,2,4-三甲基戊烷)的抗爆性较好,辛烷值给定为100。正庚烷的抗爆性差,给定为0。汽油辛烷值的测定是以异辛烷和正庚烷为标准燃料,按标准条件,在实验室标准单缸汽油机上用对比法进行的。调节标准燃料组成的比例,使标准燃料产生的爆震强度与试样相同,此
《储能用锂离子电池系统安全评测技术规范》
中国化学与物理电源行业协会团体标准公告2022年第 2号(总第16号) 中国化学与物理电源行业协会批准发布《储能用锂离子电池系统安全评测技术规范》(T/CIAPS0016―2022)标准,现予公告。本文件规定了储能用锂离子电池系统产品安全测试条件及安全量化分级方案。本文件适用于储能用锂离子电池系统
动物模型及动物疾病模型技术介绍
动物模型|动物疾病模型技术介绍 人类疾病的动物模型(animal model of human disease)是指各种医学科学研究中建立的具有人类疾病模拟表现的动物。在生物科研整体实验中,动物模型是非常重要的一环。 一、动物模型的意义 1、动物模型可复制临床上一些疾病不常见,如放射病、毒
动物模型及动物疾病模型技术介绍
动物模型|动物疾病模型技术介绍 人类疾病的动物模型(animal model of human disease)是指各种医学科学研究中建立的具有人类疾病模拟表现的动物。在生物科研整体实验中,动物模型是非常重要的一环。 一、动物模型的意义 1、动物模型可复制临床上一些疾病不常见,
动物模型及动物疾病模型技术介绍
动物模型|动物疾病模型技术介绍 人类疾病的动物模型(animal model of human disease)是指各种医学科学研究中建立的具有人类疾病模拟表现的动物。在生物科研整体实验中,动物模型是非常重要的一环。 一、动物模型的意义 1、动物模型可复制临床上一些疾病不常见,
动物模型及动物疾病模型技术介绍
动物模型|动物疾病模型技术介绍 人类疾病的动物模型(animal model of human disease)是指各种医学科学研究中建立的具有人类疾病模拟表现的动物。在生物科研整体实验中,动物模型是非常重要的一环。 一、动物模型的意义 1、动物模型可复制临床上一些疾病不常见,
动物模型及动物疾病模型技术介绍
动物模型|动物疾病模型技术介绍人类疾病的动物模型(animal model of human disease)是指各种医学科学研究中建立的具有人类疾病模拟表现的动物。在生物科研整体实验中,动物模型是非常重要的一环。一、动物模型的意义1、动物模型可复制临床上一些疾病不常见,如放射病、毒气中毒、烈性传染
百度文心大模型3.5已内测应用,实测得分超ChatGPT
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503251.shtm 6月20日消息,据内部人士透露,百度文心大模型3.5版本已内测可用。早在5月末中关村论坛上,百度创始人、董事长兼CEO李彦宏透露,百度大模型产品“文心一言”的“母本”将迎来3.5
实测得分超ChatGPT!百度文心大模型3.5版内测应用
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503256.shtm 6月20日消息,据内部人士透露,百度文心大模型3.5版本已内测可用。早在5月末中关村论坛上,百度创始人、董事长兼CEO李彦宏透露,百度大模型产品“文心一言”的“母本”将迎来3.5
科学家建立大样本猕猴脑影像标准化模型
近日,Cerebral Cortex在线发表题为Normative Analysis of Individual Brain Differences Based on a Population MRI-Based Atlas of Cynomolgus Macaques的研究论文。该研究由中国科
新模型为肾细胞癌风险分层提供标准化工具
上海交通大学医学院附属仁济医院研究员翟炜、教授郑军华团队联合多中心力量,研发多模态预测复发评分(MPRS)模型,为透明细胞肾细胞癌患者的复发风险评估与个体化治疗提供了关键技术支撑,也为肾细胞癌临床研究的风险分层提供了标准化工具。11月17日,相关研究成果发表于《npj数字医学》(npj Digi
北京师范大学发布人工智能赋能基础教育代表性成果
7月13日,“京校协同·智启未来”校城融合论坛在北京师范大学举办。论坛发布了北京师范大学在人工智能赋能基础教育方面的三项代表性成果。成果发布由北京师范大学校长于吉红致辞,北京市委常委、教育工委书记于英杰总结讲话,北京师范大学党委常委、常务副校长王守军主持。北京市教委、市科委、市教科院、市数字教育中心
小型细胞计数设备评测数据参考
由于传统的血球计数板已不能满足高速发展的细胞研究需要,市场上各种自动细胞计数的设备越来越多。常见的主要分为两 类:基于图像的细胞计数仪(Automated vision-based counter)和基于库尔特电阻抗原理的细胞计数仪。两者主要区别在于,前者扫描仪器视野内图像,依靠设定的上下限细胞大小
柴油十六烷值评测方法
柴油十六烷值的分析方法目前有三类,分别是是通过介电常数法、红外法、单缸马达法分析柴油十六烷值。 第一种,介电常数十六烷值分析方法 代表仪器有:北京兰铂RASX-100M 十六烷值测定仪 RASX辛烷值测定仪测量原理 辛烷值测定仪的原理在于对汽油的辛烷值和柴油的十六烷值的绝缘导磁率和电磁感
智能芯片如何选型?“智越计划”举办首次全体会议
12月19日,传播内容认知全国重点实验室和中国电子技术标准化研究院联合举办的智能芯片应用场景及选型需求技术交流会暨“智越计划”首次全体会议,在人民日报社新媒体大厦成功举办。来自政府、科研机构与产业界的80余家单位近两百位代表参加会议。 当前,智能芯片已经成为大国科技博弈的核心领域,打造可用好用
首个种业大语言模型“丰登”发布
4月28日,中国农业大学生物学院教授王喜庆团队联合上海人工智能实验室、崖州湾国家实验室发布首个种业大语言模型“丰登”(SeedLLM)。种业大语言模型“丰登”。中国农业大学供图“丰登”集成了先进的人工智能技术(书生·浦语2.0)与大数据分析,通过深入学习我国迄今发布的科研文献、科技书籍、种企报告和历
AI参加高考,为何偏科严重
大模型参加高考,能考多少分?近日,科技创新交流平台极客公园发布高考新课标Ⅰ卷大模型评测报告,在参试大模型中,GPT-4o以562分的成绩排名文科第一。参加评测的8款国产大模型中,字节跳动旗下的豆包成绩是542.5分,其后依次是百度文心一言4.0的537.5分和百川智能“百小应”的521分。本次大模型