清华大学汪玉:大模型研究,产研协作是必选项

“作为一名学者、来自高校电子工程系的系主任,我越来越发现,仅仅在学校里面已经很难独立去完成一些科学研究了。”3月31日,清华大学电子工程系教授、系主任汪玉以“无问芯穹发起人”身份,在无问芯穹组织的AI算力优化论坛上做开场演讲。演讲中他提出,在他所处的研究领域,产研协作几乎是必选项。 汪玉以目前比较火爆的大模型相关研究为例谈到,高校院所在大模型相关的生产资料层面完全没有优势,必须跟产业结合。“我相信许多计算机系的研究者无法脱离试验来推进他们的应用基础研究。” 做芯片设计的没有制造平台、做大模型的没有算力支持……“做研究的如果没有大的支撑平台来推进研究方向的发展,方向上的关键问题是什么都不知道了。这样怎么做研究?”汪玉援引美国工程院的一项报告谈到,如果高校不能产生新想法、新技术、新设备,不能经由各种公司、实体将价值体现在“货架”,那么就无法完全体现大学的价值。 “评价一个学者能不能当教授,其中重要的一项就是,他的成果能不能......阅读全文

面对大模型应用门槛高-如何大模型发挥更大价值?

原文地址:http://news.sciencenet.cn/htmlnews/2022/9/485510.shtm 人工智能预训练大模型的研发,面临着数据规模大、数据质量参差不齐、模型体积大、训练难度高、算力需求大等一系列挑战。在这样的背景下,如何加速大模型的产业落地,让大模型发挥更大价值?

国内首个“基于大模型的可进化智能体”研究启动

  近日,阿里云与清华大学智能产业研究院(AIR)共同启动“基于大模型的可进化智能体”的研究,探索模型智能体(AI Agent)共性基础技术,提升大模型多语言、多模态基础能力。这是国内首个关于可进化智能体系统化产学研融合的专项研究,也是人工智能模型能力走向持续进化的一个重要里程碑。  智能体(AI

研究揭示多模态大模型涌现类人物体概念表征

人类能够对自然界中的物体进行概念化,这一认知能力长期以来被视为人类智能的核心。当我们看到“狗”“汽车”或“苹果”时,不仅能识别它们的物理特征即尺寸、颜色、形状等,还能理解其功能、情感价值和文化意义。这种多维度的概念表征构成了人类认知的基石。随着ChatGPT等大语言模型(LLMs)的爆发式发展,一个

上海科学智能研究院发布伏羲气象大模型2.0

6月3日,复旦大学和上海科学智能研究院(以下简称上智院)联合举办“走进智能气象”主题活动暨智能气象创新生态联盟成立仪式,并发布了面向产业应用的伏羲系列气象大模型2.0(以下简称“伏羲”2.0)。包括复旦大学、中远海运科技股份有限公司、国家气候中心等共13家单位联合成立联盟,各方将共享资源,共同推进伏

抢抓大模型行业机会

  机器人在7月6日举行的2023世界人工智能大会展会现场进行投篮表演。大会展示包括大模型、芯片、机器人、智能驾驶等领域的科技成果。 新华社记者 方 喆摄  今年以来,自ChatGPT发布后,多家企业先后发布了自己的大模型产品,业内称之为“百模大战”。与此同时,产业界对大模型的关注点也在发生变化,从

AI大模型“拿捏”电池寿命

作为现代生活中不可或缺的能源载体,电池的重要性不言而喻。从清晨唤醒我们的闹钟,到随身携带的手机、平板电脑等智能设备,无一不依赖于电池提供的稳定电力。此外,随着科技的发展,电动汽车、无人机等新兴领域也广泛应用了各类高性能电池,推动了绿色出行和智能科技的进步。因此,电池不仅极大地便利了我们的日常生活,还

研究团队在新型大涡模拟模型构建与应用研究中取得进展

  随着计算机技术的快速发展,大涡模拟逐渐成为湍流模拟的主要手段,在湍流理论研究、航空航天、海洋工程等领域发挥重要作用。迄今为止,仍有一系列关键问题阻碍大涡模拟研究的发展,例如,模型的稳定性与高保真性无法兼顾的问题、传统建模囿于湍流惯性子区、可压缩湍流及转捩预测精度不足等。  中国科学院力学研究所空

香港理大研究团队以数据模型助力疫情防控

原文地址:http://news.sciencenet.cn/htmlnews/2022/1/472656.shtm 【解说】香港新一波新冠疫情来势汹汹。日前,香港特区政府召开紧急会议并以“快、准、狠”措施,与奥密克戎病毒“竞赛”。在此关键时期,香港理工大学讲座教授史文中带领研究团队利用数据模型

中国高校推出“元古大模型”助力地球科学研究

中新社武汉12月7日电(马芙蓉孙彦钦)由中国地质大学(武汉)与相关企业联合开发的“元古大模型”7日在武汉发布。该模型支持图生文、文生图、文生文等场景生成模式,验证了利用多模态大模型技术解决地球科学领域问题的技术路线。前期,依托中国地质大学(武汉)在地球生物学领域的研究成果,研究团队对62万多张古生物

东北大学研究团队发布TechGPT2.0大语言模型

近日,计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。TechGPT-2.0在继承了TechGPT-1.0全部特性的同时,通过增加多领域、多任务的数据,展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得模型更适

利用机器学习构建新型物理约束的大涡模拟模型研究

  大涡模拟作为当前及未来主流的湍流模拟方法被广泛应用于航空、航天及海洋工程等国家战略科技领域,而大涡模拟模型和方法是大涡模拟研究的核心基础。传统的大涡模拟模型方法存在诸多不足,例如既有模型难以兼顾强数值稳定性以及高保真性,导致湍流模拟的误差过大或者计算发散等问题。因此,探索新的建模思路是大涡模拟研

东北大学研究团队发布TechGPT2.0大语言模型

  近日,计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。  TechGPT-2.0在继承了TechGPT-1.0全部特性的同时,通过增加多领域、多任务的数据,展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得

香港理大研究团队以数据模型助力疫情防控

  【解说】香港新一波新冠疫情来势汹汹。日前,香港特区政府召开紧急会议并以“快、准、狠”措施,与奥密克戎病毒“竞赛”。在此关键时期,香港理工大学讲座教授史文中带领研究团队利用数据模型预测香港奥密克戎病毒的扩散情况,冀助力特区政府防控疫情。  【同期】香港理工大学讲座教授 史文中  我们现在介绍一下我

厦大尝试AI大模型破译甲骨文

近日,厦门大学信息学院自然语言处理实验室教授史晓东团队申报的“基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型”入选“探元计划2024”“创新探索型项目”TOP10榜单。基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型。厦门大学供图甲骨文也被称作“殷墟文字”,距今已有三千多年历史,是世界四大古文

大模型热要多点冷思考

  行业大模型聚焦特定领域、针对特定场景、解决特定问题,能结合企业自身独特优势去精耕细作并赋能行业,从而形成差异化优势。走向细分领域才有更多机会,综合考虑行业专业性、持续迭代和综合成本等因素,行业大模型更容易实现商业价值落地。  用“百模大战”来形容当下人工智能大模型的火热程度一点也不夸张。数据显示

北京加快大模型应用落地见效

7月1日,2024全球数字经济大会人工智能专题论坛在中关村国家自主创新示范区会议中心举办。记者从论坛获悉,北京已发布的大模型产品有71个,约占全国一半,人工智能产业高地建设成效显著。未来,北京将加快实现大模型应用落地见效。人工智能在数字经济产业发展中具有很强的“头雁”效应,以大模型为代表的生成式人工

压缩算法为大语言模型“瘦身”

据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。团队举例称,当人们使用ChatGPT时,请求

伏羲系列气象大模型2.0面世

中新社上海6月3日电 (记者 陈静)3日,“走进智能气象”主题活动暨智能气象创新生态联盟成立仪式在上海举办。全新升级、面向产业应用的伏羲系列气象大模型2.0(下文简称:“伏羲”2.0)面世,以“伏羲”2.0为核心的智能气象创新生态联盟同期成立。“伏羲”是人工智能驱动的次季节尺度气象大模型,可提供42

“大模型不是万能的”

“大模型不是万能的,不能过度神话它。”这句话,《中国科学报》记者今年在不同场合听到多次。最近一次,是在“CCF太原大模型赋能文物古建保护与传承论坛”上。自2022年底OpenAI推出大语言模型产品ChatGPT以来,世界仿佛一下子“觉醒”到大模型时代——不仅各“大厂”都在奋力发展大模型,喊出了“所有

释放AI大模型促消费潜力

  今年的《政府工作报告》提出持续推进“人工智能+”行动,旨在抓住人工智能技术突破机遇,使我国数字技术与制造优势、市场规模优势充分结合,推动人工智能大模型广泛应用,真正赋能千行百业、走进千家万户。在构建新发展格局战略背景下,AI大模型在激活内需市场、促进消费升级等方面充满“模”力。  随着人工智能技

中科闻歌发布雅意大模型

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502201.shtm

首个量子领域大模型上线了!

  百度量子计算研究所所长段润尧介绍,该量子领域大模型是在百度文心一言的基础上,使用量子领域高质量数据进行更有针对性的训练和优化而成的。它能更好地理解量子知识,执行量子领域相关任务。  据介绍,百度量子领域大模型将充分发挥技术协同效应,并提升现有大模型在训练速度、模型性能、交互效率等各个方面的能力。

清华大学汪玉:大模型研究,产研协作是必选项

  “作为一名学者、来自高校电子工程系的系主任,我越来越发现,仅仅在学校里面已经很难独立去完成一些科学研究了。”3月31日,清华大学电子工程系教授、系主任汪玉以“无问芯穹发起人”身份,在无问芯穹组织的AI算力优化论坛上做开场演讲。演讲中他提出,在他所处的研究领域,产研协作几乎是必选项。  汪玉以目前

科学家利用迁移学习建立计算大模型预测基因调控研究

  基因网络绘制需要大量转录组数据用于建立基因之间的联系,这也阻碍了一些数据有限场景(如罕见病)等研究。最近,利用迁移学习的机器学习技术在自然语言和计算机视觉等领域带来了变革性进展,其通过在大规模通用数据集上进行大模型预训练,而后迁移到数据量有限的特定任务进行微调。美国博德研究所等研究团队提出了一个

清华大学汪玉:大模型研究,产研协作是必选项

“作为一名学者、来自高校电子工程系的系主任,我越来越发现,仅仅在学校里面已经很难独立去完成一些科学研究了。”3月31日,清华大学电子工程系教授、系主任汪玉以“无问芯穹发起人”身份,在无问芯穹组织的AI算力优化论坛上做开场演讲。演讲中他提出,在他所处的研究领域,产研协作几乎是必选项。汪玉以目前比较火爆

国内首个渔业大模型范蠡大模型1.0发布

6月15日,范蠡大模型1.0 发布暨新质生产力推动京津冀现代渔业发展研讨会在京举行。会上发布了国内首个渔业大模型范蠡大模型1.0。范蠡大模型1.0由国家数字渔业创新中心主任、中国农业大学信息与电气工程学院教授李道亮团队联合中国联通、中国电信、中国移动三家运营商,以及全国主要水产院校和科研机构共同研发

国内首个渔业大模型范蠡大模型1.0发布

  6月15日,范蠡大模型1.0 发布暨新质生产力推动京津冀现代渔业发展研讨会在京举行。会上发布了国内首个渔业大模型范蠡大模型1.0。  范蠡大模型1.0由国家数字渔业创新中心主任、中国农业大学信息与电气工程学院教授李道亮团队联合中国联通、中国电信、中国移动三家运营商,以及全国主要水产院校和科研机构

大模型驱动的基因组环形可视化生成研究获进展

近日,中国科学院计算机网络信息中心科研团队研发出大模型驱动的基因组环形可视化智能生成框架AuraGenome。AuraGenome突破“人工-脚本-静态”传统范式,开创“自然语言-智能体-交互”新模式,能够将基因组数据快速转化为高质量、可交互的可视化结果,并支持全流程的可追溯与复用。在急性髓系白血病

8个小技巧“用好”大语言模型

用大语言模型,还需要技巧?在人们的印象中,这是个极其简单的操作:只需输入一个问题,立刻就能得到回答。但实际上,如何有效地与这些人工智能模型互动,发挥出它们的最大潜力,却是一个经常被忽视的话题。中国科学技术大学心理学系特任研究员林志成关注到这一话题,并在他最近的评论文章中提供了一系列的策略和指导,希望

讯飞星火正式发布语音大模型

  “听说今年尔滨特别火,作为南方小土豆还挺想去玩一下的。要不你用东北话介绍下有啥好玩的呗?”  1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪发布基于首个全国产算力训练的讯飞星火V3.5。在实操演示环节,刘聪和讯飞星火V3.5现场互动,后者一口地道的