百度王海峰:大模型规模定律未来几年仍然有效

“从人工智能技术发展趋势来看,未来几年,规模定律依然有效,大语言模型仍有很大提升空间。”6月14日,2024北京智源大会在京举行。百度首席技术官王海峰在主旨演讲中对人工智能技术发展作出最新判断。他认为,大模型为通用人工智能带来曙光,可以从两个角度解读,一是人工智能技术的通用性,二是能力的全面性。王海峰。图源:百度在技术的通用性方面,王海峰提出,大模型在解决不同任务、语言、模态、场景的通用性都变得越来越好。以自然语言处理为例,之前有分词、句法分析、语义匹配、机器翻译、问答、对话、等等很多个子方向,现在一个大语言模型就可以解决绝大多数任务;语言方面,大模型既可以解决单语言的问题,也可以跨语言——不仅学习了人类的自然语言,也学习了人工定义的形式语言,架起了从思考到执行的桥梁;同时,大模型也可以实现多模态的统一建模,广泛赋能各行各业应用等等。总体上,人工智能技术的通用性越来越强。在能力的全面性方面,王海峰表示,理解、生成、逻辑、记忆是人......阅读全文

日本将开发更强日语能力的“大语言模型”人工智能技术

据共同社消息,日本东北大学和日本东京工业大学等团队计划开发一种更强日语能力的“大语言模型”,作为生成式人工智能(AI)的基础技术。该团队将利用理化学研究所的超级计算机“富岳”学习大量数据,并将在本年度内逐步公开。这一技术的开发将使国内企业和研究人员能够为自己的公司的服务或研究而自行改良。生成式AI可

人工智能新模型可解码DNA隐藏“语言”

DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上

人工智能新模型可解码DNA隐藏“语言”

DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上

人工智能新模型可解码DNA隐藏“语言”

  DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则

人工智能新模型可解码DNA隐藏“语言”

DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上

人工智能新模型可解码DNA隐藏“语言”

科技日报北京8月6日电 (记者张佳欣)DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将

科学家评估大型语言模型回答医学问题的能力

  图为研究团队的方法和现有技术的比较。Flan-PaLM540B模型在MedQA,MedMCQA和PubMedQA数据集上均超过了以往最先进的SOTA,每列上方显示的是准确率百分比。  你在网上搜过“我哪哪疼是不是得了啥啥病”吗?答案可能不尽如人意。但随着ChatGPT等大型自然语言模型(LLM)

脑电图测试技术可预测婴儿未来语言能力了!

  香港中文大学(中大)语言学者及儿科专科医生研发一套崭新的脑电图测试技术,可预测婴儿长大后的语言能力,帮助家长通过早期介入及训练改善孩子的语言能力。领导该研究的中大大脑与认知研究所所长黄俊文14日接受中新社记者采访时表示,希望测试可以逐步推广至粤港澳大湾区内地城市,帮助更多大湾区的孩子提升语言能力

日本发布大规模语言模型

  东京工业大学、日本理化学研究所及富士通公司等近日宣布,利用超级计算机“富岳”,他们开发的大规模语言模型“Fugaku-LLM”正式发布。  “Fugaku-LLM”是首个完全由日本国产技术构建的AI语言模型,其在处理日语及相关文化内容上表现卓越。模型特别擅长基于日语敬语进行自然对话,并展现出在人

日本发布大规模语言模型

科技日报讯 (记者李杨)东京工业大学、日本理化学研究所及富士通公司等近日宣布,利用超级计算机“富岳”,他们开发的大规模语言模型“Fugaku-LLM”正式发布。“Fugaku-LLM”是首个完全由日本国产技术构建的AI语言模型,其在处理日语及相关文化内容上表现卓越。模型特别擅长基于日语敬语进行自然对

AI语言模型“提速”药物发现

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502762.shtm美国麻省理工学院和塔夫茨大学研究人员设计出一种基于大型语言模型(如ChatGPT)的人工智能算法,这种称为ConPLex的新模型可将目标蛋白与潜在的药物分子相匹配,而无需执行计算分子结

科研团队成功利用人工智能蛋白语言模型揭示生命演化奥秘

  为什么不同生物在适应相似环境时,会独立演化出相似的功能?一项最新研究从蛋白质的“高阶特征”层面揭示了这一生命演化奥秘的重要机制。  这项研究由中国科学院动物研究所邹征廷研究员团队完成,成功利用人工智能领域的蛋白语言模型,揭示了蛋白高阶特征在功能适应性趋同演化中的关键作用,为理解生命演化之谜提供了

压缩算法为大语言模型“瘦身”

据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。团队举例称,当人们使用ChatGPT时,请求

首个种业大语言模型“丰登”发布

4月28日,中国农业大学生物学院教授王喜庆团队联合上海人工智能实验室、崖州湾国家实验室发布首个种业大语言模型“丰登”(SeedLLM)。种业大语言模型“丰登”。中国农业大学供图“丰登”集成了先进的人工智能技术(书生·浦语2.0)与大数据分析,通过深入学习我国迄今发布的科研文献、科技书籍、种企报告和历

儿童辨识情绪能力不受语言限制

一项研究表明,儿童能够识别母语和外语中的情绪,不过在母语中的识别准确度更高。相关成果近日发表于《科学报告》。 英国普雷斯顿中央兰开夏大学的Georgia Chronaki及其同事让没有外语经验的57名儿童和22名年轻成年人完成一项语音情绪识别任务,其中涉及他们的母语(英语)和3种外语(西班牙

儿童辨识情绪能力不受语言限制

  一项研究表明,儿童能够识别母语和外语中的情绪,不过在母语中的识别准确度更高。相关成果近日发表于《科学报告》。  英国普雷斯顿中央兰开夏大学的Georgia Chronaki及其同事让没有外语经验的57名儿童和22名年轻成年人完成一项语音情绪识别任务,其中涉及他们的母语(英语)和3种外语(西班牙语

8个小技巧“用好”大语言模型

用大语言模型,还需要技巧?在人们的印象中,这是个极其简单的操作:只需输入一个问题,立刻就能得到回答。但实际上,如何有效地与这些人工智能模型互动,发挥出它们的最大潜力,却是一个经常被忽视的话题。中国科学技术大学心理学系特任研究员林志成关注到这一话题,并在他最近的评论文章中提供了一系列的策略和指导,希望

神经机器模型能翻译200种语言

科技日报北京6月5日电 (记者张梦然)《自然》5日发表的一篇论文报道了一个Meta人工智能(AI)模型的底层技术。该模型能翻译200种不同语言,增加了机器翻译的语言数量。神经机器翻译模型利用人工神经网络翻译各种语言。这些模型通常需要大量可在线获取的数据加以训练,但并非所有语言数据都是公开、低成本或是

神经机器模型能翻译200种语言

自然》5日发表的一篇论文报道了一个Meta人工智能(AI)模型的底层技术。该模型能翻译200种不同语言,增加了机器翻译的语言数量。神经机器翻译模型利用人工神经网络翻译各种语言。这些模型通常需要大量可在线获取的数据加以训练,但并非所有语言数据都是公开、低成本或是普遍可及的,这类语言被称为低资源语言。一

研究人员研发出抗体语言模型

近日,中国科学院合肥物质科学研究院研发出基于表型感知对比学习的抗体语言模型BCRInsight。该模型通过对海量序列的自监督学习,实现了对复杂免疫信号的深度解码,在抗体结合位点预测和B细胞亚群分析等任务上均达到当前最佳性能。B细胞受体(BCR)免疫库蕴含丰富的生物学信号,决定抗原识别的特异性,记录B

ChatGPT进入课堂:语言模型如何改变教育

最近,教育心理学家罗纳德·贝格托(Ronald Beghetto)以一种引人注目的方式引领一群研究生和教育专业人员,与一系列以创造力为中心的聊天机器人进行了交流。这些聊天机器人由贝格托设计,即将托管在亚利桑那州立大学(ASU)设立的平台上。这些机器人使用与ChatGPT相同的人工智能(AI)技术,目

科研人员开发出RNA基础语言模型

  在真核生物中,RNA转录、剪接、翻译和降解等生物学过程受到顺式调控元件、RNA结构和反式作用因子的调控。解析RNA多层次调控,对研究基因表达分子机制和设计RNA药物具有重要意义。但是,由于调控复杂和数据量不足,构建RNA调控的预测模型面临挑战。  近日,中国科学院上海营养与健康研究所研究员张国庆

我国学者提出用好大语言模型实用策略

当前,大语言模型的应用日益广泛,覆盖从文本生成到复杂问题解决等多个领域,如何更好利用AI工具?记者10日从中国科学技术大学获悉,该校心理学系林志成特任研究员近日在其评论文章中研究提出一项实用策略,帮助更好理解和利用先进的人工智能工具,有效发挥人工智能模型交互的最大潜力。在《自然人类行为》(Natur

我国学者提出用好大语言模型实用策略

中新网合肥5月10日电 (记者 吴兰)当前,大语言模型的应用日益广泛,覆盖从文本生成到复杂问题解决等多个领域,如何更好利用AI工具?记者10日从中国科学技术大学获悉,该校心理学系林志成特任研究员近日在其评论文章中研究提出一项实用策略,帮助更好理解和利用先进的人工智能工具,有效发挥人工智能模型交互的最

新引擎实现大语言模型推理速度显著提升

原文地址:http://news.sciencenet.cn/htmlnews/2023/11/511841.shtm

新型AI芯片将大语言模型能耗减半

  美国俄勒冈州立大学科研团队研发出一种新型AI芯片,成功将大语言模型的能耗降低50%。这项成果于近期在波士顿举行的IEEE定制集成电路会议上发布,是半导体领域的重大突破,有望成为解决大语言模型高能耗问题的“绿色钥匙”。  当前,以谷歌“双子座”和OpenAI的GPT-4为代表的大语言模型,因海量参

研究显示家庭收入差距影响儿童语言能力

  你的宝宝不会回答类似“今天你过得怎么样?”或“等你长大了,你想做什么?”等这样的问题。这是因为在婴儿成长到蹒跚学步的年龄前,他们没有遣词造句的能力,但这并不意味着其不会从早期与父母的交谈中受益。   美国斯坦福大学的Anne Fernald认为,社会经济地位(SES)较高家庭的孩子,在学校

百度王海峰:大模型规模定律未来几年仍然有效

“从人工智能技术发展趋势来看,未来几年,规模定律依然有效,大语言模型仍有很大提升空间。”6月14日,2024北京智源大会在京举行。百度首席技术官王海峰在主旨演讲中对人工智能技术发展作出最新判断。他认为,大模型为通用人工智能带来曙光,可以从两个角度解读,一是人工智能技术的通用性,二是能力的全面性。王海

文斐:研究解决大型语言模型的存储瓶颈问题

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/497858.shtm“由于半导体器件的物理限制,摩尔定律已经难以为继;今后计算机芯片的效率提升将主要来源于体系架构的创新。”华南理工大学计算机科学与工程学院原院长、广东省计算机学会理事长韩国强对《中国科学

大语言模型在线辩论说服力超人类

实验设计示意图。图片来源:英国《自然·人类行为》在线版《自然·人类行为》19日发表的一项人工智能(AI)研究发现,在线辩论中,GPT-4一类的大语言模型(LLM)如能根据对手的个性化信息调整它们的论据,其说服力比人类辩手高出64%。研究结果显示了GPT-4生成有针对性和说服力论据的能力,揭示出AI工