芯片市场的角逐,自研产品推出,后续如何?
微软在最近的年度开发者大会Microsoft Ignite上推出了两款自研芯片——Maia 100和Azure Cobalt 100,目标是为大语言模型的训练和推理提供动力。这一举动标志着微软正式加入了谷歌、亚马逊等科技巨头的行列,拥有了自己的定制芯片。 Maia 100是微软首款人工智能芯片,专为大语言模型训练而设计,是一款应用型专用集成电路(ASIC)芯片。这款芯片将与微软的Azure软件栈无缝集成,并预计在明年初在Azure数据中心推出。微软表示,Maia 100的目标是减少公司对英伟达GPU的依赖。 另一款芯片Azure Cobalt 100是一款基于Arm架构的128核云原生芯片,旨在满足通用计算任务的需求。这款芯片可以与Azure的生态系统兼容,并在微软Cloud上运行通用计算工作负载,有助于降低成本。此外,Azure Cobalt 100还能与英特尔处理器和亚马逊云的Graviton系列芯片展开竞争。 微......阅读全文
新型AI芯片将大语言模型能耗减半
美国俄勒冈州立大学科研团队研发出一种新型AI芯片,成功将大语言模型的能耗降低50%。这项成果于近期在波士顿举行的IEEE定制集成电路会议上发布,是半导体领域的重大突破,有望成为解决大语言模型高能耗问题的“绿色钥匙”。 当前,以谷歌“双子座”和OpenAI的GPT-4为代表的大语言模型,因海量参
压缩算法为大语言模型“瘦身”
据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。团队举例称,当人们使用ChatGPT时,请求
日本将开发更强日语能力的“大语言模型”人工智能技术
据共同社消息,日本东北大学和日本东京工业大学等团队计划开发一种更强日语能力的“大语言模型”,作为生成式人工智能(AI)的基础技术。该团队将利用理化学研究所的超级计算机“富岳”学习大量数据,并将在本年度内逐步公开。这一技术的开发将使国内企业和研究人员能够为自己的公司的服务或研究而自行改良。生成式AI可
人工智能新模型可解码DNA隐藏“语言”
DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上
人工智能新模型可解码DNA隐藏“语言”
DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上
人工智能新模型可解码DNA隐藏“语言”
DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上
人工智能新模型可解码DNA隐藏“语言”
科技日报北京8月6日电 (记者张佳欣)DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将
人工智能新模型可解码DNA隐藏“语言”
DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则
8个小技巧“用好”大语言模型
用大语言模型,还需要技巧?在人们的印象中,这是个极其简单的操作:只需输入一个问题,立刻就能得到回答。但实际上,如何有效地与这些人工智能模型互动,发挥出它们的最大潜力,却是一个经常被忽视的话题。中国科学技术大学心理学系特任研究员林志成关注到这一话题,并在他最近的评论文章中提供了一系列的策略和指导,希望
新引擎实现大语言模型推理速度显著提升
原文地址:http://news.sciencenet.cn/htmlnews/2023/11/511841.shtm
大语言模型在线辩论说服力超人类
实验设计示意图。图片来源:英国《自然·人类行为》在线版《自然·人类行为》19日发表的一项人工智能(AI)研究发现,在线辩论中,GPT-4一类的大语言模型(LLM)如能根据对手的个性化信息调整它们的论据,其说服力比人类辩手高出64%。研究结果显示了GPT-4生成有针对性和说服力论据的能力,揭示出AI工
“AI+教育”,复旦推出大语言模型助力新生报到
8月25日,是复旦大学本科生新生报到的日子。来自全国各地和全球40多个国家的4300余名2024级本科新生,开启了在复旦的求学生涯。新生报道现场。为帮助来自世界各地的新同学尽快融入复旦大学,学校基于大语言模型,推出“复旦迎新助手”智能Agent。作为新生的贴心小帮手,大语言模型为新同学在迎新阶段提供
日本发布大规模语言模型
科技日报讯 (记者李杨)东京工业大学、日本理化学研究所及富士通公司等近日宣布,利用超级计算机“富岳”,他们开发的大规模语言模型“Fugaku-LLM”正式发布。“Fugaku-LLM”是首个完全由日本国产技术构建的AI语言模型,其在处理日语及相关文化内容上表现卓越。模型特别擅长基于日语敬语进行自然对
日本发布大规模语言模型
东京工业大学、日本理化学研究所及富士通公司等近日宣布,利用超级计算机“富岳”,他们开发的大规模语言模型“Fugaku-LLM”正式发布。 “Fugaku-LLM”是首个完全由日本国产技术构建的AI语言模型,其在处理日语及相关文化内容上表现卓越。模型特别擅长基于日语敬语进行自然对话,并展现出在人
AI语言模型“提速”药物发现
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502762.shtm美国麻省理工学院和塔夫茨大学研究人员设计出一种基于大型语言模型(如ChatGPT)的人工智能算法,这种称为ConPLex的新模型可将目标蛋白与潜在的药物分子相匹配,而无需执行计算分子结
科研团队成功利用人工智能蛋白语言模型揭示生命演化奥秘
为什么不同生物在适应相似环境时,会独立演化出相似的功能?一项最新研究从蛋白质的“高阶特征”层面揭示了这一生命演化奥秘的重要机制。 这项研究由中国科学院动物研究所邹征廷研究员团队完成,成功利用人工智能领域的蛋白语言模型,揭示了蛋白高阶特征在功能适应性趋同演化中的关键作用,为理解生命演化之谜提供了
东北大学研究团队发布TechGPT2.0大语言模型
近日,计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。 TechGPT-2.0在继承了TechGPT-1.0全部特性的同时,通过增加多领域、多任务的数据,展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得
科研人员利用大语言模型解释调节睡眠的分子机制
华中科技大学生命学院张珞颖团队和薛宇团队在Nature Communications杂志上合作发表了题为“Large-language models facilitate discovery of the molecular signatures regulating sleep and activ
科研人员利用大语言模型解释调节睡眠的分子机制
华中科技大学生命学院张珞颖团队和薛宇团队在Nature Communications杂志上合作发表了题为“Large-language models facilitate discovery of the molecular signatures regulating sleep and activ
东北大学研究团队发布TechGPT2.0大语言模型
近日,计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。TechGPT-2.0在继承了TechGPT-1.0全部特性的同时,通过增加多领域、多任务的数据,展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得模型更适
中医药人工智能大模型正式启动
6月15日,在横琴粤澳深度合作区举行的中医药广东省实验室(以下简称横琴实验室)第一届学术委员会第一次会议暨首届横琴中医药科技创新大会上,中医药横琴大模型、中药新药智能自动化融合创新平台同时启动。这也是该实验室揭牌半年来取得的新进展。2023年12月,横琴实验室正式揭牌成立,成为广东省实验室体系中的一
首个种业大语言模型“丰登”发布
4月28日,中国农业大学生物学院教授王喜庆团队联合上海人工智能实验室、崖州湾国家实验室发布首个种业大语言模型“丰登”(SeedLLM)。种业大语言模型“丰登”。中国农业大学供图“丰登”集成了先进的人工智能技术(书生·浦语2.0)与大数据分析,通过深入学习我国迄今发布的科研文献、科技书籍、种企报告和历
清华团队与合作者推出大语言模型RealSafeR1
2月23日,清华大学与瑞莱智慧联合团队推出大语言模型RealSafe-R1。研发团队代表介绍说,实验数据表明RealSafe-R1安全性提升显著,“安全增强版DeepSeek”可为更多应用提供可靠坚实基座。连日来,国产开源大模型DeepSeek的优异表现备受关注,其在自然语言处理和多任务推理方面的能
360智脑通过中国信通院可信AIGC大语言模型功能评估
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502739.shtm6月12日,360智脑的360GPT-S2-V8型号产品获得了中国信息通信研究院(以下简称“中国信通院”)“可信AIGC大语言模型基础能力”评估报告(以下简称“报告”),报告显示必选项
微调大语言模型,科学家开发化学文本挖掘新方法
6月7日,中国科学院上海药物研究所研究员郑明月课题组在五项化学文本挖掘任务上对多个大语言模型的能力进行了全面综合的探究,展现了微调大语言模型成为一种通用高效的生成式文本挖掘方法,为大模型的落地应用提供参考。相关研究发表于《化学科学》。 近两年,以ChatGPT为代表的大语言模型(LLM)引领了人工智
ChatGPT进入课堂:语言模型如何改变教育
最近,教育心理学家罗纳德·贝格托(Ronald Beghetto)以一种引人注目的方式引领一群研究生和教育专业人员,与一系列以创造力为中心的聊天机器人进行了交流。这些聊天机器人由贝格托设计,即将托管在亚利桑那州立大学(ASU)设立的平台上。这些机器人使用与ChatGPT相同的人工智能(AI)技术,目
神经机器模型能翻译200种语言
科技日报北京6月5日电 (记者张梦然)《自然》5日发表的一篇论文报道了一个Meta人工智能(AI)模型的底层技术。该模型能翻译200种不同语言,增加了机器翻译的语言数量。神经机器翻译模型利用人工神经网络翻译各种语言。这些模型通常需要大量可在线获取的数据加以训练,但并非所有语言数据都是公开、低成本或是
神经机器模型能翻译200种语言
自然》5日发表的一篇论文报道了一个Meta人工智能(AI)模型的底层技术。该模型能翻译200种不同语言,增加了机器翻译的语言数量。神经机器翻译模型利用人工神经网络翻译各种语言。这些模型通常需要大量可在线获取的数据加以训练,但并非所有语言数据都是公开、低成本或是普遍可及的,这类语言被称为低资源语言。一
全面走向“人工智能+”-国内首个汽车大模型标准发布
中国信息通信研究院(简称“中国信通院”)今天(28日)发布了国内首个汽车大模型标准。 标准主要涵盖三个能力域,其中场景丰富度侧重评估汽车大模型对智能座舱和自动驾驶等细分场景的支持情况,能力支持度重点关注汽车大模型在感知、理解、推理、生成等人工智能技术能力上的表现,应用成熟度主要评估汽车大模型在
芯片测“功”-唯快不破-阿波罗人工智能模型来了
随着集成电路技术的不断发展,芯片规模越来越大、集成度越来越高。与此同时,在设计和使用芯片时,掌握并管理其功耗就变得越来越重要。 为在设计或使用过程中管理好芯片功耗,杜克大学电子与计算机工程系教授、杜克大学计算进化智能实验室联合主任陈怡然团队开发出一种新的人工智能模型——阿波罗(APOLLO)