国产千卡集群训练优化技术AdaPipe发布

近日,在美国圣迭戈市举行的计算机体系结构重要国际会议ASPLOS上,由鹏城实验室智能计算研究部、清华大学计算机系教授陈文光团队自主研发的国产千卡集群训练优化技术AdaPipe正式发布。 近年来,大规模语言模型在对话、问答和文本总结等多种应用场景中展现出卓越性能,受到了学术界和工业界的广泛关注。然而,随着大规模语言模型逐渐朝着更多的参数量和更长的文本进行演化,对计算设备的存储和处理能力也提出了更高要求。 当前,传统的流水线并行训练方法在处理百、千亿参数的模型时会产生存储和计算负载不均衡的现象,直接影响了资源利用率和整体训练效率;同时,由于现有国产算力卡存在高速内存容量和通信能力不足的情况,使得这一问题显得更加突出。 为解决上述问题,陈文光团队开发了AdaPipe技术,该技术根据具体的模型和硬件参数,通过细化重计算的粒度来优化重计算策略,并考虑到训练各阶段计算量的差异,进一步对重计算和流水线切分策略进行优化。该技术不仅将存......阅读全文

科研人员提出新的具身智能体训练框架

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/519154.shtm近日,南方科技大学计算机系讲席教授史玉回团队提出新的具身智能体训练框架,相关成果论文被2024 IEEE国际计算机视觉与模式识别会议接收。具身智能领域的研究热点,主要聚焦于利用大型预训

ChatGPT代码解释器是里程碑意义的成就

原文地址:http://news.sciencenet.cn/htmlnews/2023/7/504709.shtm·ChatGPT代码解释器测试版开放后,用户即使不是程序员,也可以用自然语言向ChatGPT下达指令完成复杂编程任务,这可能会产生两个重大影响:消灭语言鸿沟;重塑产业形态。·未来大模型

中科院心理所基于社交媒体语言表达心理幸福感感知模型

积极心理健康受到各个领域的关注,心理幸福感可以在一定程度上反映个体的心理健康水平。然而,民众的心理幸福感测量很难大规模实时评估。社交媒体的流行使非侵入性方式感知和了解在线用户的心理幸福感成为可能。中国科学院行为科学重点实验室朱廷劭研究组基于社交媒体用户的语言表达建立心理幸福感预测模型,并通过心理问卷

Nat-Mach-Intell:计算机模型帮助寻找COVID19治疗方法

    根据最近一项研究,一种可以预测人类基因和药物相互作用方式的新的深度学习模型已经确定了至少10种可能有望作为COVID-19疗法的化合物。除两种药物外,所有药物均仍被认为是研究性药物,并且正在针对丙型肝炎,真菌病,癌症和心脏病进行有效性测试。该清单还包括批准的药物环孢菌素和抗真菌药阿尼芬净。

我国团队首创新算法,让细胞与计算机“对话”

细胞内有数以亿计的碱基、表达程序以及运行策略,而且各不相同。单细胞测序技术可解读单个细胞里的这些信息,但人工干预多、过度依赖人为选定的标记基因使得单细胞测序技术对细胞的注释稳定性较低。可以理解为,同一类细胞用不同的模型解析,结果不同,对一些特殊细胞“公说公有理婆说婆有理”的分析结果往往难以得到广泛认

ChatGPT敲开了通用人工智能的大门了吗?

  连日来,一路“狂飙”的ChatGPT持续引发着“话题地震”。  作为由OpenAI训练的对话式大规模语言模型,ChatGPT 以对话的方式与人进行交互。重点在于,它的回答之智能、之流畅令人意外。据媒体报道,ChatGPT不仅能在短短几秒内响应人们的问题需求,它还通过了美国部分高校的法律、医学考试

国家超级计算天津中心发布“天河天元”大模型

原文地址:http://news.sciencenet.cn/htmlnews/2023/5/501029.shtm5月20日,在第七届世界智能大会上,国家超级计算天津中心正式发布“天河E级智能计算开放创新平台”和“天河天元大模型”。近期,ChatGPT的爆火引发了信息技术领域的“大模型热”,国内多

一天内筛选超1亿种化合物,AI语言模型“提速”药物发现

美国麻省理工学院和塔夫茨大学研究人员设计出一种基于大型语言模型(如ChatGPT)的人工智能算法,这种称为ConPLex的新模型可将目标蛋白与潜在的药物分子相匹配,而无需执行计算分子结构的密集型步骤。相关论文发表在最新一期《美国国家科学院院刊》上。  图片来源:物理学家组织网使用这种方法,研究人员可

李彦宏:自然语言将成为新的通用编程语言

“未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者。”4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上发表的演讲指出,“AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者。”活动现场 主办方供图  现场,

新型超级生物计算机模型问世-三磷酸腺苷驱动能耗更低

  作为人体细胞能量来源的三磷酸腺苷(ATP),也可以用来驱动下一代超级计算机。加拿大研究人员的这个新发现有望为研发只有书本大小的超级生物计算机打开大门。与动辄占地数百平方米的传统超级计算机相比,这样的设想实在诱人。  加拿大麦吉尔大学生物工程系主任丹·尼克劳带领的国际研究团队在近日出版的《美国国家

1500种语言可能消失

基于一个类似于预测物种损失的新模型,澳大利亚研究团队分析了6511种仍在使用或已停止使用的语言后得出结论说,到本世纪末,1500种语言将不再被使用,这相当于每个月有一种语言消失。这项新研究还确定了使语言处于高风险处境的原因,包括更密集的公路网、更高的教育水平甚至气候变化等。  论文合著者、澳大利亚国

智谱AI:未来让机器像人一样思考

智谱AI:未来让机器像人一样思考 AI手语数字人华同学(智谱AI供图)让机器像人一样思考,是很多人工智能(AI)从业者的美好愿景,也是不少投资人看好的赛道。今年9月,智谱AI宣布获得数亿元人民币B轮融资,本次融资由君联资本和启明创投联合领投,将被用来继续投入到打造高性能千亿级普惠大模型。启明创投合伙

科学家利用迁移学习建立计算大模型预测基因调控研究

  基因网络绘制需要大量转录组数据用于建立基因之间的联系,这也阻碍了一些数据有限场景(如罕见病)等研究。最近,利用迁移学习的机器学习技术在自然语言和计算机视觉等领域带来了变革性进展,其通过在大规模通用数据集上进行大模型预训练,而后迁移到数据量有限的特定任务进行微调。美国博德研究所等研究团队提出了一个

MOSS大模型负责人:大模型不仅仅是工程问题

原文地址:http://news.sciencenet.cn/htmlnews/2023/9/508276.shtm·“很多人认为大模型是工程问题,但事实上并不是。大模型里存在很多科学问题,比如智能涌现、复杂推理、知识融合以及学习策略等等。”·“大模型的平民化”,即最终要让应用大模型的每个人都觉得成

国际团队开发的黑洞喷流计算机模型结果支持广义相对论

  英国伦敦大学学院(UCL)发布消息称,中英美国际团队开发的M87黑洞喷流的计算机模型计算结果与天文学家观测结果相匹配,为广义相对论提供了新的支持。  M87超大质量黑洞位于距离地球5500万光年的梅西耶87星系中,质量相当于65亿个太阳。这是第一个存在图像的黑洞,由2019年事件视界望远镜国际研

国际团队开发的黑洞喷流计算机模型结果支持广义相对论

  英国伦敦大学学院(UCL)发布消息称,中英美国际团队开发的M87黑洞喷流的计算机模型计算结果与天文学家观测结果相匹配,为广义相对论提供了新的支持。  M87超大质量黑洞位于距离地球5500万光年的梅西耶87星系中,质量相当于65亿个太阳。这是第一个存在图像的黑洞,由2019年事件视界望远镜国际研

北京大学深度学习实验室是北大数据科学研究中心

  北京大学深度学习实验室是北京大学数据科学研究中心(北京大数据研究院)最重要的基础研究机构。它集结了北京大学在计算机科学、应用和计算数学、统计学等领域的最活跃的学者。实验室主任由机器学习领域国际上最活跃的学者之一张志华教授担任。希望用三到五年的时间建成世界一流的研究机构,成为中国深度学习和人工智能

达观数据宣布研发垂直领域GPT模型“曹植”系统

自然语言处理进入“战国时代”,记者今天从专注于自然语言处理的人工智能企业达观数据获悉,该公司正基于多年文本智能技术积累和垂直领域场景业务经验,积极探索大语言模型(LLM)的实践,研发国产版GPT“曹植”系统,作为垂直、专用、自主可控的国产版ChatGPT模型,不仅能实现专业领域的AIGC智能化应用,

文心一言开启邀测,专家呼吁给中国类ChatGPT更多成长机会

距离新一代人工智能语言模型GPT-4发布不到24小时,国内互联网大厂百度3月16日发布了对标ChatGPT的AI产品——文心一言。 尽管百度创始人兼董事长李彦宏一上台就“降了音调”,表示推出文心一言是为了回应市场期待,产品本身并不完美,但仍然无法降低网友心中早已被拉满的期望值。文心一言开启邀请测试不

大脑处理语言,母语最“省事”

多数人只会说一两种语言,而美国华盛顿特区的47岁地毯清洁工Vaughn Smith却精通24国语言。据《科学》报道,在一项新的大脑成像研究中,研究人员仔细观察了像Smith这样多语言者的大脑,以了解其语言特定区域在听到不同语言时的反应。研究人员发现,受试者熟悉的语言引起了他们大脑更强烈的反应。但有一

《科学》:模拟大脑的“语言交流”

人类通过大脑认知世界,却对认知世界的大脑知之甚少。 原因之一是大脑有两种“语言”(电信号和化学信号),目前人们可以“读懂”大脑的“电语言”(读取并解译电信号),对其“化学语言”(神经元释放的神经递质等化学信息)的“译读”却束手无策。 1月13日,中国科学院化学研究所研究员于萍和毛兰群团

COVID19传播的计算机模型如何帮助我们对抗病毒

  利用数学和计算机模拟传染病传播过程的科学家正在研究这种新型冠状病毒,试图预测这种全球疫情可能如何演变,以及如何最好地应对。  但有些人说,利用这些建模工具和研究人员的发现,还可以做更多的工作。  "这是一种临时的、自愿的努力,我认为这是我们可以改进的地方,"约翰霍普金斯卫生安全中心的传染病建模师

祝贺!北大冠军,中国科大亚军!

5月10日, 第十届世界大学生超级计算机竞赛总决赛在中国科学技术大学落下帷幕。  在持续五天的总决赛中,北京大学夺取大赛总冠军,中国科学技术大学名列亚军。中国科学技术大学获得e Prize计算挑战奖,浙江大学获得最高计算性能奖,其他高校也取得不俗佳绩。 北京大学代表队获得总冠军

天文学家在国产计算机上实现超大规模宇宙模拟实验

盘古模拟  宇宙如何从几乎均匀各向同性的状态演变成充满恒星、星系、星系团、空洞以及各种纤维结构的观测宇宙,一直是天文学家关注的热点研究课题。日前,一个超大规模的宇宙模拟实验在中国科学院超级计算中心的联想深腾7000超级计算机上完成,它是被称为“盘古计划”的一部分。  “盘古计划”是由

预训练模型创业渐入佳境

2月10日,创新工场在京宣布,北京澜舟科技公司已完成近亿元Pre-A轮融资,此次融资由联想创投、斯道资本共同领投,创新工场跟投。本轮融资澜舟科技将主要用于自然语言处理(NLP)核心产品的开发和前瞻性研究。澜舟科技的新一轮融资,是时下围绕人工智能预训练大模型的创新创业渐入佳境的生动体现。在澜舟科技创始

硬刚“GPT4”,谷歌重磅推出最强杀手锏“Gemini”

  12月6日,谷歌宣布推出其认为规模最大、功能最强大的人工智能模型Gemini。Gemini将包括三种不同的套件:Gemini Ultra,Gemini Pro和Gemini Nano。官方宣文中,概括出这三种套件的突出特性:  Gemini Ultra——参数量最大,能力最强,适用于高度复杂的任

人工智能突然变聪明了吗

  人工智能超级智能会突然出现,还是科学家能预见它的到来并有机会向世界发出警告?随着大型语言模型如ChatGPT的兴起,这个问题最近受到了很多关注。这类模型随着规模的增长已经获得了大量新功能。  一些研究结果指向了“涌现”,即人工智能模型以一种骤然且不可预测的方式获得智能的现象。但最近一项研究将这类

人工智能突然变聪明了吗

原文地址:http://news.sciencenet.cn/htmlnews/2023/12/515063.shtm人工智能超级智能会突然出现,还是科学家能预见它的到来并有机会向世界发出警告?随着大型语言模型如ChatGPT的兴起,这个问题最近受到了很多关注。这类模型随着规模的增长已经获得了大量新

儿童辨识情绪能力不受语言限制

  一项研究表明,儿童能够识别母语和外语中的情绪,不过在母语中的识别准确度更高。相关成果近日发表于《科学报告》。   英国普雷斯顿中央兰开夏大学的Georgia Chronaki及其同事让没有外语经验的57名儿童和22名年轻成年人完成一项语音情绪识别任务,其中涉及他们的母语(英语)和3种外语(西

儿童辨识情绪能力不受语言限制

一项研究表明,儿童能够识别母语和外语中的情绪,不过在母语中的识别准确度更高。相关成果近日发表于《科学报告》。 英国普雷斯顿中央兰开夏大学的Georgia Chronaki及其同事让没有外语经验的57名儿童和22名年轻成年人完成一项语音情绪识别任务,其中涉及他们的母语(英语)和3种外语(西班牙