新型AI芯片将大语言模型能耗减半
美国俄勒冈州立大学科研团队研发出一种新型AI芯片,成功将大语言模型的能耗降低50%。这项成果于近期在波士顿举行的IEEE定制集成电路会议上发布,是半导体领域的重大突破,有望成为解决大语言模型高能耗问题的“绿色钥匙”。 当前,以谷歌“双子座”和OpenAI的GPT-4为代表的大语言模型,因海量参数使得算力需求激增,进而导致能源需求急速飙升。 研究团队指出,问题的关键在于数据中心铜基通信链路的数据传输。高速数据交换不仅会产生误差,更会带来巨大的能源浪费。传统均衡器虽能纠错,但其自身就是“电老虎”。一种解决方案是开发更高效的有线通信芯片。 他们开发的新芯片能够借助AI技术,通过训练其上的分类器识别并纠正错误,以更智能高效的方式恢复数据,从而降低能耗。与传统设计相比,新芯片能使大语言模型消耗的能源减半。 研究团队已着手开发下一代芯片,预计将带来更惊人的能效表现。随着全球AI算力需求持续飙升,这项技术或将成为绿色计算的重要推手......阅读全文
AI大模型“源”炼造客服大脑
2018年至今,NLP领域经历了非常大的变化,Transformer、ELMO、BERT、GPT-3,再到最近的ChatGPT(GPT 3.5的微调)的突破,NLP在预训练大模型的暴力拆解路上越走越远,这也让各行业开始相信:很多之前无法做到的场景、效果,现在可以有新的解法和落地。 智能客服,是
全球首个知识增强千亿大模型亮相
12月8日,鹏城实验室与百度联合发布全球首个知识增强千亿大模型——鹏城—百度·文心。 为什么大模型在产学界持续走热,越来越多的技术公司入场? 如中国工程院院士、鹏城实验室主任高文所言,预训练模型赋能人工智能衍生更多的应用,而不局限于某个领域,是人工智能自身发展并作用于社会及科学创新的重要工具
商汤大模型多个评测表现超ChatGPT
本报讯 (记者沈湫莎)商汤科技近日公布了自研中文语言大模型“商量SenseChat 2.0”在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。评测显示,“商量”在这三个测试集中的表现均领先ChatGPT,实现了我国语言大模型研究的突破。 全球三大权威语言模型测评基准
同济大学首发专属大模型ChatTJ
6月11日,同济大学推出一款专属大模型ChatTJ,现阶段着重为高招季考生和家长提供24小时全天候、不断线的咨询服务,后续将用于同济大学人才培养并拓展至学校综合事务等相关事项的常规咨询服务。这也是同济大学面向智能时代和社会需求,加快“人工智能+”步伐的又一创新探索实践。记者从同济大学获悉,ChatT
AI大模型走出“泡沫期”未来何如
今年3月ChatGPT-4上线以来,国内科技龙头企业密集推出人工智能大模型,百度“文心一言”、阿里云“通义千问”、华为“盘古”、360“智脑”、昆仑万维“天工”、京东“灵犀”、科大讯飞“星火”、腾讯“混元”、商汤“日日新”等大模型先后登场,呈现百花齐放、迅猛发展的态势。截至2023年10月初,国
讯飞星火正式发布语音大模型
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/516953.shtm“听说今年尔滨特别火,作为南方小土豆还挺想去玩一下的。要不你用东北话介绍下有啥好玩的呗?”1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪
讯飞星火正式发布语音大模型
“听说今年尔滨特别火,作为南方小土豆还挺想去玩一下的。要不你用东北话介绍下有啥好玩的呗?” 1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪发布基于首个全国产算力训练的讯飞星火V3.5。在实操演示环节,刘聪和讯飞星火V3.5现场互动,后者一口地道的
大模型加速改变云计算行业规则
原文地址:http://news.sciencenet.cn/htmlnews/2023/4/498365.shtm
通用大模型的发展路径与挑战
当今世界,以大模型为代表的通用人工智能技术在全球范围内扮演着日益重要的角色,对推动全球科技进步和经济发展起到重要的作用。时代的拷问也随之而至:未来通用大模型的发展路径是什么?如何构建高效、自主的算法算力?如何利用大模型等先进人工智能技术来构建新一代科学研究的新范式?日前,第二十六届中国科协年会“通用
通用大模型的发展路径与挑战
当今世界,以大模型为代表的通用人工智能技术在全球范围内扮演着日益重要的角色,对推动全球科技进步和经济发展起到重要的作用。 时代的拷问也随之而至:未来通用大模型的发展路径是什么?如何构建高效、自主的算法算力?如何利用大模型等先进人工智能技术来构建新一代科学研究的新范式? 日前,第二十六届中国科
儿童健康大模型建设项目启动
8月28日,记者从国家儿童医学中心北京儿童医院获悉,该院与百川智能签署战略合作协议,共同启动儿童健康大模型建设。 国家儿童医学中心主任、北京儿童医院院长倪鑫表示,近年来,人工智能的快速发展为儿童医疗保健服务模式创新提供了更多可能。此次合作,将以医工协同创新推动人工智能与儿童健康医疗的深度融合,
全球首个地理科学大模型发布
人工智能“地理学家”出现了。9月19日,全球首个地理科学大模型“坤元”发布,它既能拓宽大众的地理视野,也能解放地理从业者的双手,推动地理智能发展,加速重大地理科学发现。“‘坤元’像是一座巨大地理图书馆的管理员,管理海量书籍的同时,也精读过所有图书。”“坤元”大模型研发组首席科学家、中国科学院地理科学
OpenAI打包新闻集团版权训练大模型
ChatGPT再扩容,这次将加入十余家媒体的新闻内容。当地时间5月22日,OpenAI宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI将能在ChatGP
同济大学首发专属大模型ChatTJ
6月11日,同济大学推出一款专属大模型ChatTJ,现阶段着重为高招季考生和家长提供24小时全天候、不断线的咨询服务,后续将用于同济大学人才培养并拓展至学校综合事务等相关事项的常规咨询服务。这也是同济大学面向智能时代和社会需求,加快“人工智能+”步伐的又一创新探索实践。记者从同济大学获悉,ChatT
华为发布大模型时代AI存储新品
原文地址:http://news.sciencenet.cn/htmlnews/2023/7/504751.shtm
两大芯片巨头,创历史新高
随着投资者继续热捧人工智能芯片制造公司的股票,AMD和英伟达周四股价创下历史新高。 AMD 股价在周四交易中上涨超过 1%,达到历史最高收盘价 162.67 美元,而 Nvidia 则上涨近 2% 至 571.07 美元。继 2023 年爆发性增长之后,这两家公司年初均实现了两位数百分比涨幅,
芯片市场的角逐,自研产品推出,后续如何?
微软在最近的年度开发者大会Microsoft Ignite上推出了两款自研芯片——Maia 100和Azure Cobalt 100,目标是为大语言模型的训练和推理提供动力。这一举动标志着微软正式加入了谷歌、亚马逊等科技巨头的行列,拥有了自己的定制芯片。 Maia 100是微软首款人工智能芯片
美研究发现语言能力差的人患老年痴呆风险大
美国一项最新研究显示,人年轻时的语言能力或许能帮助预测年迈时患阿尔茨海默氏症等老年性痴呆症的风险程度。 据美国媒体报道,美国约翰·霍普金斯大学的研究人员对38名已故老年女性的大脑进行了分析,并对她们年轻时的语言和写作能力进行了调查。结果发现,在年轻时语言能力较强的女性到老年时出现记忆力衰退等
中科院心理所基于社交媒体语言表达心理幸福感感知模型
积极心理健康受到各个领域的关注,心理幸福感可以在一定程度上反映个体的心理健康水平。然而,民众的心理幸福感测量很难大规模实时评估。社交媒体的流行使非侵入性方式感知和了解在线用户的心理幸福感成为可能。中国科学院行为科学重点实验室朱廷劭研究组基于社交媒体用户的语言表达建立心理幸福感预测模型,并通过心理问卷
3大遥感数据源接入“商汤地界”AI遥感大模型
原文地址:http://news.sciencenet.cn/htmlnews/2024/3/519533.shtm近日,商汤科技宣布携手国内头部遥感数据平台“吉林一号网”、“四维地球”、“星图地球”,升级了其“SenseEarth智能遥感云”平台的数据源。用户无需准备数据,即可通过“商汤地界”平台
刘韵洁:中国发展大模型的机会在通用行业大模型
中国工程院院士、紫金山实验室主任刘韵洁接受采访时判断,中国发展大模型的机会在于通用行业大模型。 在日前举办的2023中国算力大会间隙,刘韵洁接受媒体采访时说,“大模型方面,美国走在前面。”中国需要在算力、数据、网络等方面,进行深入的、专家层面的研究,制定出应对措施和办法。 他坦言:“当前大模
大模型应用是否会复制“苹果时刻”
最近一两个月,不少哔哩哔哩(B站)用户发现,各种大模型使用教程视频越来越多了,智谱、Kimi Chat、文心一言、通义千问……业内人士表示,头部大模型厂商几乎已全部入局,仅在B站,品牌方的广告投入就是去年的3-4倍。4月底,在发布日日新大模型5.0版后,商汤科技的股价一度上涨超过30%,当周股价涨幅
浪潮海若大模型业务战略正式发布
在人工智能技术飞速发展的当下,行业大模型将如何提升城市治理与服务、赋能千行百业?浪潮云给出了自己的答卷。 4月2日,由中共山东省委网络安全和信息化委员会办公室指导、青岛市大数据局支持、浪潮云主办的“云端眺望 向‘数’而生”数字创新生态大会在青岛市成功举办。会议聚焦服务新质生产力,浪潮云正式发布
北大成立大模型联合实验室
12月12日,北京大学联合字节跳动成立豆包大模型系统软件联合实验室,校企携手面向人工智能系统软件开展科学研究和技术转化,培养高素质创新型软件人才。 “以大模型为代表的人工智能技术的迭代升级,正以前所未有的速度推进。对于大模型而言,高效能、大规模的算力资源管理是重大需求,而系统软件是解决这一需求
生成式法律大模型呼之欲出
原文地址:http://news.sciencenet.cn/htmlnews/2023/7/504932.shtm7月15日,由上海交通大学主办,上海交通大学凯原法学院、智慧法院研究院、人民法院矛盾纠纷源头治理研究基地、上海市法学会公司法务研究会联合承办的“生成式法律大模型专题研讨会”成功举行。
商汤大模型“商量”多个评测表现超ChatGPT
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503362.shtm
文档解析技术破解大模型语料“饥荒”难题
近日,由中国图象图形学学会主办的2024中国图象图形大会在西安开幕。大会通过20多场论坛、百余项成果,集中展示了生成式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。大模型一路“高歌猛进”的背后,隐藏着一场关于模型训练语料的“能源危机”。根据人工智能研究人员小组Epoch研究估计,机器
文档解析技术破解大模型语料“饥荒”难题
近日,由中国图象图形学学会主办的2024中国图象图形大会在西安开幕。大会通过20多场论坛、百余项成果,集中展示了生成式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。 大模型一路“高歌猛进”的背后,隐藏着一场关于模型训练语料的“能源危机”。根据人工智能研究人员小组Epoch研究估
腾讯元宝!混元大模型推出APP版
5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景,元宝的玩法也更加丰富,提供了多个特色AI应用,并新增了创建个
讯飞星火认知大模型面向全民开放
原文地址:http://news.sciencenet.cn/htmlnews/2023/9/507872.shtm