发布时间:2023-12-10 16:20 原文链接: 东北大学研究团队发布TechGPT2.0大语言模型

近日,计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。

TechGPT-2.0在继承了TechGPT-1.0全部特性的同时,通过增加多领域、多任务的数据,展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得模型更适用于广泛的应用场景,为用户提供了更准确、更深入的信息处理和生成能力。

TechGPT2.0发布后,受到了学术界的广泛关注,“开放知识图谱”“机器学习算法与自然语言处理”“始智AI”等平台相继对TechGPT2.0的工作进行了介绍。并且,相应的模型也开源到了GitHub、HuggingFace、始智AI、魔塔等国内外开源社区,并提供了在线体验服务。

据悉,与研究小组2023年6月26日发布的TechGPT-1.0相比,TechGPT2.0新加了许多领域知识。除了TechGPT-1.0 所具备的计算机科学、材料、机械、冶金、金融和航空航天等10余种垂直专业领域能力,TechGPT-2.0 还在医学、法律等领域文本处理上展现出优秀的能力,并扩充了对地理地区、运输、组织、作品、生物、自然科学、天文对象、建筑等领域文本的处理能力。TechGPT-2.0还对幻觉、不可回答、长文本处理等问题进行了能力增强。同时,TechGPT-2.0对部署的硬件要求更低,使用NVIDIA 4090单机单卡或昇腾910A单机单卡就可完成TechGPT-2.0模型部署。


相关文章

东北大学领导班子调整

8月22日下午,东北大学召开干部教师会议,宣布教育部党组关于学校领导班子成员任免职的决定。唐立新、张玉宝同志任中共东北大学委员会副书记,徐伟同志任中共东北大学委员会常委、东北大学副校长(试用期一年)。......

新型AI芯片将大语言模型能耗减半

美国俄勒冈州立大学科研团队研发出一种新型AI芯片,成功将大语言模型的能耗降低50%。这项成果于近期在波士顿举行的IEEE定制集成电路会议上发布,是半导体领域的重大突破,有望成为解决大语言模型高能耗问题......

压缩算法为大语言模型“瘦身”

据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源......

东北大学原校长蒋仲乐逝世,享年91岁

9月12日,东北大学发布讣告,中国共产党优秀党员,东北大学原校长、原党委书记、教授蒋仲乐同志,因病医治无效,于2024年9月12日8时4分在苏州逝世,享年91岁。蒋仲乐同志生于1933年9月,江苏宜兴......

世界知识产权组织:中国生成式人工智能专利申请量世界第一

世界知识产权组织3日发布的报告显示,2014年至2023年,中国生成式人工智能专利申请量超3.8万件,居世界第一,是第二名美国的6倍。这份《世界知识产权组织生成式人工智能专利态势报告》显示,2014年......

提高大语言模型可信度,新方法助生成式AI破除“幻觉”

人工智能(AI)在给出准确答案的同时,也会有一些“胡乱输出”令人难辨真假,这被称为“幻觉”(hallucination)。而新一期《自然》杂志发表的一项研究报道了一种新方法,能检测大语言模型(LLM)......

又有高校精简行政机构:东北大学一学院13个部门压缩为5个

近期,东北大学工商管理学院压缩行政机构的消息引起学界关注。据东北大学新闻网报道,在今年4月工商管理学院行政机构优化动员部署会上,学院副院长庞洪江从工作背景、指导思想和目标、机构岗位优化原则、机构岗位优......

我国学者提出用好大语言模型实用策略

当前,大语言模型的应用日益广泛,覆盖从文本生成到复杂问题解决等多个领域,如何更好利用AI工具?记者10日从中国科学技术大学获悉,该校心理学系林志成特任研究员近日在其评论文章中研究提出一项实用策略,帮助......

我国学者提出用好大语言模型实用策略

中新网合肥5月10日电(记者吴兰)当前,大语言模型的应用日益广泛,覆盖从文本生成到复杂问题解决等多个领域,如何更好利用AI工具?记者10日从中国科学技术大学获悉,该校心理学系林志成特任研究员近日在其评......

科研人员利用大语言模型解释调节睡眠的分子机制

华中科技大学生命学院张珞颖团队和薛宇团队在NatureCommunications杂志上合作发表了题为“Large-languagemodelsfacilitatediscoveryofthemole......