东北大学研究团队发布TechGPT2.0大语言模型

发布时间：2023-12-10 16:20 原文链接：东北大学研究团队发布TechGPT2.0大语言模型

近日，计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。

TechGPT-2.0在继承了TechGPT-1.0全部特性的同时，通过增加多领域、多任务的数据，展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得模型更适用于广泛的应用场景，为用户提供了更准确、更深入的信息处理和生成能力。

TechGPT2.0发布后，受到了学术界的广泛关注，“开放知识图谱”“机器学习算法与自然语言处理”“始智AI”等平台相继对TechGPT2.0的工作进行了介绍。并且，相应的模型也开源到了GitHub、HuggingFace、始智AI、魔塔等国内外开源社区，并提供了在线体验服务。

据悉，与研究小组2023年6月26日发布的TechGPT-1.0相比，TechGPT2.0新加了许多领域知识。除了TechGPT-1.0 所具备的计算机科学、材料、机械、冶金、金融和航空航天等10余种垂直专业领域能力，TechGPT-2.0 还在医学、法律等领域文本处理上展现出优秀的能力，并扩充了对地理地区、运输、组织、作品、生物、自然科学、天文对象、建筑等领域文本的处理能力。TechGPT-2.0还对幻觉、不可回答、长文本处理等问题进行了能力增强。同时，TechGPT-2.0对部署的硬件要求更低，使用NVIDIA 4090单机单卡或昇腾910A单机单卡就可完成TechGPT-2.0模型部署。

其他网友还关注过

更多与东北大学研究团队发布TechGPT2.0大语言模型相关的新闻

东北大学研究团队发布TechGPT2.0大语言模型

其他网友还关注过

东北大学领导班子调整

新型AI芯片将大语言模型能耗减半

压缩算法为大语言模型“瘦身”

东北大学原校长蒋仲乐逝世，享年91岁

世界知识产权组织：中国生成式人工智能专利申请量世界第一

提高大语言模型可信度，新方法助生成式AI破除“幻觉”

又有高校精简行政机构：东北大学一学院13个部门压缩为5个

我国学者提出用好大语言模型实用策略

我国学者提出用好大语言模型实用策略

科研人员利用大语言模型解释调节睡眠的分子机制