发布时间:2023-02-23 10:11 原文链接: 复旦MOSS距离ChatGPT还有多远?

最近上热搜的MOSS,不是《流浪地球2》中量子计算机550W给自己起的新名字,而是复旦大学计算机科学技术学院教授邱锡鹏团队最新发布的国内第一个对话式大型语言模型,也被称作中国版ChatGPT。

2月20日,MOSS悄然上线,邱锡鹏团队发布至公开平台(https://moss.fastnlp.top/),邀公众参与内测。但是由于瞬时访问火爆,计算资源无法支撑,内测窗口已暂时关闭。

悄然上线,又匆匆关闭,MOSS这一“快闪”的举动,让它的亮相饱受争议。

科技日报记者在浏览器上输入公开平台的网址,其中对MOSS这样介绍:一种像ChatGPT的对话语言模型。MOSS能够按照用户的指示执行各种自然语言任务,包括问答、生成文本、总结文本、生成代码等。MOSS还能够挑战不正确的前提,并且拒绝不适当的请求。

那么相对于美国OpenAI的ChatGPT,中国的MOSS有何特别之处呢?记者在主页看到了这样的介绍:MOSS和ChatGPT的区别——如MOSS的参数量比ChatGPT少得多;MOSS通过与人类和其他AI模型交谈来学习,而ChatGPT是使用来自人类反馈的强化学习(RLHF)进行培训;MOSS将是开源的,以促进未来的研究,但ChatGPT可能不是这样。

据介绍,MOSS开发的基本步骤与ChatGPT一样,包括自然语言模型的基座训练、理解人类意图的对话能力训练两个阶段。作为MOSS主要作者之一,邱锡鹏表示:“MOSS与ChatGPT的差距主要在自然语言模型基座预训练这个阶段。MOSS的参数量比ChatGPT小一个数量级,在任务完成度和知识储备量上,还有很大提升空间。”

ChatGPT语言模型的参数量高达1750亿,而在它问世前,世界上最大的语言模型是微软开发的Turing-NLG,其参数量为170亿。自去年11月30日正式发布以来,ChatGPT上线5天,注册用户就突破百万。目前,其用户规模已达到1亿,成为互联网发展史上用户增长最快的消费级应用。

在关闭内测之后,MOSS官网发布公告称,MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路要走。“我们是一个进行学术研究的实验室,无法做出和ChatGPT能力相近的模型。”科研团队相关负责人指出,当前版本的MOSS表现不够稳定,部分回答或存在事实差错、逻辑不顺等问题。不仅如此,MOSS的英文回答水平较中文回答水平更高,这主要受到其模型基座的单词收录量影响,MOSS学习了3000多亿个英文单词,但中文词语只学了约300亿个。

复旦大学计算机科学技术学院教授张奇是推出MOSS的复旦大学NLP实验室核心成员之一。对于ChatGPT背后模型所拥有的1750亿的参数规模,他在一次公开讨论中表示,学校这类机构很难去完成,目前百亿级的规模都已经非常困难。

按照ChatGPT目前开源的最简单复现版本、最便宜模式去计算,要做到1750亿的参数规模,需要大概6000万元的硬件成本,同时运算3.5个月。这还是所有事情都做对的情况,如中间有参数调整,或者想加速训练过程,就需要更高规模的投资。

归根到底还是研发投入的问题。而除了学术界,国内科技企业也纷纷摩拳擦掌开发自己的ChatGPT:原美团联合创始人王慧文近日明确表示,要“组队拥抱新时代,打造中国OpenAI”;百度此前宣布将在3月上线百度版ChatGPT——文心一言(英文名为ERNIE Bot);阿里达摩院正在研发类ChatGPT的对话机器人,目前已开放给公司内员工测试;科大讯飞也表示,Al学习机将成为公司类ChatGPT技术率先落地的产品……


相关文章

AI大事件,复旦大学携手阿里云国内首个高校智算平台来了

国内高校首例!在数据和智能技术驱动的“大科学时代”,如何在日新月异的科技创新环境中赢得主动,在关键领域取得创新突破,是时代给予高校的命题。6月27日,国内高校最大的云上科研智算平台CFFF(Compu......

复旦教授高翔:多做园艺,老年人血脂并非越低越好

“这是一个很好的开始,但是无论是machinelearning(机器学习)还是ChatGPT(OpenAI研发的聊天机器人程序),它们都只是工具,并不是魔法棒,流行病学研究的根本是提出研究问题,以及在......

研究生嫖娼被开除起诉复旦,二审宣判;3所大学停办

研究生嫖娼被开除起诉复旦,二审宣判复旦大学一研究生嫖娼被开除起诉学校一案近日迎来二审判决结果,据东方网·纵相视频报道,上海市第三中级人民法院决定驳回上诉,维持原判。2021年9月,复旦大学3名研究生(......

切问国之所需,笃志科研报国:复旦教授汇聚一堂

2023年5月27日,是复旦大学118周年校庆。“校庆种种活动,以促进科学研究为中心。”从1954年校庆前夕时任校长陈望道提出这一主张开始,在校庆期间举办科学报告会,就成为复旦的重要学术传统之一。赓续......

不结盟、不对抗、不针对第三方衡水等9所高中成立C9联盟

3月12日,由国内9所顶尖高中发起,在浙江省宁波市成立了新时代中国卓越高中发展共同体(China’s9ExcellentHighSchoolsDevelopmentCommunityinTheNewE......

复旦MOSS距离ChatGPT还有多远?

最近上热搜的MOSS,不是《流浪地球2》中量子计算机550W给自己起的新名字,而是复旦大学计算机科学技术学院教授邱锡鹏团队最新发布的国内第一个对话式大型语言模型,也被称作中国版ChatGPT。2月20......

无心插柳的课题发了Nature论文,新发现或“颠覆教科书”

复旦大学脑科学转化研究院青年研究员袁鹏,是一个非常质朴的人。回国之前,他在美国耶鲁大学读完博士,在美国斯坦福大学做了博后的工作,提及此他说:“回国主要是家庭原因,父母不想在国外生活。而且他们年纪大了,......

复旦团队发布国内首个类ChatGPT模型MOSS,邀公众参与内测

ChatGPT发布以来,基于指令学习技术的类ChatGPT模型在我国能否开发成功,成为业界关注的一个焦点。今天,解放日报·上观新闻记者从复旦大学自然语言处理实验室获悉,国内第一个对话式大型语言模型MO......

2023复旦管院新年论坛点亮智慧之光

1月8日,一年一度的“瞰见未来”复旦大学管理学院新年论坛在云端举行。来自不同领域的专家学者及复旦优秀青年代表共聚复旦管院新年论坛,对科学、文明及管理进行深度解读,以人文之火温暖心灵,用理性之光洞彻时代......

中山医院岳嘉宁:短视频医学科普目的是获得患者的信任

“科普是医生的天然习惯,也是医生的责任。”来自复旦大学附属中山医院血管外科的岳嘉宁医生这样谈道。打开岳嘉宁医生的抖音账号“岳话越明白”,我们发现从2020年5月开始,他就开始通过短视频平台进行医学科普......