MOSS!今日正式开源上线

复旦大学自然语言处理实验室开发的新版 MOSS 模型今日正式上线,成为国内首个插件增强的开源对话语言模型。目前,MOSS 模型已上线开源,相关代码、数据、模型参数已在 Github 和 Hugging Face 等平台开放,供科研人员下载。据介绍,MOSS 是一个支持中英双语和多种插件的开源对话语言模型,moss-moon 系列模型具有 160 亿参数,在 FP16 精度下可在单张 A100 / A800 或两张 3090 显卡运行,在 INT4/8 精度下可在单张 3090 显卡运行。MOSS 基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。MOSS 来自复旦大学自然语言处理实验室的邱锡鹏教授团队,名字与《流浪地球》电影中的 AI 同名,已发布至公开平台(https://moss.fastnlp.top/),邀请公众参与内测。通过查看 ......阅读全文

MOSS!今日正式开源上线

复旦大学自然语言处理实验室开发的新版 MOSS 模型今日正式上线,成为国内首个插件增强的开源对话语言模型。目前,MOSS 模型已上线开源,相关代码、数据、模型参数已在 Github 和 Hugging Face 等平台开放,供科研人员下载。据介绍,MOSS 是一个支持中英双语和多种插件的开源对话语言

复旦MOSS团队:研究成果将会开源!

   由美国OpenAI公司开发的ChatGPT模型在全球点燃了新一轮AI革命,海内外关注度陡增。前不久,复旦大学计算机科学技术学院邱锡鹏团队发布类ChatGPT模型MOSS,新闻迅速登上微博热搜。  MOSS“火”了。2月20日发布当天就收到大量内测申请、采访、投资、合作邀约——公众对于这项原本局

复旦MOSS团队:研究成果将会开源!

原文地址:http://news.sciencenet.cn/htmlnews/2023/3/495039.shtm 由美国OpenAI公司开发的ChatGPT模型在全球点燃了新一轮AI革命,海内外关注度陡增。前不久,复旦大学计算机科学技术学院邱锡鹏团队发布类ChatGPT模型MOSS,新闻迅速

复旦MOSS团队回应:未抢注商标、拟3月开源

原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494312.shtm2月20日,复旦大学自然语言处理实验室教授邱锡鹏团队将其开发的对话式大型语言模型——MOSS,发布至公开平台(),并邀请公众参与内测。然而,很快由于“计算资源不足以支持激增的访问量”,

复旦团队发布国内首个类ChatGPT模型MOSS,邀公众参与内测

ChatGPT发布以来,基于指令学习技术的类ChatGPT模型在我国能否开发成功,成为业界关注的一个焦点。今天,解放日报·上观新闻记者从复旦大学自然语言处理实验室获悉,国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台(https://moss.fastnlp.top/),邀公众参

复旦MOSS距离ChatGPT还有多远?

最近上热搜的MOSS,不是《流浪地球2》中量子计算机550W给自己起的新名字,而是复旦大学计算机科学技术学院教授邱锡鹏团队最新发布的国内第一个对话式大型语言模型,也被称作中国版ChatGPT。2月20日,MOSS悄然上线,邱锡鹏团队发布至公开平台(https://moss.fastnlp.top/)

复旦MOSS距离ChatGPT还有多远?

原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494390.shtm 最近上热搜的MOSS,不是《流浪地球2》中量子计算机550W给自己起的新名字,而是复旦大学计算机科学技术学院教授邱锡鹏团队最新发布的国内第一个对话式大型语言模型,也被称作中国版C

复旦MOSS团队回应内测:没想到引起这么大关注

原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494275.shtm 中新网2月21日电(中新财经记者 宋宇晟) 近日有报道称,从复旦大学自然语言处理实验室获悉,国内第一个对话式大型语言模型MOSS已发布至公开平台,邀公众参与内测。记者21日注意到

“聪明的小孩”确实有“ChatGPT那味儿”

原文地址:http://news.sciencenet.cn/htmlnews/2023/3/495355.shtm前不久,复旦大学计算机科学技术学院邱锡鹏团队发布类ChatGPT模型MOSS的新闻迅速登上微博热搜。2月20日,MOSS发布当天就收到大量内测申请、采访、投资、合作邀约——公众对这项原

大模型向人类思维方式“对齐”将颠覆各行业生态

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/497842.shtm “大型语言模型技术的快速演进,已经为我们展现了通用人工智能的大框架。下一步,最重要的是让大模型和现实世界‘对齐’。在模型自我学习、自我迭代过程中,人必须参与其中,以保持机器与人类价值

AI语言模型“提速”药物发现

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502762.shtm美国麻省理工学院和塔夫茨大学研究人员设计出一种基于大型语言模型(如ChatGPT)的人工智能算法,这种称为ConPLex的新模型可将目标蛋白与潜在的药物分子相匹配,而无需执行计算分子结

MOSS大模型负责人:大模型不仅仅是工程问题

原文地址:http://news.sciencenet.cn/htmlnews/2023/9/508276.shtm·“很多人认为大模型是工程问题,但事实上并不是。大模型里存在很多科学问题,比如智能涌现、复杂推理、知识融合以及学习策略等等。”·“大模型的平民化”,即最终要让应用大模型的每个人都觉得成

首个种业大语言模型“丰登”发布

4月28日,中国农业大学生物学院教授王喜庆团队联合上海人工智能实验室、崖州湾国家实验室发布首个种业大语言模型“丰登”(SeedLLM)。种业大语言模型“丰登”。中国农业大学供图“丰登”集成了先进的人工智能技术(书生·浦语2.0)与大数据分析,通过深入学习我国迄今发布的科研文献、科技书籍、种企报告和历

国产AI大模型扎根涌现,给我们带来了什么?

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/499266.shtm 2023年2月20日深夜,MOSS的官网因服务器流量过载瘫痪,这是中国人对ChatGPT类产品兴趣暴增的最初征兆之一。AI大模型扎根涌现的两个月,给我们带来了什么? 此MOS

微软开源DeepSpeed-Chat帮用户训练模型

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/498432.shtm

我国首款网络安全领域编程语言实现开源

“当前,范围更广、技术更强、危害更大的新型网络攻击手段威胁网络生态,如何构建更强大、更可靠的网络安全防御体系?”在电子科技大学网络空间安全学院联合YAK语言研发团队于5月30日举行的发布会上,电子科技大学网络空间安全学院院长张小松表示,在开源共享平台的基础上,通过底层的创新,能有效提高网络的安全性和

ChatGPT进入课堂:语言模型如何改变教育

最近,教育心理学家罗纳德·贝格托(Ronald Beghetto)以一种引人注目的方式引领一群研究生和教育专业人员,与一系列以创造力为中心的聊天机器人进行了交流。这些聊天机器人由贝格托设计,即将托管在亚利桑那州立大学(ASU)设立的平台上。这些机器人使用与ChatGPT相同的人工智能(AI)技术,目

谷歌Bard将接入更大规模大语言模型

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/497708.shtm 谷歌对聊天机器人Bard进行了升级。  当地时间3月31日,谷歌及其母公司Alphabet的CEO桑达尔·皮查伊(Sundar Pichai)在一档播客节目中透露,Bard将

新引擎实现大语言模型推理速度显著提升

原文地址:http://news.sciencenet.cn/htmlnews/2023/11/511841.shtm

通义千问14B模型开源,“免费可商用”

原文地址:http://news.sciencenet.cn/htmlnews/2023/9/509255.shtm9月25日,阿里云开源通义千问140亿参数模型“Qwen-14B”及其对话模型“Qwen-14B-Chat”,免费可商用。阿里云CTO周靖人介绍说,Qwen-14B是一款支持多种语言的

文斐:研究解决大型语言模型的存储瓶颈问题

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/497858.shtm“由于半导体器件的物理限制,摩尔定律已经难以为继;今后计算机芯片的效率提升将主要来源于体系架构的创新。”华南理工大学计算机科学与工程学院原院长、广东省计算机学会理事长韩国强对《中国科学

中关村开源生态论坛暨大模型智能应用技术大会举办

原文地址:http://news.sciencenet.cn/htmlnews/2024/1/516894.shtm1月27日,中关村论坛永久会址建成后的首场活动—2024中关村论坛系列活动之中关村开源生态论坛暨大模型智能应用技术大会正式举办。大会聚集大模型生态上下游领军企业和技术专家,邀请海内外开

马斯克旗下大模型Grok宣布开源:参数量全球最大

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/519277.shtmxAI成了更“open”的AI。当地时间3月17日,特斯拉CEO埃隆·马斯克旗下的人工智能初创公司xAI正式宣布开源大模型Grok-1,遵循Apache 2.0协议开放模型权重和架构。

MOFormer:无需3D结构、基于Transformer的预测语言模型

金属有机框架(MOF)是具有高比表面积、高孔隙率和结构可设计的结晶性多孔材料,可用于气体吸附、气体储存、气体分离、催化剂等领域。  然而,MOF 的化学空间非常巨大。发现适合特定应用的最佳 MOF 需要对无数潜在候选材料进行高效、准确的搜索。快速且低成本地为特定任务选择性能最佳的 MOF 一直具有挑

每周有超100万行代码在开源AI领域创建

·LF AI & Data在2018年开始做AI开源生态系统时,只有大约70个项目被认为是关键项目,而现在已经增加到了350个。这些项目提供了超过6亿行代码,可供任何人选择、使用。·比如某银行,全国有八大研发中心,每个中心有N个项目组,每个项目组还有M个外包团队,在做着N乘以M个并行的软件项目。一堆

“复旦·眸思”助力视障者“看见”世界

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/518312.shtm 日前,基于多模态大模型“复旦·眸思”(MouSi),复旦大学自然语言处理实验室(FudanNLP)为视障者量身打造的“听见世界”APP上线,将成为视障人士的生活助手与智能管家。

各行业离不开软件应用?大模型还需哪些突破?

原文地址:http://news.sciencenet.cn/htmlnews/2023/12/513522.shtm 由复旦大学发布的MOSS大模型一度引发关注,它背后的团队现在在关注哪方面的技术突破? 12月2日,中国软件领域规模最大、影响最广的学术会议——CCF中国软件大会(China

科学家评估大型语言模型回答医学问题的能力

  图为研究团队的方法和现有技术的比较。Flan-PaLM540B模型在MedQA,MedMCQA和PubMedQA数据集上均超过了以往最先进的SOTA,每列上方显示的是准确率百分比。  你在网上搜过“我哪哪疼是不是得了啥啥病”吗?答案可能不尽如人意。但随着ChatGPT等大型自然语言模型(LLM)

东北大学研究团队发布TechGPT2.0大语言模型

  近日,计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。  TechGPT-2.0在继承了TechGPT-1.0全部特性的同时,通过增加多领域、多任务的数据,展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得

东北大学研究团队发布TechGPT2.0大语言模型

近日,计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。TechGPT-2.0在继承了TechGPT-1.0全部特性的同时,通过增加多领域、多任务的数据,展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得模型更适