复旦MOSS团队回应:未抢注商标、拟3月开源

原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494312.shtm2月20日,复旦大学自然语言处理实验室教授邱锡鹏团队将其开发的对话式大型语言模型——MOSS,发布至公开平台(),并邀请公众参与内测。然而,很快由于“计算资源不足以支持激增的访问量”,当晚该平台就无法正常注册、试用。截至目前,多数有试用兴趣的用户在提交了注册信息后,仍无法获得内测邀请码,只能“耐心等待”。 ?关于MOSS的说明 截图自MOSS官方平台随后,在该平台官网发布的一则说明中,该团队表示,MOSS目前还处于内测阶段,主要目的是通过和用户交互来迭代优化,“暂不适合大规模用户公测”。并表态,在MOSS完成初步的验证之后,团队会将MOSS的经验、代码、模型参数开源出来,“供大家参考”。在这则说明中,MOSS团队坦承,MOSS还是一个非常不成熟的模型,距离ChatGPT“还有很长的路......阅读全文

ChatGPT进入课堂:语言模型如何改变教育

最近,教育心理学家罗纳德·贝格托(Ronald Beghetto)以一种引人注目的方式引领一群研究生和教育专业人员,与一系列以创造力为中心的聊天机器人进行了交流。这些聊天机器人由贝格托设计,即将托管在亚利桑那州立大学(ASU)设立的平台上。这些机器人使用与ChatGPT相同的人工智能(AI)技术,目

压缩算法为大语言模型“瘦身”

据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。团队举例称,当人们使用ChatGPT时,请求

商汤大模型多个评测表现超ChatGPT

本报讯 (记者沈湫莎)商汤科技近日公布了自研中文语言大模型“商量SenseChat 2.0”在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。评测显示,“商量”在这三个测试集中的表现均领先ChatGPT,实现了我国语言大模型研究的突破。      全球三大权威语言模型测评基准

8个小技巧“用好”大语言模型

用大语言模型,还需要技巧?在人们的印象中,这是个极其简单的操作:只需输入一个问题,立刻就能得到回答。但实际上,如何有效地与这些人工智能模型互动,发挥出它们的最大潜力,却是一个经常被忽视的话题。中国科学技术大学心理学系特任研究员林志成关注到这一话题,并在他最近的评论文章中提供了一系列的策略和指导,希望

商汤大模型“商量”多个评测表现超ChatGPT

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503362.shtm

新型AI芯片将大语言模型能耗减半

  美国俄勒冈州立大学科研团队研发出一种新型AI芯片,成功将大语言模型的能耗降低50%。这项成果于近期在波士顿举行的IEEE定制集成电路会议上发布,是半导体领域的重大突破,有望成为解决大语言模型高能耗问题的“绿色钥匙”。  当前,以谷歌“双子座”和OpenAI的GPT-4为代表的大语言模型,因海量参

新引擎实现大语言模型推理速度显著提升

原文地址:http://news.sciencenet.cn/htmlnews/2023/11/511841.shtm

大语言模型在线辩论说服力超人类

实验设计示意图。图片来源:英国《自然·人类行为》在线版《自然·人类行为》19日发表的一项人工智能(AI)研究发现,在线辩论中,GPT-4一类的大语言模型(LLM)如能根据对手的个性化信息调整它们的论据,其说服力比人类辩手高出64%。研究结果显示了GPT-4生成有针对性和说服力论据的能力,揭示出AI工

上海发布“书生·浦语”大模型:评测表现优秀

“书生·浦语”联合团队选取了20余项评测对其进行检验,其中包含全球最具影响力的四个综合性考试评测集,对“书生·浦语”、清华大学的GLM-130B、Meta的LLaMA-65B、OpenAI的ChatGPT和GPT-4进行了全面测试。6月7日,上海人工智能实验室(上海AI实验室)、商汤科技联合香港中文

“AI+教育”,复旦推出大语言模型助力新生报到

8月25日,是复旦大学本科生新生报到的日子。来自全国各地和全球40多个国家的4300余名2024级本科新生,开启了在复旦的求学生涯。新生报道现场。为帮助来自世界各地的新同学尽快融入复旦大学,学校基于大语言模型,推出“复旦迎新助手”智能Agent。作为新生的贴心小帮手,大语言模型为新同学在迎新阶段提供

复旦MOSS距离ChatGPT还有多远?

最近上热搜的MOSS,不是《流浪地球2》中量子计算机550W给自己起的新名字,而是复旦大学计算机科学技术学院教授邱锡鹏团队最新发布的国内第一个对话式大型语言模型,也被称作中国版ChatGPT。2月20日,MOSS悄然上线,邱锡鹏团队发布至公开平台(https://moss.fastnlp.top/)

复旦MOSS距离ChatGPT还有多远?

原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494390.shtm 最近上热搜的MOSS,不是《流浪地球2》中量子计算机550W给自己起的新名字,而是复旦大学计算机科学技术学院教授邱锡鹏团队最新发布的国内第一个对话式大型语言模型,也被称作中国版C

日本发布大规模语言模型

  东京工业大学、日本理化学研究所及富士通公司等近日宣布,利用超级计算机“富岳”,他们开发的大规模语言模型“Fugaku-LLM”正式发布。  “Fugaku-LLM”是首个完全由日本国产技术构建的AI语言模型,其在处理日语及相关文化内容上表现卓越。模型特别擅长基于日语敬语进行自然对话,并展现出在人

日本发布大规模语言模型

科技日报讯 (记者李杨)东京工业大学、日本理化学研究所及富士通公司等近日宣布,利用超级计算机“富岳”,他们开发的大规模语言模型“Fugaku-LLM”正式发布。“Fugaku-LLM”是首个完全由日本国产技术构建的AI语言模型,其在处理日语及相关文化内容上表现卓越。模型特别擅长基于日语敬语进行自然对

AI语言模型“提速”药物发现

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502762.shtm美国麻省理工学院和塔夫茨大学研究人员设计出一种基于大型语言模型(如ChatGPT)的人工智能算法,这种称为ConPLex的新模型可将目标蛋白与潜在的药物分子相匹配,而无需执行计算分子结

大模型向人类思维方式“对齐”将颠覆各行业生态

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/497842.shtm “大型语言模型技术的快速演进,已经为我们展现了通用人工智能的大框架。下一步,最重要的是让大模型和现实世界‘对齐’。在模型自我学习、自我迭代过程中,人必须参与其中,以保持机器与人类价值

复旦团队发布国内首个类ChatGPT模型MOSS,邀公众参与内测

ChatGPT发布以来,基于指令学习技术的类ChatGPT模型在我国能否开发成功,成为业界关注的一个焦点。今天,解放日报·上观新闻记者从复旦大学自然语言处理实验室获悉,国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台(https://moss.fastnlp.top/),邀公众参

复旦MOSS团队回应:未抢注商标、拟3月开源

原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494312.shtm2月20日,复旦大学自然语言处理实验室教授邱锡鹏团队将其开发的对话式大型语言模型——MOSS,发布至公开平台(),并邀请公众参与内测。然而,很快由于“计算资源不足以支持激增的访问量”,

东北大学研究团队发布TechGPT2.0大语言模型

  近日,计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。  TechGPT-2.0在继承了TechGPT-1.0全部特性的同时,通过增加多领域、多任务的数据,展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得

科研人员利用大语言模型解释调节睡眠的分子机制

华中科技大学生命学院张珞颖团队和薛宇团队在Nature Communications杂志上合作发表了题为“Large-language models facilitate discovery of the molecular signatures regulating sleep and activ

东北大学研究团队发布TechGPT2.0大语言模型

近日,计算机科学与工程学院任飞亮副教授主持的“东北大学知识图谱研究组”发布了大语言模型TechGPT2.0。TechGPT-2.0在继承了TechGPT-1.0全部特性的同时,通过增加多领域、多任务的数据,展现出了嵌套实体的抽取、幻觉回答、回答不可回答问题和回答长文本问题的能力。这些改进使得模型更适

科研人员利用大语言模型解释调节睡眠的分子机制

华中科技大学生命学院张珞颖团队和薛宇团队在Nature Communications杂志上合作发表了题为“Large-language models facilitate discovery of the molecular signatures regulating sleep and activ

复旦MOSS团队回应内测:没想到引起这么大关注

原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494275.shtm 中新网2月21日电(中新财经记者 宋宇晟) 近日有报道称,从复旦大学自然语言处理实验室获悉,国内第一个对话式大型语言模型MOSS已发布至公开平台,邀公众参与内测。记者21日注意到

类ChatGPT给金融行业带来何种机遇与挑战?

“金融业和人工智能开展合作还有很大的应用空间,所以推动人工智能技术在金融领域,尤其是资产管理领域的创新应用,将成为上海金融中心、资管中心建设的重要支撑和未来重要的关键方向。”上海市地方金融监管局监管三处处长赵焕如是说。18日,由上海资产管理协会、智能投研技术联盟主办,中国信息通信研究院云计算与大数据

首个种业大语言模型“丰登”发布

4月28日,中国农业大学生物学院教授王喜庆团队联合上海人工智能实验室、崖州湾国家实验室发布首个种业大语言模型“丰登”(SeedLLM)。种业大语言模型“丰登”。中国农业大学供图“丰登”集成了先进的人工智能技术(书生·浦语2.0)与大数据分析,通过深入学习我国迄今发布的科研文献、科技书籍、种企报告和历

清华团队与合作者推出大语言模型RealSafeR1

2月23日,清华大学与瑞莱智慧联合团队推出大语言模型RealSafe-R1。研发团队代表介绍说,实验数据表明RealSafe-R1安全性提升显著,“安全增强版DeepSeek”可为更多应用提供可靠坚实基座。连日来,国产开源大模型DeepSeek的优异表现备受关注,其在自然语言处理和多任务推理方面的能

破局ChatGPT挑战,在风险来临前为人类点亮新技能树

原文地址:http://news.sciencenet.cn/htmlnews/2023/5/501063.shtm当前,ChatGPT类工具引爆全球人工智能热潮,如何未雨绸缪应对生成式人工智能带来的多重挑战?近日,在复旦大学建校118周年相辉校庆系列学术活动中,复旦大学国家智能评价与治理实验基地副

文心一言开启邀测,专家呼吁给中国类ChatGPT更多成长机会

距离新一代人工智能语言模型GPT-4发布不到24小时,国内互联网大厂百度3月16日发布了对标ChatGPT的AI产品——文心一言。 尽管百度创始人兼董事长李彦宏一上台就“降了音调”,表示推出文心一言是为了回应市场期待,产品本身并不完美,但仍然无法降低网友心中早已被拉满的期望值。文心一言开启邀请测试不

微调大语言模型,科学家开发化学文本挖掘新方法

6月7日,中国科学院上海药物研究所研究员郑明月课题组在五项化学文本挖掘任务上对多个大语言模型的能力进行了全面综合的探究,展现了微调大语言模型成为一种通用高效的生成式文本挖掘方法,为大模型的落地应用提供参考。相关研究发表于《化学科学》。 近两年,以ChatGPT为代表的大语言模型(LLM)引领了人工智

360智脑通过中国信通院可信AIGC大语言模型功能评估

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502739.shtm6月12日,360智脑的360GPT-S2-V8型号产品获得了中国信息通信研究院(以下简称“中国信通院”)“可信AIGC大语言模型基础能力”评估报告(以下简称“报告”),报告显示必选项