发布时间:2023-04-05 15:02 原文链接: 大模型向人类思维方式“对齐”将颠覆各行业生态

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/497842.shtm

 “大型语言模型技术的快速演进,已经为我们展现了通用人工智能的大框架。下一步,最重要的是让大模型和现实世界‘对齐’。在模型自我学习、自我迭代过程中,人必须参与其中,以保持机器与人类价值观、思维方式一致,否则可能会离人类的偏好越来越远。”近日,在复旦大学管理学院主办的复旦科创先锋论坛上,复旦大学计算机科学技术学院教授、MOSS系统负责人邱锡鹏如此表示。

  ?

邱锡鹏      复旦管院供图

当天,在主题为《MOSS:对话式大型语言模型》的演讲中,邱锡鹏介绍了大型语言模型背后的技术原理,他认为好的语言模型需要更好地理解语言与常识。ChatGPT的三大关键技术是情景学习、思维链和自然指令学习。

情景学习即在上下文语境中学习,语言模型会在提示词(prompt)中附带一些例子作为“上文”输入,再预测并输出下文,这改变了传统的学习范式,可以大幅降低下游开发成本;思维链指做大模型示例时不要只给答案,也要给它推导过程,通过推导过程最终得出正确答案。这是突破模型参数约束,实现“涌现”能力的关键技术;自然指令学习指模型能直接理解人类指令,从指令中学习、判断,不断“对齐”人类的真实意图。

演讲中,邱锡鹏透漏,其主持研发的MOSS系统将于4月中旬开源。他指出,MOSS和ChatGPT具有相近的通用语义理解能力,目前在推理能力和事实类知识方面还有一定差距。这主要是由于参数规模不足造成的,可以通过扩大模型规模来实现。

“首先是对语言模型基座进行架构优化,这面临输入长度、中文编码、多模态接入等挑战;其次是指令微调,其难度远高于预训练,而让模型的回答‘对齐’人类思维习惯也非常困难;最后才是能力强化。”邱锡鹏说,“当语言模型向人类的价值观和思维方式对齐,并应用于真实世界,无疑将颠覆各个行业生态。 ”

相关文章

国内首个船海学科教育专有大模型上线

近日,由哈尔滨工程大学研发的国内首个船海学科教育专有大模型——“兴海”大模型,在国家高教智慧教育平台正式上线。“兴海”教育专有大模型以DeepSeek、文心一言、Kimi三大模型作为支撑。大模型由哈工......

全国首个慢性肾脏病综合管理大模型发布

5月18日,由国家肾脏病临床医学研究中心(南方医科大学南方医院)牵头研发的“慢性肾脏病综合管理大模型——智肾”在南方医科大学南方医院正式发布。同时宣布将赠送“智肾”大模型给贵州省人民医院、新疆医科大学......

《中医药大模型评测标准》发布

近日,中医药交叉学科和智能科学大会在中国中医科学院举办,大会主题为“AI创新中医发展、数智均衡医疗资源”。国家中医药管理局副局长、中国中医科学院院长、中国工程院院士黄璐琦表示,中医药传承数千年,积累了......

大模型激活经济发展新动能

今年的政府工作报告提出,支持大模型广泛应用,并将其作为激发数字经济创新活力的核心举措之一。此举体现了我国对人工智能技术和数字经济发展的前瞻性布局,大模型成为带动千行百业生产力提升的新工具,更有望成为推......

国际首个符合国人特点的罕见病大模型进入临床

2月16日,北京协和医院与中国科学院自动化研究所共同研发的“协和·太初”罕见病大模型正式进入临床应用阶段。据悉,该模型基于我国罕见病知识库的多年积累和中国人群基因检测数据支撑,是国际首个符合中国人群特......

广东医科大学成功部署DeepSeekGDMU大模型

近日,广东医科大学健康医疗大数据工程中心携手华为技术团队共同打造的“DeepSeek-GDMU”大模型正式落地。记者获悉,“DeepSeek-GDMU”大模型是国内首个基于昇腾人工智能(AI)生态的医......

大模型安全治理:国际合作共筑AI发展新框架

“当前,人工智能技术以惊人的速度发展,如近期DeepSeek引领了低成本开发使用大模型的革新,这既为驱动新的创新提供了更多可能,也带来了诸多风险挑战,而在互联互通时代,加强国际合作至关重要。”2月11......

国产AI大模型DeepSeek升级,性能对标OpenAIo1正式版

1月20日,国产AI大模型DeepSeek正式发布新版本DeepSeek-R1,并同步开源模型权重。开发者表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,......

中国高校推出“元古大模型”助力地球科学研究

中新社武汉12月7日电(马芙蓉孙彦钦)由中国地质大学(武汉)与相关企业联合开发的“元古大模型”7日在武汉发布。该模型支持图生文、文生图、文生文等场景生成模式,验证了利用多模态大模型技术解决地球科学领域......

2024十大科技前沿发明

10月22日,百度在北京发布了“2024十大科技前沿发明”,一批创新AI(人工智能)原生应用和高价值专利成果披露,“大模型”成为关键词。这十大科技前沿发明具体为:基于生成式大模型的智能体技术,基于大模......