发布时间:2024-04-17 15:40 原文链接: 一年零一月,文心大模型进化成AI创造“底牌”

“未来,自然语言将成为新的通用编程语言。”

4月16日,Create 2024百度AI开发者大会在深圳举行。百度公司董事长兼首席执行官李彦宏作“人人都是开发者”的主题演讲,并带来了“开箱即用”的三大AI开发工具——智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。

这是自2023年10月文心大模型4.0发布以来,时隔半年后的全新面孔。值得一提的是,文心大模型此次升级,几乎全部都是“开发者友好”视角:以文心大模型为基础,为开发者提供所需的开发工具。李彦宏说:“未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”

让人人成为创造者,文心大模型的底气什么?百度首席技术官王海峰在大会上的主题演讲给出了答案:“技术筑基,星河璀璨”。

进化出会思考的智能体

从诞生之初至今,文心大模型就专注于一件事:能力进化。

2023年3月16日,国内首个知识增强大语言模型文心一言问世。在这之后的一年零一个月的时间里,文心大模型持续快速迭代。至2023年10月17日,文心大模型4.0亮相“百度世界2023”。文心4.0基于万卡算力和飞桨平台,并通过与飞桨平台联合调优,实现了多维数据、多阶段对齐、可再生训练等技术能力。

时隔半年之后,Create 2024百度AI开发者大会上的文心大模型又有了“新花样”:在技术架构中正式增加了“智能体”。

智能体并不是第一次出现在文心大模型的框架之下。

去年10月,百度就在文心大模型中引入了智能体机制。王海峰介绍,借鉴《思考,快与慢》一书阐述的智能系统,百度在基础大模型的基础上研制了虽反应慢但更理性、更准确的“系统2”,让大模型像人一样理解、规划、反思,并一定程度上将思考过程白盒化,使大模型在完成复杂任务的同时,还可以在环境中持续学习、自主进化。

这其中的“思考过程”是怎样的?具体是如何实现的?

王海峰解释说,系统2在基础模型上增加了思考增强训练,包括思考过程的有监督精调、行为决策的偏好学习、结果反思的增强学习,就得到了思考模型。有了思考模型,大模型就可以像人一样,会阅读说明书、学习工具的使用方法,进一步“懂得”合理运用工具来完成任务。

在现场,文心一言接到王海峰“我要到大湾区出差一周,想了解一下天气变化,好决定带什么衣服。请帮我查一下,并整理成表格”的指令,启动智能体机制,将需求拆解成多个子任务,并先后调用联网工具查天气,调用“代码解释器”画温度趋势图,进而根据天气情况建议了衣物,并对结果进行反思、确认,并自动汇总成表格。

代码能力助人人成为开发者

面向广大用户对于低门槛开发的需求,百度基于文心大模型的自然语言的能力和代码能力,开发了代码智能体和智能代码助手。

秉持“用模型写代码让复杂的任务变简单”的思想,文心大模型在思考模型的基础上,结合代码解释器构成了代码智能体。它的工作原理大概如下:首先,思考模型理解用户需求,把完成任务的指令和相关信息整合成提示,输入给代码解释器;然后,代码解释器根据提示,把自然语言表达的用户需求翻译成代码并执行,得到执行结果或调试信息;接着,思考模型对代码解释器的执行结果进行反思、确认,若正确,则把结果返回给用户,不正确则继续更新。

通过这样的机制,智能体可以理解用户的需求,实现“只要说说话,就能完成AI应用开发”。

智能代码助手则可以帮助专业程序员更高效、便捷地写出高质量代码。在模型效果不断提升的基础上,百度进一步构建了智能代码助手上下文增强、私域知识增强、流程无缝集成等能力。

“代码智能体是让大家有机会做之前只有程序员才能做的开发,智能代码助手则意在帮助专业的程序员写出更好的代码,是程序员的AI同侪。”王海峰谈到,作为人类思维的载体,自然语言代表了人的思考;有着严密逻辑的形式语言是计算机可执行的程序。从自然语言到形式语言,打通了从思考到执行的过程。

最大化平衡效果、效率和成本

除了智能体、代码能力之外,王海峰还着重介绍了多模型技术。

“在大模型应用落地过程中,效果、效率和成本都很重要。在实际应用中,需要从场景需求出发,选择最适合的模型。”王海峰说,大模型效果好,小模型速度快,为了更好地平衡效果与效率,多模型技术是必经之路。

他介绍说,对此,百度研制了基于反馈学习的端到端多模型推理技术,构建了智能路由模型,其可进行端到端反馈学习,充分发挥不同模型处理不同任务的能力,最终实现效果、效率和成本的最佳平衡。

王海峰还提到,在高效低成本模型生产方面,技术团队还研制了大小模型协同的训练机制,可以有效进行知识继承、高效生产高质量的小模型,也可以利用小模型实现对比增强,帮助大模型训练。高效低成本模型生产机制,助力应用速度更快、成本更低、效果更好。

文心大模型在其他方面也持续创新,包括基于模型反馈闭环的数据体系、基于自反馈增强的大模型对齐技术及多模态技术等。王海峰现场公布,文心大模型4.0的效果持续提升,相比半年前提高52.5%。

王海峰表示,文心大模型的持续快速进化,得益于百度在芯片、框架、模型和应用上的全栈布局,尤其是飞桨深度学习平台和文心的联合优化。文心大模型的周均训练有效率达到98.8%,相比一年前训练效率提升4.1倍。

王海峰透露,截至目前,飞桨文心生态已凝聚1295万开发者,服务24.4万家企事业单位,基于飞桨和文心创建89.5万个模型。同时,文心一言累计用户规模已达2亿,日均调用量也达到了2亿,高效满足了用户工作、生活和学习需求。

王海峰介绍了百度AI人才计划的最新进展。百度在2020年提出了5年为全社会培养500万AI人才,目前这一目标已提前达成。他表示,“未来,百度将继续投身人才培养,让人才的点点星光,汇成璀璨星河。”

 


相关文章

治沙“中国方案”,从沙坡头出发

■本报见习记者叶满山沿着定武高速(G2012)一路向东,当道路与包兰铁路线平行时,只需再前行几公里,便能远远望见黄河沿着群山的北面,在沙山下转了个大弯,向东奔流。铁路线两侧的沙漠被条状的绿色长廊阻隔,......

腾讯元宝!混元大模型推出APP版

5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结......

普冰“炼成”:为小麦种业注入新动能

戈壁滩上有一种野草,茎秆细韧,叶子坚硬窄短内卷,花序粗壮,小穗紧密平行排列成两行。它有一个好听的名字——冰草。由于冰草营养丰富,适口性佳,被各种家畜所喜食,成为中国北方干旱及半干旱地区人工草地种植的重......

科学家构建鹰嘴豆属超级泛基因组

鹰嘴豆是世界第三大豆类作物,具有重要的经济价值和营养价值,其固氮能力能改善土壤肥力,具有独特的生态价值。但鹰嘴豆的遗传背景相对狭窄、抵抗生物或非生物胁迫的能力不足,限制了它的育种改良。5月29日,华大......

仿海豹踱步,微小型机器人获新进展

日前,哈尔滨工业大学深圳校区机电工程与自动化学院教授李兵、李曜团队在微小型机器人领域取得新进展,相关成果发表于《先进科学》。在微型机器人领域,简化驱动形式和减少驱动器数量是一大难题,因为驱动器是限制机......

广东成功举办首届“民生杯”食用农产品快检竞赛

5月27日至29日,广东省市场监督管理局与省总工会联合举办2024年首届“民生杯”食用农产品快速检测职业技能竞赛。经过理论、实操和竞答3轮次的激烈角逐,深圳市市场监督管理局代表队和深圳某农产品检测认证......

“普盛海洋牧场6号”在广州南沙交付

5月30日,由中国科学院广州能源研究所研发设计,中国船舶集团旗下广船国际所属文冲修造负责建造的半潜式深远海智能养殖旅游平台“普盛海洋牧场6号”在广州南沙命名交付。记者获悉,“普盛海洋牧场6号”半潜式深......

广州出台方案进一步完善科研经费管理

近日,广州市科技局和广州市财政局联合发布了《关于进一步完善广州市科技计划项目经费“负面清单+包干制”工作方案》(以下简称《方案》)。记者获悉,“包干制+负面清单”管理模式取消了传统的预算编制要求,允许......

南海北部天然气水合物气源成因研究获新进展

近日,广州海洋地质调查局科研人员在南海北部天然气水合物气源成因研究方面取得新进展,他们发现深部热成因烃源能为天然气水合物成藏提供气体。相关成果发表于《海洋和石油地质》(MarineandPetrole......

波浪与可渗结构相互作用研究取得进展

近日,南方海洋科学与工程广东省实验室(广州)教授、广东省创新团队“南海生态环境权益综合研究”带头人唐丹玲团队与合作者,利用无网格方法研究波浪与可渗结构相互作用方面取得进展。相关成果发表于《流体物理学》......