用大语言模型,还需要技巧?在人们的印象中,这是个极其简单的操作:只需输入一个问题,立刻就能得到回答。
但实际上,如何有效地与这些人工智能模型互动,发挥出它们的最大潜力,却是一个经常被忽视的话题。
中国科学技术大学心理学系特任研究员林志成关注到这一话题,并在他最近的评论文章中提供了一系列的策略和指导,希望帮助人们更好地理解和“用好”这些先进的人工智能工具,生成更精准的回答。相关研究成果日前发表于《自然-人类行为》。
近日,《中国科学报》记者采访了林志成。“从本质上来看,大语言模型是一个数学模型,缺乏对语义的理解。它只能‘预测下一个文字’出现的概率,而不能生成‘真理’。”林志成建议在输入指令时,可以使用分解复杂任务、增加相关语境、角色扮演、提供具体示例等8个小技巧。
分解复杂任务
由于缺乏对语义的理解,因此想要大语言模型自己“举一反三”,是很难的。但是,它有海量的数据、珍贵的“记忆”,可以从中提取信息。这套记忆来源于训练数据——长期记忆,还有人们日常给予的指令——短期记忆。
因此,用好大语言模型,林志成给出的第一个小技巧是拆分复杂任务。
例如,不要直接给出“将文本翻译成中文”这样宽泛的指令,可以考虑把它拆解成两步:首先按字面意思翻译,保持含义不变;然后意译,让文本符合中文的语言习惯。
类似地,与其让它直接写出一篇1000字的论文,不如尝试把任务分解成子任务,用具体的指令分别生成概述、结论和中心论点。
林志成说,“清晰、逐步的指令,会降低模糊性和不确定性,因此可以生成更为准确的答案。”
添加相关语境
大语言模型比人类的“短期记忆”多太多了。因此,想要让它提供精准且符合问题语境的回复,在输入时提供相关的语境就很重要。这是第二个小技巧。
林志成说,一个限定语境的问题应当包含具体内容,将问题放在具体的细节中,这样才能引导大语言模型产生更为准确、相关的理解力,生成更有洞察力、更精细的回复。
例如,让大语言模型起草一份求职简历,事先要把企业发布的具体职位需求、个人基本情况等内容一并提供给它,如此一来,输出的简历则更具有针对性。
明确的指令
当你走进一间咖啡馆,想要点一杯喜欢的饮料,应该不会说:“请来杯咖啡。”而是会说,“来杯摩卡或者拿铁。”
同样地,你也不要期待大语言模型能读懂你的心。
林志成指出,要想降低模型预测时的不确定性,就要给出明确的指令。这是第三个小技巧。
例如,你让大语言模型修改文章,不要说“润色这篇文章”,而要具体到修改成什么风格、文章的目标受众是谁……
林志成说,一段更具体的指令甚至可以是“像个顶级期刊的顶级编辑那样,润色这篇文章,让它更为清晰流畅。”
让它提供多种选项
大语言模型还拥有巨大的“长期记忆”,超强的生产能力。你可以让它提供多种版本的选项,而不仅仅是一个版本内容。
“很多时候,人们潜意识里认为,大语言模型给出的就是最优答案。但就文本写作而言,它并不是一个简单量化的东西,它具备很多主观色彩。因此很难判断大语言模型第一次给出的就是最优答案。”林志成说,此时,可以让大语言模型提供多种选项,再鉴赏出符合个人需求的答案。这是第四个小技巧。
此外,林志成建议,除了要求大语言模型提供多种选项外,还可以考虑重复用同样的指令多次生成回复。
设定角色
大语言模型特有的“长期记忆”还意味着它能够模拟各种角色,提供专业的反馈或者独特的视角解读。
例如,模仿典型读者,提供写作上的反馈;扮演一名写作教练,帮助修订文稿;甚至可以扮演一只擅长人类生理学的西藏牦牛,以其独特的视角解释高海拔对心肺功能的影响。这是第五个小技巧。
林志成说,“让大语言模型扮演不同角色,不仅能获得更多有针对性和符合语境的回复,而且在这个过程中,还能获得更多乐趣。”
提供具体例子
大语言模型擅长小样本学习。林志成说,“一个特别有效的手段就是使用具体的例子丰富想法。就像你去理发店,对理发师描述想要的发型,最好的方法是拿一张照片,胜过千言万语。”这是第六个小技巧。
例如,不要模糊地说“以这些数据制图”,而是提供一个例子,如“为这些数据画个条形图,类似附件论文中的图”。另一个例子是,当你让大语言模型根据文稿生成摘要时,可以提供几个你打算投稿的期刊中的摘要样例。语言模型可以参考这些例子来生成符合期刊风格的摘要。
“这些具体的例子就像路线图一样,指导大语言模型朝着与你期望一致的方向生成内容。”林志成说。
声明想要的输出格式
林志成说,大语言模型经常“废话太多”。例如,让它修改一篇文章,它可能会把修改的细节一并反馈,但其实你只需要最后的成稿。
此时,可以要求大语言模型仅输出修改后的内容。类似地,可以指定回复的格式,包括列表格式、阅读水平和语气等。用列表格式和通俗的语气能够提升回复的可读性;限制回复的长度可以使内容更加简洁;设定阅读水平则有助于更好地理解。这是第七个小技巧。
例如,与其让其“总结关键发现”,不如声明回复格式:“用列表形式总结关键发现,并使用高中生能够理解的语言”。
实验、实验、再实验
“需要指出的是,如何使指令更有效,并没有确切的答案。有时,稍微调整一下,可能就会产生显著甚至意外的惊喜。”林志成说,实验、实验、再实验,是最好的办法。这也是第八个小技巧。
例如,在一系列推理问题中,在指令中简单加入“一步一步思考”就可以让大语言模型表现地更好。
更有意思的是,大语言模型还可以回应“情绪性的信息” 。假如你要让它修改一篇未经同行审议的论文,可以在指令中加入一些短语:“深呼吸一下,这事对我的职业生涯很重要。”
林志成说,这些例子证明大语言模型对指令非常敏感。但并非所有尝试都会成功,但每次尝试都会有新的收获,并在一定程度上提升工作效率,增加乐趣。
相关论文信息:https://doi.org/10.1038/s41562-024-01847-2
山西大学智能信息处理研究所团队在图神经网络研究方面取得重要进展,相关成果5月23日发表于人工智能领域国际期刊《IEEE模式分析与机器智能学报》(IEEETransactionsonPatternAna......
原文地址:http://news.sciencenet.cn/htmlnews/2024/10/531421.shtm10月11日,科幻电影《749局》科影融合特别场在京举行。电影主创团队与科技领域相......
10月11日,甘肃省迎来了职业教育领域的一个重要里程碑——甘肃林业职业技术大学正式揭牌成立。这一历史性时刻标志着历经六十八载发展的甘肃省唯一一所林业类高等院校,正式迈入了本科教育的新阶段,开启了新的征......
”标志性科考活动获系列重大突破 “第二次青藏科考标志性科考活动守护水塔‘一原两湖三江’科考主体任务已经基本完成,这次科考从天到地、从冰到水取得了全方位的进展。”第二次青藏科考队队长、中国科学......
关于确定2024年国家环境健康管理试点名单的通知北京市、河北省、内蒙古自治区、辽宁省、黑龙江省、江苏省、浙江省、江西省、山东省、湖北省、湖南省、广东省、重庆市、四川省、贵州省、陕西省、青海省生态环境厅......
10月8日,华中农业大学果蔬园艺作物种质创新与利用全国重点实验室、药用植物资源可持续利用团队梅之南教授和杨庆勇教授课题组,发布了首个专门面向菊科植物的多组学数据库平台——AsteraceaeMulti......
实验桌上堆放着精密仪器和焊接工具,电脑上是正在运行的电路图,一页页写满了数据、画满了图样的纸张在桌面铺开,各式或大或小的电子元件前,南京邮电大学工程实验教学部创新中心副主任郝学元正在埋首研制电工电子实......
近日,记者从中国计量大学获悉,该校生命科学学院蜜蜂与蜂产品学研究团队主持的两项推荐性国家标准《GB/T44349-2024 蜂花粉总多酚的检测福林酚试剂比色法》和《GB/T44350-202......
10月10日,由广东省机械行业协会组织并主持召开的“面向软性物料的多级赋码追溯柔性包装生产线研制与应用”项目科技成果鉴定会议在广东佛山举行。经专家鉴定,该项目成果总体技术水平达到国际先进水平。记者获悉......
近日,中国热带农业科学院橡胶研究所组培与转基因团队在全球率先获得了橡胶树CRISPR/Cas9纯合基因编辑橡胶苗。相关研究成果在线发表于《经济作物和产品》(IndustrialCropsandProd......