发布时间:2024-04-17 07:29 原文链接: 人工智能在多项任务中击败人类


一名女子与中国香港SenseTime公司开发的AI机器人下围棋。图片来源:Joan Cros/NurPhoto

本报讯4月15日,美国斯坦福大学人工智能研究所发布《2024年人工智能指数报告》,描绘了过去10年机器学习系统的飞速发展。

报告显示,聊天机器人ChatGPT等人工智能(AI)系统在阅读理解、图像分类和竞赛级数学等任务上的表现,已接近甚至超过人类。AI系统的快速发展意味着,许多用于评估它们的通用基准和测试很快就会过时。

报告特别指出,推出评估AI的新方法越来越有必要,如评估其在抽象和推理等复杂任务上的表现。斯坦福大学社会科学家Nestor Maslej表示,10年前,基准可以为社会服务5至10年,而现在,它们往往在短短几年内就变得无关紧要了。“增长的速度快得惊人。”

斯坦福大学的年度人工智能指数于2017年首次发布。该指数由学术和行业专家编制,旨在评估AI领域的技术能力、成本、道德等,从而为研究人员、政策制定者和公众提供信息。今年这份长达400多页的报告指出,美国对与AI相关的监管正在升级。但是,由于缺乏对负责任地使用AI的标准化评估,因此很难根据系统构成的风险对它们进行比较。

新报告还首次用整个章节专门介绍AI的科学应用,包括谷歌DeepMind的一个旨在帮助化学家发现新材料的图形网络材料探索(GNoME)项目,以及DeepMind的另一个工具GraphCast,它可以进行快速天气预报。

当前的AI热潮建立在神经网络和机器学习算法之上,这可以追溯到2010年代早期。此后,这一领域迅速发展壮大。例如,代码共享平台GitHub上的AI编码项目数量从2011年的约800个增加到去年的180万个。报告称,在此期间,关于AI的期刊出版物大约增加了两倍。

AI的大部分前沿工作都在工业领域内进行。去年,该领域产生了51个著名的机器学习系统,其中学术研究人员贡献了15个。美国得克萨斯大学奥斯汀分校人工智能实验室主任Raymond Mooney表示:“学术工作正在转向分析企业推出的模型,深入研究它们的弱点。”

这包括开发更严格的测试,以评估大型语言模型(LLM)的视觉、数学甚至道德推理能力,这些能力为聊天机器人提供了动力。最新的测试之一是研究生级谷歌验证问答基准测试(GPQA),去年由包括美国纽约大学机器学习研究员David Rein在内的团队开发。

GPQA由400多个选择题组成,难度很大,博士水平的学者回答其所在领域问题的正确率为65%。而当他们试图回答其专业领域以外的问题时,尽管在测试期间可以上网,但正确率只有34%。

随着AI性能的飙升,成本也在飙升。据报道,OpenAI公司2023年3月发布的GPT-4的培训成本为7800万美元。谷歌的聊天机器人Gemini Ultra于2023年12月推出,耗资1.91亿美元。许多人担心这些系统的能源使用,以及冷却运行这些系统的数据中心所需的水量。

报告指出,在美国,监管急剧升级。2016年,美国只有一项法规提到了AI,去年则增加到25项。Maslej表示,2022年之后,政策制定者提出的AI相关法案数量大幅增加。

监管行动越来越侧重于促进负责任的AI使用。Maslej说,尽管出现了可以对AI工具的真实性、偏见等指标进行评分的基准,但并不是每个人都在使用相同的模型,这使得交叉比较变得困难。(李木子)

相关文章

人工智能在多项任务中击败人类

一名女子与中国香港SenseTime公司开发的AI机器人下围棋。图片来源:JoanCros/NurPhoto本报讯4月15日,美国斯坦福大学人工智能研究所发布《2024年人工智能指数报告》,描绘了过去......

美国斯坦福大学任命新校长

中新社旧金山4月4日电美国斯坦福大学董事会当地时间4日宣布,任命该校商学院院长、经济学家乔纳森·莱文为新任校长,于8月1日上任。斯坦福大学官网4日发布的消息显示,莱文生于1972年,本科就读于斯坦福大......

突发!因学术不端,斯坦福大学校长被迫辞职

导读本周三,Tessier-Lavigne宣布将于下个月辞去斯坦福大学校长的职务。2022年11月29日,TheStanfordDaily发表的一篇头条新闻,引起了国内外人士的广泛关注,斯坦福大学校长......

11篇论文涉嫌造假,斯坦福大学校长正接受调查

斯坦福大学校长恐怕要栽在《斯坦福日报》手里了。当地时间11月29日,《斯坦福日报》发表报道称,神经生物学家、斯坦福大学校长MarcTessier-Lavigne在多年前的多篇研究论文涉嫌图片作假,正接......

马斯克传唤母校斯坦福大学被迫牵扯进推特收购案

北京时间9月2日消息,当地时间周三,埃隆·马斯克(ElonMusk)的法律团队向斯坦福大学发出了传票,以作为他与推特公司就其放弃440亿美元收购所进行的法律斗争的一部分。马斯克的律师亚历克斯·斯皮罗(......

斯坦福名教授回应质疑:水能自发生成双氧水!

水滴能自发产生双氧水?美国斯坦福大学前化学系系主任RichardN.Zare在最近发表的论文中,证明了这一神奇的现象。Zare的来头不小。他29岁就当上哥伦比亚大学教授,37岁当选美国科学院院士、美国......

又一名斯坦福大学华人学者遭难,美国换总统不换政策!

据路透社华盛顿2月19日报道,美国司法部近日扩大1月的一份起诉内容,指控斯坦福大学研究员SongChen(音)签证欺诈、阻挠司法、毁灭文件和虚假陈述,隐瞒其军人身份。起诉书称宋自称研究脑部疾病的神经科......

斯坦福大学借助PacBio首次临床全基因组测序

在RickyRamon7岁时进行一次例行检查中,犹豫不决的儿科医生送他去拍一张胸部X光片,结果显示在他心脏左上腔里有一个良性肿瘤。对于Ramon来说,这是长达二十年的痛苦而漫长的就医史的开始——伴随他......

诺贝尔奖得主Cell揭示重要的“垃圾”DNA

来自斯坦福大学、犹他大学和清华大学等处的研究人员,发现了一类丰富的非编码DNA可以防止线虫生殖细胞中随机的基因沉默。他们的研究论文发布在6月30日的《细胞》(Cell)杂志上。美国著名遗传学和分子生物......

原美国科学理事会主席建言我国现代大学制度建设

近日,美国科学理事会原主席查德.N.查尔(RichardN.Zare)教授造访湖南大学,以湖南大学校长特别顾问的名义,就现代大学制度建设的若干深层次问题与该校校长赵跃宇教授进行了一番畅谈。查尔教授系国......