
一名女子与中国香港SenseTime公司开发的AI机器人下围棋。
本报讯4月15日,美国斯坦福大学人工智能研究所发布《2024年人工智能指数报告》,描绘了过去10年机器学习系统的飞速发展。
报告显示,聊天机器人ChatGPT等人工智能(AI)系统在阅读理解、图像分类和竞赛级数学等任务上的表现,已接近甚至超过人类。AI系统的快速发展意味着,许多用于评估它们的通用基准和测试很快就会过时。
报告特别指出,推出评估AI的新方法越来越有必要,如评估其在抽象和推理等复杂任务上的表现。斯坦福大学社会科学家Nestor Maslej表示,10年前,基准可以为社会服务5至10年,而现在,它们往往在短短几年内就变得无关紧要了。“增长的速度快得惊人。”
斯坦福大学的年度人工智能指数于2017年首次发布。该指数由学术和行业专家编制,旨在评估AI领域的技术能力、成本、道德等,从而为研究人员、政策制定者和公众提供信息。今年这份长达400多页的报告指出,美国对与AI相关的监管正在升级。但是,由于缺乏对负责任地使用AI的标准化评估,因此很难根据系统构成的风险对它们进行比较。
新报告还首次用整个章节专门介绍AI的科学应用,包括谷歌DeepMind的一个旨在帮助化学家发现新材料的图形网络材料探索(GNoME)项目,以及DeepMind的另一个工具GraphCast,它可以进行快速天气预报。
当前的AI热潮建立在神经网络和机器学习算法之上,这可以追溯到2010年代早期。此后,这一领域迅速发展壮大。例如,代码共享平台GitHub上的AI编码项目数量从2011年的约800个增加到去年的180万个。报告称,在此期间,关于AI的期刊出版物大约增加了两倍。
AI的大部分前沿工作都在工业领域内进行。去年,该领域产生了51个著名的机器学习系统,其中学术研究人员贡献了15个。美国得克萨斯大学奥斯汀分校人工智能实验室主任Raymond Mooney表示:“学术工作正在转向分析企业推出的模型,深入研究它们的弱点。”
这包括开发更严格的测试,以评估大型语言模型(LLM)的视觉、数学甚至道德推理能力,这些能力为聊天机器人提供了动力。最新的测试之一是研究生级谷歌验证问答基准测试(GPQA),去年由包括美国纽约大学机器学习研究员David Rein在内的团队开发。
GPQA由400多个选择题组成,难度很大,博士水平的学者回答其所在领域问题的正确率为65%。而当他们试图回答其专业领域以外的问题时,尽管在测试期间可以上网,但正确率只有34%。
随着AI性能的飙升,成本也在飙升。据报道,OpenAI公司2023年3月发布的GPT-4的培训成本为7800万美元。谷歌的聊天机器人Gemini Ultra于2023年12月推出,耗资1.91亿美元。许多人担心这些系统的能源使用,以及冷却运行这些系统的数据中心所需的水量。
报告指出,在美国,监管急剧升级。2016年,美国只有一项法规提到了AI,去年则增加到25项。Maslej表示,2022年之后,政策制定者提出的AI相关法案数量大幅增加。
监管行动越来越侧重于促进负责任的AI使用。Maslej说,尽管出现了可以对AI工具的真实性、偏见等指标进行评分的基准,但并不是每个人都在使用相同的模型,这使得交叉比较变得困难。
2025年是“十四五”收官之年,也是“十五五”谋篇布局之年。党中央、国务院高度重视数字中国建设,习近平总书记多次作出重要指示批示。国家数据局会同有关单位,系统总结2025年数字中国建设的最新成果和典型......
近日,由中国科学院学部组织、会聚近300位跨学科院士专家共同研究撰写的重要学术成果——《人工智能赋能科学研究:人工智能学科体系》正式出版发行。该书作为“范式变革:人工智能与科学研究”丛书的总报告,系统......
日前,国家网信办、国家发展改革委、工业和信息化部等五部门联合公布《人工智能拟人化互动服务管理暂行办法》(以下简称《办法》),自2026年7月15日起施行。《办法》明确,拟人化互动服务提供者不得向未成年......
为推动全球共同促进人工智能治理,中国科协所属中国自动化学会、中国电子学会、中国计算机学会、中国人工智能学会等16家科技社团4月13日共同发布《全球人工智能治理科技社团倡议》,倡导以人为本、智能向善,推......
谈到对齐,你会想到什么?是一把尺子,丈量细微的偏差,还是一份共识,守护人类文明的底线?“在人工智能(AI)时代,文化创新需要对齐什么?又该向什么对齐?”3月22日,武夷山的九曲溪畔,在由中国人民大学、......
3月25日,美国总统特朗普公布了总统科学与技术顾问委员会(PCAST)首批成员名单。与往届不同的是,此次任命高度聚焦人工智能(AI)和量子计算领域,成员以科技巨头、商界富豪与政治盟友为主,学术背景科学......
3月17日,由中国检验检测学会与廊坊市科学技术协会共同主办、河北省算力产业研究院承办的“钢铁行业人工智能技术应用培训”在廊坊市京津冀大数据创新应用中心成功举办。作为“科创中国”河北行“提升河北智能检验......
全国政协委员、中国医学科学院阜外医院麻醉中心主任医师敖虎山建议,加强顶层设计,系统化推动融合人工智能、大数据与医疗专业知识的“数字医生”与传统医疗体系实现规模化深度融合,将其作为破解当前医疗服务难题的......
工业和信息化部10日对外发布《关于启动工业数据筑基行动开展面向人工智能赋能的高质量行业数据集建设先行先试的通知》,着力突破工业数据“采”“集”“用”瓶颈。通知提出,到2026年底,培育一批行业数据合作......
近来,在全球人工智能竞争升级的背景下,我国在人工智能人才供给、政策动员与平台化组织等方面取得令人瞩目的阶段性进展。一方面,我国人工智能人才规模与结构优势初步确立。我国人工智能核心产业人才规模2024年......