近日一项发表于《公共科学图书馆-综合》的研究发现94%的使用ChatGPT创建的大学考试答案,不会被检测出是由人工智能(AI)生成的,而且这些答案的得分往往比真实学生的更高。
如今,人工智能(AI)技术的兴起和发展,如ChatGPT的诞生,对教育部门提出了一个根本性问题,即学校许多形式的评估,都是在没有监考的情况下完成的,学生可能利用AI回答评估问题。尤其新冠疫情以来,对无监督的在家考试的依赖越发严重。如果学生使用AI作弊未被发现,那么这对整个评估方式都是个威胁。
为此,英国雷丁大学的Peter Scarfe和同事使用ChatGPT创建了雷丁大学心理学本科生学位5个模块共63个评估问题的答案。由于学生们是在家里参加这些考试的,所以他们可以查看笔记和参考资料,甚至可能违反规定,使用AI帮助答题。
AI生成的答案和真实学生的答案一起被提交筛查,其中前者平均占总答案数的5%。负责筛查并标记的人并不知道他们检查的答案中有来自33名假学生的。这些学生的名字也是由ChatGPT生成的。
在所有模块问题的答案中,只有6%的AI生成答案被标记为可能不是学生自己的答案。而有一些非AI生成的模块问题的答案则被标记存疑。
“尽管各模块之间存在一些差异,但平均而言,AI生成的答案得分比真实学生的更高。AI提交的材料中,得分超过学生的概率为83.4%。”Scarfe说,“但当前AI还难以进行更抽象的推理和信息集成。”
研究人员表示,他们的工作是迄今同类研究中规模最大、最有力的。尽管他们只研究了雷丁大学心理学本科学位的问题,但Scarfe认为这是值得整个学术界关注的问题。
“难保其他学科领域不会有同样的问题存在。”Scarfe说,然而从源头上解决这一问题几乎是不可能的。因此,必须重新考虑评估内容。
相关论文信息:https://doi.org/10.1371/journal.pone.0305354
山西大学智能信息处理研究所团队在图神经网络研究方面取得重要进展,相关成果5月23日发表于人工智能领域国际期刊《IEEE模式分析与机器智能学报》(IEEETransactionsonPatternAna......
原文地址:http://news.sciencenet.cn/htmlnews/2024/10/531421.shtm10月11日,科幻电影《749局》科影融合特别场在京举行。电影主创团队与科技领域相......
10月11日,甘肃省迎来了职业教育领域的一个重要里程碑——甘肃林业职业技术大学正式揭牌成立。这一历史性时刻标志着历经六十八载发展的甘肃省唯一一所林业类高等院校,正式迈入了本科教育的新阶段,开启了新的征......
”标志性科考活动获系列重大突破 “第二次青藏科考标志性科考活动守护水塔‘一原两湖三江’科考主体任务已经基本完成,这次科考从天到地、从冰到水取得了全方位的进展。”第二次青藏科考队队长、中国科学......
关于确定2024年国家环境健康管理试点名单的通知北京市、河北省、内蒙古自治区、辽宁省、黑龙江省、江苏省、浙江省、江西省、山东省、湖北省、湖南省、广东省、重庆市、四川省、贵州省、陕西省、青海省生态环境厅......
10月8日,华中农业大学果蔬园艺作物种质创新与利用全国重点实验室、药用植物资源可持续利用团队梅之南教授和杨庆勇教授课题组,发布了首个专门面向菊科植物的多组学数据库平台——AsteraceaeMulti......
实验桌上堆放着精密仪器和焊接工具,电脑上是正在运行的电路图,一页页写满了数据、画满了图样的纸张在桌面铺开,各式或大或小的电子元件前,南京邮电大学工程实验教学部创新中心副主任郝学元正在埋首研制电工电子实......
近日,记者从中国计量大学获悉,该校生命科学学院蜜蜂与蜂产品学研究团队主持的两项推荐性国家标准《GB/T44349-2024 蜂花粉总多酚的检测福林酚试剂比色法》和《GB/T44350-202......
10月10日,由广东省机械行业协会组织并主持召开的“面向软性物料的多级赋码追溯柔性包装生产线研制与应用”项目科技成果鉴定会议在广东佛山举行。经专家鉴定,该项目成果总体技术水平达到国际先进水平。记者获悉......
近日,中国热带农业科学院橡胶研究所组培与转基因团队在全球率先获得了橡胶树CRISPR/Cas9纯合基因编辑橡胶苗。相关研究成果在线发表于《经济作物和产品》(IndustrialCropsandProd......