雷丁大学的研究人员进行了一项有趣的研究,他们让人工智能生成答案参加考试。结果令人惊讶地好于dent学生的答案,教授们甚至无法区分人工智能的答案和人类的答案。.
研究人员创建了33个虚假的学生dentdent并提交了未经编辑的AI生成的答案。这些答案是借助ChatGPT-4dent,用于本科生在线心理测试评估。研究人员提交了63道简答题和论述题的AI答案,而批改试卷的教授对此研究毫不知情。.
各院校不会再恢复手写考试了。
这些不知情的大学教授只dent出33份考试答卷中的一份是人工智能代写的。与此同时,其余32份答卷却未被发现,并且获得了比真实dent更高的分数。实际上,83%的人工智能代写答卷的分数都高于人类dent的答卷。.
另请阅读: 中国教育人工智能应用在美国市场获得成功
这项 研究 由埃蒂安·罗施教授和彼得·斯卡夫副教授领导。斯卡夫表示,他们的研究表明,这项研究对于学术评估的公正性以及人工智能将如何影响学术评估具有国际重要意义。他说:
“我们不一定会完全恢复手写考试——但面对人工智能,全球教育行业需要做出改变。”
斯卡夫提到,大多数机构已经摒弃了传统的评估程序,以确保评估的公平性。两位教授都强调,他们的研究成果是对教育工作者的“警钟”。
人工智能作文的检出率较低
研究人员发现,人工智能生成的论文几乎无法检测,因为其中94%的论文并未引起校对人员的注意。发表该研究的《公共科学图书馆·综合》(PLOS ONE)期刊指出,较低的检测率可能被高估了。该期刊表示:
“尤其令人担忧的是,人工智能提交的作业获得的分数普遍高于学生真实dent 的作业。”
该期刊还指出,dent可以利用人工智能作弊而不被发现。他们甚至可能比未使用人工智能的诚实学生获得更高的分数。在这项研究中,研究人员使用虚假dent提交了人工智能生成的答案,涵盖一至三年级的课程模块。结果显示,人工智能在第一和第二门课程模块中的dent优于人类学生。.
然而,人类在三年级的考试中得分更高。研究人员表示,这与人工智能不擅长“trac推理”的观点相符,至少就目前而言是如此。.
人工智能仍然缺乏推理能力。
该研究还指出,人工智能的推理能力会随着时间的推移而增强,而其可检测性则会降低。这将使维护学术诚信变得更加困难。研究人员表示,这项研究可能会导致居家考试或无人监考考试的终结。.
罗施教授表示,教育界需要就dent如何在学习中使用人工智能达成共识。他强调,在其他领域使用人工智能也同样重要,这有助于维护社会信任。.
另请阅读: 科技解决方案涌现,助力应对高等教育招生断崖
雷丁大学主管教育的副校长伊丽莎白·麦克鲁姆教授表示,该校正在限制居家考试。她还表示,学校正在努力开发其他考试方式,要求学生将知识应用于实际情境中,“通常是与工作场所相关的场景”。
麦克鲁姆教授澄清说,dent将被允许在某些评估中使用人工智能,以便他们了解如何合乎伦理地使用人工智能。然而,其他作业则不需要使用人工智能工具。教授表示,这将有助于提高dent的人工智能素养,并使他们为现代职场的要求做好准备。.
Cryptopolitan 报道,作者:Aamir Sheikh

