在一项突破性研究中,研究人员揭示了人类创造力与人工智能(AI)之间引人入胜的互动关系。虽然人工智能聊天机器人,尤其是ChatGPT4,展现出了卓越的创造力,但它们的表现并未始终优于最具创造力的人类参与者。相反,人类展现出了更广泛的创造潜力,这可能与执行功能和认知过程的差异有关。.
传统上,创造力被视为人类独有的特质,根植于想象力、洞察力和将看似无关的概念联系起来的能力等复杂的认知过程。然而,随着人工智能机器拥有创造能力,其成果足以媲美甚至超越人类,这一点已变得越来越明显dent
该研究的作者、卑尔根大学副教授西蒙·格拉西尼强调了当前人工智能和机器智能时代的变革性本质。他强调,需要持续研究人们如何看待机器以及机器在多大程度上能够模仿人类的能力。.
利用替代用途任务评估创造力
研究人员采用“替代用途任务”(AUT)进行研究,该任务是一种广受认可的创造力评估方法。在该任务中,人类参与者和人工智能聊天机器人均需为绳子、盒子、铅笔和蜡烛等常见物品想出独特且富有创意的用途。人类参与者有30秒的时间尽可能多地想出创意,而聊天机器人则被要求用1-3个词分别提出特定数量的想法。每个聊天机器人均接受了11次测试。.
该研究使用了三个人工智能聊天机器人:ChatGPT3、ChatGPT4 和 Copy.Ai,以及来自在线平台 Prolific 的 256 名人类参与者。所有人类参与者均为英语母语者,平均年龄为 30.4 岁,年龄范围为 19 至 40 岁。.
评估创造力的两种方法
研究人员采用了两种不同的方法来评估人类和人工智能聊天机器人的创造力。语义距离评分:这种自动化方法通过测量回复与常见或预期用途的差异程度来衡量回复的原创性。.
创造力的主观评价:六位人类评价员在不知道哪些回复是由人工智能生成的的情况下,根据 5 分制对想法的创造力进行了评价。.
人工智能聊天机器人在创造力评估方面表现出色
研究结果表明,人工智能聊天机器人,尤其是 ChatGPT3 和 ChatGPT4,在语义距离得分方面始终高于人类。这表明它们产生的回复比人类参与者的回复更具原创性,也更不落俗套。此外,人类评分者也认为人工智能聊天机器人,特别是 ChatGPT4,平均而言比人类参与者更具创造力。.
然而,值得注意的是,虽然人工智能聊天机器人表现出色,但它们并非始终优于最具创造力的人类参与者。在某些情况下,人类参与者中极富创造力的人能够与人工智能在生成新颖且富有想象力的回复方面相媲美。.
格拉西尼强调,不应过分高估人工智能在这项特定创造性任务中的成功对现实世界中涉及创造力的复杂工作的影响。他设想,未来人工智能聊天机器人将协助人类从事创造性工作,而不是完全取代他们。.
在众多人工智能聊天机器人中,ChatGPT4 在主观评分方面脱颖而出,展现出最强的创造力。尽管在使用语义距离算法进行评估时,它的表现并非始终优于其他人工智能模型,但它在人类评分者那里却始终获得更高的创造力评分。.
局限性和未来方向
这项研究的发现仅限于一种类型的创造性行为,可能并不适用于创造力这一复杂现象的普遍情况。此外,由于聊天机器人内部流程的不透明性,比较人类和聊天机器人在流程层面的创造力仍然具有挑战性。.
格拉西尼指出,聊天机器人展现创造力的方式可能与人类不同,它们可能依赖于记忆中的答案,而非产生创造性想法的能力。鉴于这些模型的架构,我们仍然无法完全理解它们的创造过程。.
人工智能聊天机器人