- 生成式人工智能的近亲繁殖会降低多样性,影响创造力,并增加人工智能生成内容中的偏见。.
- 使用同质数据集训练的人工智能系统可能产生吸引力较低、可信度较低的输出结果。.
- 为了降低风险,人工智能开发中多样化的数据集和透明措施至关重要。.
随着人工智能 (AI) 的发展,其进步日新月异,生成式 AI 系统中所谓的“近亲繁殖”风险也日益凸显,而这种风险长期以来在人类和家养动物群体中十分普遍。.
本文将从生成式人工智能的角度阐述近亲繁殖的概念,以及近亲繁殖与人工智能生成内容的未来发展之间的关系。.
理解生成式人工智能的内生性:大型语言模型(LLM)等生成式人工智能系统主要基于网络上丰富的文本、图像和音频内容数据集进行训练。最初,该数据集主要包含人类创作的内容,例如文学作品、文章和艺术作品。然而,随着生成式人工智能工具的兴起,互联网上越来越多的内容是由人工智能自身生成的。.
这种转变引发了人们对未来人工智能系统训练所用数据集的质量和多样性的担忧。随着人工智能生成内容的不断发展,预计未来许多代人工智能模型将从并非代表人类内容而是人工智能生成的素材的数据集中学习。.
人工智能近亲繁殖的后果是多方面的。.
相反,人工智能系统不断从越来越多的同质数据集中学习,可能会导致人工智能生成的输出的创造性和原创性下降。.
如果这个过程不断重复——也就是从副本复制——一代又一代地进行下去,产出的质量就会被稀释,最终的作品可能会变得缺乏吸引力,也可能无法真正反映我们所理解的人类创造力。随着基于同源数据集训练的AI生成内容的日益增多,这些问题可能会更加严重。.
如果训练数据集不够多样化,那么开发的AI系统只会强化并放大AI生成内容中存在的偏见,从而进一步削弱AI生成内容作为信息来源的可信度。此外,训练数据缺乏多样性可能会限制开发能够正确理解和呈现各种人类经验和观点的AI系统的可能性。这可能会限制AI在不同应用领域的发展,例如自然语言处理、内容生成和决策系统。.
应对生成式人工智能近亲繁殖的挑战
最重要的是,这确实是一个风险,尤其是生成式人工智能技术的近亲繁殖。因此,研究人员、开发人员乃至政策制定者都有责任采取积极行动,确保在人工智能系统训练过程中优先使用多样化和具有代表性的数据集,整合能够检测和减少人工智能生成内容中偏差的机制,并确保有效的跨学科合作,同时解决和确保人工智能构建过程中涉及的伦理和社会影响得到妥善处理。.
他们应进一步促进人工智能系统部署过程中的开放性和问责制,并要求与人工智能生成内容的用户分享其局限性和偏见方面的认知。因此,所有利益相关者都可以积极寻求合作,在利用生成式人工智能的力量的同时,降低人工智能开发中近亲繁殖带来的风险。.
生成式人工智能中的“近亲繁殖”概念是人工智能系统开发和部署面临的一项重大挑战。理解其影响并找到有效改进生成式人工智能“近亲繁殖”的方法,将有助于确保以负责任和合乎伦理的方式开发技术,从而造福社会。.
最顶尖的加密货币专家都在阅读我们的简报。想 加入他们?
学速成课程
- 哪些加密货币可以让你赚钱
- 如何通过钱包提升安全性(以及哪些钱包真正值得使用)
- 专业人士使用的鲜为人知的投资策略
- 如何开始投资加密货币(使用哪些交易所、购买哪种加密货币最划算等)
















