“思维导图”提示辅助人工智能解决词汇难题

经过

布莱恩·库姆

阅读时长：2分钟 2024年5月10日

尽管人工智能模型具备一定的能力，但它们在处理复杂的语言难题时仍然感到吃力。
“思维链”提示将 GPT-4 的解谜准确率提高到 39%。
该研究探索了使用 GPT-4 创建新颖的语言谜题。

人工智能是否拥有与人类相同的技能，它们能否从词汇中发现细微的线索？纽约大学坦顿工程学院的研究人员对《纽约时报》每日谜题“Connections”位列人类活动榜首并不感到惊讶，正如论文中所述。

评估人工智能语言模型

调查揭示了一个在即将举行的 IEEE 2024 米兰游戏研究和共享可用及共同知识会议上引发争议的问题：现代自然语言处理 (NLP) 技术是否有可能解决基于语言的难题？

该团队与纽约大学坦顿工程学院计算机科学与工程系助理教授兼游戏创新实验室主任朱利安·托格利乌斯（Julian Togelius）合作，重点研究了两种人工智能方法——机器学习和高级表征学习。前者利用了GPT-3.5，后者则利用了OpenAI最新发布的GPT-4，后者是OpenAI旗下卓越的语言模型，拥有开放领域和类人语言能力。

下一种机制依赖于句子嵌入模型，特别是 BERT、RoBERTa、MPNet 和 MiniLM。这些模型将语义数据表示为向量形式，但缺乏 LLM 所具备的完整的语言理解和生成能力。

然而，结论是，尽管所有人工智能机器都能执行“连接”中涉及的部分任务，但挑战仍然几乎无法克服。它往往优于早期类别中的其他方法，包括嵌入方法和 GPT-3 等显著成果。

该研究的关键发现之一是，这些模型与人类快速将谜题难度从“简单”到“挑战”进行分类的能力密切相关。。dent 游戏创新实验室的博士生、该研究的第一作者格雷厄姆·托德补充说，逻辑逻辑模型（LLM）的使用越来越频繁，仔细研究它们在哪些情况下无法解决“连接”问题，可以揭示自然语言语义处理方面的局限性

利用 GPT-4 拓展边界

研究人员观察到，让 GPT-4 通过分步方法解决谜题大大提高了解决谜题的能力，尤其是谜题的准确率达到了 39% 以上。

正如先前的研究表明（我们的研究也证实了这一点），“思维链提示”的优势在于能够促进词汇的结构化思维，正如游戏创新实验室的dent 、本trac作者之一蒂莫西·梅里诺博士所言。通过让语言模型思考它们正在进行的工作，可以很好地解决语言模型执行任务和完成任务的问题。研究人员使用了一个包含250个拼图的在线拼图库，这些拼图代表了2023年6月12日至2024年2月16日期间的每日拼图。

如果你正在阅读这篇文章，你已经领先一步了。订阅我们的新闻简报，继续保持领先优势。

分享这篇文章

免责声明：本页面提供的信息并非交易建议。Cryptopolitan.com对任何基于本页面信息进行的投资概不负责。我们tron您在做出任何投资决定前进行独立dent /或咨询合格的专业人士。Cryptopolitan研究

布莱恩·库姆

Brian Koome在区块链和加密货币报道领域拥有超过七年的经验，自2017年以来一直活跃于该行业。他曾为包括BlockToday.com在内的多家知名媒体撰稿。此外，在加入 Cryptopolitan 担任全职撰稿人之前，他还为BitDegree.org开发了 Ethereum 101课程。Brian的文章涵盖常青指南、深度分析、访谈和价格分析。他对 DeFi、区块链创新和新兴加密项目的关注深受读者喜爱。.

1. 评估人工智能语言模型

2. 利用 GPT-4 拓展边界

分享这篇文章