AI는 있으며 어휘에서 미묘한 힌트를 찾을 수 있습니까? NYU Tandon School of Engineering의 연구원들은 논문에서 언급된 것처럼 The New York Times의 사람들이 가장 많이 수행하는 활동(일일 연결 퍼즐에 참여)을 보고 놀라지 않습니다.
AI 언어 모델 평가
조사 결과, 다가오는 IEEE 2024 밀라노 컨퍼런스에서 게임 연구 및 이용 가능한 공통 지식 공유에 관한 논란의 여지가 있는 질문이 드러났습니다. 현대 자연어 처리(NLP) 기술로 언어 기반 퍼즐을 풀 수 있습니까?
CSE 조교수이자 NYU Tandon의 게임 혁신 연구소 소장인 Julian Togelius와 함께 팀은 기계 학습과 고급 표현 학습이라는 두 가지 AI 방법에 중점을 두었습니다. OpenAI의 감각을 갖춘 뛰어난 언어 모델인 첫 번째 활용 GPT-3.5와 마지막 릴리스 GPT-4
다음 메커니즘은 문장 임베딩 모델, 특히 BERT, RoBERTa, MPNet 및 MiniLM에 의존합니다. 이러한 모델은 의미론적 데이터를 벡터 표현으로 나타내지만 LLM의 전체 언어 이해 및 생성 기술이 부족합니다.
그러나 모든 AI 기계가 Connections와 관련된 일부 작업을 수행할 수 있지만 그 과제는 거의 극복할 수 없다는 결론이 내려졌습니다. 임베딩 방식, GPT-3 등 눈에 띄는 성과를 포함해 이전 카테고리의 다른 것보다 나은 경향이 있다.
여기서 중요한 발견 중 하나는 모델이 퍼즐 난이도를 "단순함"에서 "도전적"으로 빠르게 분류하는 인간 능력과 매우 밀접한 연관성을 보여준다는 것입니다. LLM은 더 자주 사용되고 있으며 연결 문제와 관련하여 어떤 맥락에서 실패하는지 면밀히 조사하면 자연어의 의미론적 처리에 대한 일반적인 제한이 드러날 수 있다고 Ph.D. Graham Todd가 덧붙였습니다. 연구의 주 저자인 Game Innovation Lab dent 학생
GPT-4로 한계를 뛰어넘다
연구원들은 GPT-4에게 단편적인 접근 방식을 통해 퍼즐을 풀도록 요청하면 특히 퍼즐의 정확도가 39%를 조금 넘는 정확도로 퍼즐 해결 능력이 크게 향상되는 것을 관찰했습니다.
이전 연구에서 보여주듯이 '사고 유도 연쇄'가 무엇에 좋은지에 대한 또 하나의 증거는 Timothy Merino 박사가 말한 대로 어휘의 구조화된 사고로 이어진다는 것입니다. Game Innovation Lab의 학부 대학생dent 이trac의 저자 중 한 명입니다. 언어 모델이 작업을 수행하고 작업을 더 잘 마무리하는 문제는 자신이 수행하는 각 작업에 대해 생각하게 함으로써 잘 해결됩니다. 연구원들은 2023년 6월 12일부터 2024년 2월 16일까지 일일 퍼즐을 나타내는 250개의 퍼즐이 포함된 온라인 퍼즐 아카이브를 사용했습니다.
키 차이 와이어 : 비밀 도구 암호화 프로젝트는 미디어 커버리지를 보장하는 데 사용됩니다.