AI의 환상을 길들이다: 갈릴레오 랩의 더 안전하고 신뢰할 수 있는 AI를 위한 새로운 측정 기준

에 의해

존 팔머

읽는 데 4분 소요 , 2023년 11월 22일

갈릴레오 랩의 측정 지표는 AI의 오류 현상을 해결하여 AI의 신뢰성과 안전성을 향상시킵니다.
혁신적인 측정 지표는 AI 성능 및 상황별 평가에 대한 미묘한 통찰력을 제공합니다.
효율적인 탐지 방법론은 개발자들이 더욱 안전한 AI 애플리케이션을 개발할 수 있도록 지원합니다.

인공지능(AI)이 빠르게 발전함에 따라, AI의 한계와 윤리적 함의에 대한 우려가 커지고 있습니다. 특히, AI 시스템이 입력된 정보와 다르거나, 관련성이 없거나, 근거 없는 정보를 생성하는 현상인 'AI 환각'이 새로운 과제로 떠오르고 있습니다. 이러한 우려에 대응하여, 갈릴레오 랩스는 AI 환각을 정량화하고 완화하는 데 목표를 둔 혁신적인 지표를 개발했습니다. 이 지표는 대규모 언어 모델(LLM) 및 기타 AI 시스템의 신뢰성과 안전성을 향상시키는 데 유망한 방안을 제시합니다.

인공지능 환각의 증가

인공지능 기술, 특히 대규모 언어 모델(LLM)은 자연어 처리 및 생성 분야에서 상당한 발전을 이루었습니다. 그러나 이러한 발전에는 단점도 따릅니다. ChatGPT를 비롯한 일부 인공지능 시스템은 때때로 권위 있어 보이지만 근본적으로 잘못된 답변을 내놓는데, 이를 흔히 "환각"이라고 부릅니다. 인공지능이 다양한 응용 분야에서 핵심적인 역할을 하는 시대에 인공지능의 환각을 인식하는 것은 점점 더 중요해지고 있습니다.

2023년 케임브리지 사전은 '환각을 경험하다'를 올해의 단어로 선정하며 이 문제 해결의 중요성을 강조했습니다. 현재 연구자들과 업계 관계자들은 이러한 환각을 효과적으로 감지하고 완화하기 위한 알고리즘과 도구를 적극적으로 개발하고 있습니다.

갈릴레오 랩의 환각 지수를 소개합니다

AI 환각 문제를 해결하려는 노력에 주목할 만한 기업 중 하나는 갈릴레오 랩스(Galileo Labs)로, '환각 지수(Hallucination Index)'라는 획기적인 지표를 도입했습니다. 이 지수는 인기 있는 LLM(Life Life Management) 프로그램들이 환각을 유발할 가능성을 평가하는 도구로 사용됩니다.

갈릴레오 랩의 분석은 흥미로운 통찰을 제공합니다. 최고의 성능을 자랑하는 OpenAI GPT-4와 같은 고급 모델조차도 기본적인 질문과 답변(Q&A) 작업을 처리할 때 약 23%의 확률로 오답을 내는 것으로 나타났습니다. 일부 모델은 이보다 훨씬 더 심각한 60%의 오답 발생률을 보이기도 합니다. 그러나 이러한 통계를 제대로 이해하려면 사용된 미묘한 차이와 새로운 측정 지표를 자세히 살펴볼 필요가 있습니다.

환각 측정에 대한 미묘한 접근 방식

갈릴레오 랩스는 환각을 사실과 다르거나, 관련성이 없거나, 입력에 근거하지 않은 정보 또는 데이터의 생성으로 defi합니다. 중요한 것은 환각의 특성이 작업 유형에 따라 달라질 수 있다는 점이며, 이는 AI 시스템 평가에 있어 작업별 접근 방식이 필요함을 시사합니다.

예를 들어, 맥락이 매우 중요한 질의응답 시나리오에서 LLM(언어 학습 모델)은 관련 맥락을 검색하고 그 맥락에 기반한 답변을 제공해야 합니다. 성능 향상을 위해 검색 증강 생성(RAG)과 같은 기술은 맥락적으로 관련된 정보를 LLM에 제공합니다. 놀랍게도 GPT-4의 성능은 RAG를 사용했을 때 오히려 약간 저하되는데, 이는 환각 현상을 효과적으로 처리하는 것이 얼마나 복잡한지를 보여줍니다.

반면, 장문 텍스트 생성과 같은 작업에서는 LLM 응답의 사실성을 평가하는 것이 필수적입니다. 여기서는 "정확도"라는 새로운 측정 기준을 사용하여 특정 문서나 맥락과 관련 없는 응답의 사실 오류를dent.

환각 발생 경향에 영향을 미치는 주요 요인

갈릴레오 랩스는 LLM 환자의 환각 발생 경향에 영향을 미치는 몇 가지 핵심 요소를dent. 이러한 요소에는 다음이 포함됩니다

1. 과제 유형: 과제의 성격, 즉 특정 분야에 특화된 과제인지 일반적인 과제인지에 따라 환각이 나타나는 방식이 달라집니다. 회사 문서를 참조하여 질문에 답하는 것과 같은 특정 분야 관련 질문의 경우, LLM이 필요한 맥락을 검색하고 활용하는 능력이 매우 중요합니다.

2. LLM 크기: LLM 학습에 사용된 매개변수 개수는 성능에 영향을 미칠 수 있습니다. 크기가 클수록 항상 좋다는 통념과는 달리, 이 요소는 최적의 모델 크기를 찾는 것이 중요하다는 점을 강조합니다.

3. 컨텍스트 창: RAG를 사용하여 컨텍스트를 강화하는 시나리오에서는 LLM의 컨텍스트 창과 한계가 중요해집니다. 최근 연구에서 강조된 바와 같이, 제공된 텍스트의 중간에서 정보를 추출하는 LLM의 능력은 환각 발생 가능성에 영향을 미칠 수 있습니다.

ChainPoll: 비용 효율적인 환각 탐지 방법론

갈릴레오 랩스는 환각 탐지 과정을 간소화하기 위해 새로운 환각 탐지 방법론인 체인폴(ChainPoll)을 개발했습니다. 체인폴은 사고 비용 기반의 프롬프트 엔지니어링 접근 방식을 활용하여 AI 모델이 정확하고matic 설명을 도출할 수 있도록 합니다. 이러한 접근 방식은 환각이 발생하는 이유를 이해하는 데 도움을 주어 더욱 설명 가능한 AI를 구현할 수 있도록 합니다.

Galileo Labs는 ChainPoll이 기존의 오류 감지 기술보다 약 20배 더 비용 효율적이라고 주장합니다. ChainPoll은 특히 채팅, 요약, 생성과 같은 일반적인 작업 유형에서 RAG 사용 여부와 관계없이 AI 출력 품질을 평가하는 데 비용 효율적이고 효과적인 방법을 제공합니다. 더욱이, 이러한 평가 지표는 인간의 피드백과tron상관관계를 보입니다.

더욱 안전하고 신뢰할 수 있는 AI를 향하여

갈릴레오 랩의 측정 지표는 AI의 착각을 해결하는 데 있어 상당한 진전을 보여주지만, 여전히 개선의 여지가 있습니다. 인간의 피드백과 85%의 상관관계를 달성한 것은 훌륭하지만, 더 발전시킬 필요가 있습니다. 또한, 텍스트, 코드, 이미지, 소리, 비디오 등 다양한 데이터 유형을 처리할 수 있는 멀티모달 학습 모델(LLM)에 맞춰 측정 지표를 조정해야 할 것입니다.

그럼에도 불구하고, 이러한 지표들은 LLM 애플리케이션을 개발하는 팀에게 매우 유용한 도구를 제공합니다. 개발 및 운영 모니터링 과정에서 지속적인 피드백을 제공하여 주의가 필요한 입력 및 출력을dent하게 파악할 수 있도록 해줍니다. 결과적으로, 안정적이고 안전한 LLM 애플리케이션을 출시하는 데 필요한 개발 시간을 단축할 수 있습니다.

갈릴레오 랩의 혁신적인 측정 지표와 방법론은 인공지능(AI)의 오작동 문제 해결에 유망한 솔루션을 제공합니다. AI 기술이 지속적으로 발전함에 따라 AI 출력의 신뢰성과 정확성 확보가 무엇보다 중요해지고 있습니다. 해결해야 할 과제가 남아 있지만, 오작동 지수(Hallucination Index)와 체인폴(ChainPoll)과 같은 도구는 개발자와 기업이 AI의 잠재력을 더욱 안전하고 책임감 있게 활용할 수 있도록 지원합니다.

인공지능의 허상을 인식하는 것은 인간의 텍스트 모방을 넘어 인공지능의 역량을 발전시키는 데 필수적인 단계입니다. 인공지능 시스템이 새로운 물리학과 같은 새로운 영역을 탐구하고자 하는 만큼, 안전성, 정확성, 그리고 윤리적인 인공지능 배포를 보장하기 위한 혁신적인 접근 방식이 필요합니다. 갈릴레오 랩의 이러한 노력은 인공지능의 한계를 뛰어넘는 동시에 그 진정성과 신뢰성을 유지하려는 업계의 의지를 보여줍니다.

암호화폐 뉴스를 단순히 읽는 데 그치지 마세요. 이해하세요. 저희 뉴스레터를 구독하세요. 무료입니다.

이 기사를 공유하세요

면책 조항: 제공된 정보는 투자 조언이 아닙니다. Cryptopolitan이 페이지에 제공된 정보를 바탕으로 이루어진 투자에 대해 어떠한 책임도 지지 않습니다.tron권장합니다dent .

존 팔머

존 무랑기리는 시장 분석 능력을 갖추고 Cryptopolitan 에 합류했습니다. 존(JP라고도 불림)은 나이로비 대학교에서 대중매체 및 미디어학 학사 학위를 취득했습니다. 그는 이전에 InsideBitcoin과 Metacoingraph에 암호화폐 시장 관련 분석 글을 기고한 바 있습니다.

1. 인공지능 환각의 증가

2. 갈릴레오 랩의 환각 지수를 소개합니다

3. 환각 측정에 대한 미묘한 접근 방식

4. 환각 발생 경향에 영향을 미치는 주요 요인

5. ChainPoll: 비용 효율적인 환각 탐지 방법론

6. 더욱 안전하고 신뢰할 수 있는 AI를 향하여

이 기사를 공유하세요