강화 학습이 소프트웨어 개발의 단위 테스트에 혁신적인 변화를 가져올 기술로 부상하고 있다

에 의해

브라이언 쿰

읽는 데 3분 소요 , 2023년 11월 25일

대규모 언어 모델(LLM)은 "환각"으로 인해 정확한 단위 테스트를 생성하는 데 문제가 있습니다
시행착오 방식인 강화 학습은 유닛 테스트 작성 자동화를 위한 더 나은 해결책으로 떠오르고 있습니다.
강화 학습을 사용하는 Diffblue Cover는 복잡한 테스트 작업에서 LLM보다 뛰어난 성능을 보이며 자율적으로 단위 테스트를 생성할 수 있습니다.

소프트웨어 개발 분야에서 정확성과 정밀성은 무엇보다 중요합니다. 견고한 단위 테스트를 작성하는 것은 소프트웨어 애플리케이션의 신뢰성과 기능성을 보장하는 데 필수적인 단계입니다. ChatGPT와 같은 대규모 언어 모델(LLM)이 뛰어난 언어 처리 능력으로 AI 커뮤니티를 매료시켜 왔지만, 단위 테스트라는 복잡한 작업에 있어서는 더욱 정확하고 비용 효율적인 솔루션으로 강화 학습이라는 새로운 경쟁자가 등장했습니다.

LLM 환각의 도전

대규모 언어 모델(LLM)은 자연어 처리 분야에 혁명을 일으켜 유창하고 문맥에 맞는 답변을 제공해 왔습니다. 그러나 LLM에도 한계가 없는 것은 아닙니다. LLM을 괴롭히는 주요 문제 중 하나는 '환상' 현상입니다. 이는matic으로는 맞고 의미적으로는 그럴듯해 보이지만, 궁극적으로는 부정확하거나 무의미한 텍스트를 생성하는 현상입니다. 이러한 한계는 전문가들 사이에서 우려를 불러일으키고 있습니다.

강화 학습 vs. LLM

단위 테스트의 어려움을 해결하는 데 있어 강화 학습과 대규모 언어 모델(LLM) 중 어느 것이 더 효과적인지에 대한 논쟁은 계속되고 있습니다. OpenAI의 일리야 수츠케버를 비롯한 일부 전문가들은 강화 학습이 인간의 피드백과 결합될 때 LLM의 한계를 극복할 수 있다고 주장합니다. 그러나 Meta의 얀 르쿤과 구글 출신의 제프 힌튼과 같은 전문가들은 LLM의 근본적인 결함 때문에 단위 테스트에는 적합하지 않다고 반박합니다.

단위 테스트는 소프트웨어 개발에서 매우 중요한 부분으로, 소프트웨어 애플리케이션의 개별 구성 요소가 의도한 대로 작동하는지 확인하는 역할을 합니다. 단위 테스트는 코드의 정확성을 보장할 뿐만 아니라 시간을 절약하고 생산성을 향상시킵니다. LLM(Learning Level Model)은 테스트에 사용할 코드 스니펫을 제안할 수 있지만, 정확성보다는 일반화에 중점을 두는 경우가 많아 개발자가 생성된 코드의 효과를 직접 검증해야 합니다.

GitHub의 Copilot은 OpenAI의 GPT-3 파생 알고리즘을 기반으로 단위 테스트를 위한 코드 제안을 제공하지만, 단위 테스트 자체를 생성하지는 않습니다. Copilot은 개발자에게 다양한 시나리오를 테스트할 수 있는 코드 조각을 제공하여 포괄적인 단위 테스트를 작성하는 데 유용한 출발점을 제공합니다. 그러나 Copilot은 포괄적인 테스트 전략을 대체할 수 없으며, 사람의 감독은 여전히 필수적입니다.

TiCoder를 소개합니다

단위 테스트의 어려움을 해결하기 위해 마이크로소프트 리서치, 펜실베이니아 대학교, 캘리포니아 대학교 샌디에이고의 연구원들은 TiCoder(Test-driven Interactive Coder)를 개발했습니다. 이 혁신적인 도구는 자연어 처리 및 머신러닝 알고리즘을 활용하여 개발자가 단위 테스트를 생성하는 데 도움을 줍니다.

TiCoder는 개발자에게 질문을 던져 의도를 더 정확하게 파악합니다. 그런 다음 코드의 맥락, 구문 및 언어를 기반으로 제안 및 자동 완성 옵션을 제공합니다. 또한 TiCoder는 테스트 케이스를 생성하고 어설션을 제안하여 단위 테스트 프로세스를 간소화합니다.

Copilot과 TiCoder를 비롯한 LLM 기반 도구들은 단위 테스트 생성을 가속화합니다. 하지만 이러한 도구들은 개발자가 직접 검증하고 개선해야 하는 AI 보조 도구일 뿐입니다. 생산성을 향상시키는 도구이긴 하지만, 소프트웨어 개발 과정에서 인간의 전문성을 대체할 수는 없습니다.

최근 구글을 떠난 인공지능 분야의 저명한 인물인 제프 힌튼은 시행착오를 통한 학습의 중요성을 강조합니다. 그는 개인이 농구와 같은 스포츠를 배우는 방식, 즉 연습과 실험을 통해 기술을 익히는 과정을 예로 듭니다. 강력한 인공지능 기술인 강화 학습은 이러한 개념과 일맥상통하며 게임 플레이와 같은 작업에서 탁월한 성능을 보여왔습니다.

Diffblue 표지: 강화 학습의 선구자

강화 학습이 실제로 적용된 주목할 만한 사례 중 하나는 Diffblue Cover입니다. 이 혁신적인 제품은 강화 학습을 활용하여 사람의 개입 없이 실행 가능한 단위 테스트를 자동으로 생성합니다. 이는 복잡하고 오류 발생 가능성이 높은 테스트 작업을 대규모로 자동화할 수 있는 잠재력을 가지고 있습니다.

Diffblue Cover는 방대한 테스트 방법론을 탐색하고, 각 방법론에 대한 테스트 코드를matic으로 작성한 후, 테스트 커버리지 및 코딩 스타일 등 다양한 기준에 따라 가장 적합한 테스트를 선택하는 방식을 사용합니다. 이 AI 기반 도구는 각 방법론에 대한 테스트를 단 몇 초 만에 생성하고, 코드 단위에 대한 최적의 테스트를 1~2분 안에 제공할 수 있습니다.

Diffblue Cover의 방법론은 DeepMind의 바둑 시스템인 AlphaGo와 유사합니다. 두 시스템 모두 방대한 탐색 공간에서 핵심 영역을dent하고 강화 학습을 활용하여 정보에 기반한 결정을 내립니다. Diffblue Cover의 경우, 이는 단위 테스트 방법을 생성하고matic 프로세스를 통해 가장 효과적인 테스트를 선택하는 과정을 포함합니다.

LLM의 한계

복잡한 프로그램에 대한 수천 개의 단위 테스트 작성을 자동화하는 것과 같은 작업에서는 강화 학습이 대규모 언어 모델보다 훨씬 뛰어납니다. 대규모 언어 모델은 뛰어난 언어적 능력을 갖추고 있지만, 이러한 규모에서 효과적인 인간의 감독 및 수정을 제공할 수 있는 역량이 부족합니다. 대규모 언어 모델의 복잡성을 높이는 것만으로는 이러한 근본적인 문제를 해결할 수 없습니다.

ChatGPT와 같은 대규모 언어 모델은 유창성과 지식 수준으로 주목받고 있지만, 소프트웨어 개발의 단위 테스트와 같은 정밀한 작업에는 적합하지 않을 수 있습니다. 강화 학습은 이러한 한계를 극복하고 보다 정확하고 비용 효율적인 해결책으로 떠오르며, 해당 분야에 혁명을 일으킬 잠재력을 보여주고 있습니다.

소프트웨어 신뢰성에 대한 수요가 지속적으로 증가함에 따라, 강화 학습을 테스트 프로세스에 통합하는 것은 소프트웨어 개발 환경에 상당한 진전을 가져올 수 있습니다.

암호화폐 뉴스를 단순히 읽는 데 그치지 마세요. 이해하세요. 저희 뉴스레터를 구독하세요. 무료입니다.

이 기사를 공유하세요

면책 조항: 제공된 정보는 투자 조언이 아닙니다. Cryptopolitan이 페이지에 제공된 정보를 바탕으로 이루어진 투자에 대해 어떠한 책임도 지지 않습니다.tron권장합니다dent .

브라이언 쿰

브라이언 쿰은 2017년부터 블록체인 및 암호화폐 업계에서 활동하며 7년 이상의 경력을 쌓았습니다. 그는 BlockToday.com을 비롯한 주요 매체에 기고했으며, Cryptopolitan 정규 작가로 합류하기 전에는 BitDegree.org에서 Ethereum 과정을 개발하기도 했습니다. 브라이언은 핵심 가이드(EG), 심층 분석, 인터뷰, 가격 분석 등을 다룹니다. 특히 DeFi, 블록체인 혁신, 그리고 새롭게 떠오르는 암호화폐 프로젝트에 대한 그의 관심은 독자들에게 큰 호응을 얻고 있습니다.

1. LLM 환각의 도전

2. 강화 학습 vs. LLM

3. TiCoder를 소개합니다

4. Diffblue 표지: 강화 학습의 선구자

5. LLM의 한계

이 기사를 공유하세요