2024년이 시작된 지 두 달 만에 구글과 오픈아이얼 간의 AI 경쟁이 더욱 치열해졌습니다. 2월 15일, 오픈아이얼은 역대 최고의 AI 비디오 생성기라고 해도 과언이 아닌 소라(Sora)를 발표했습니다. 그리고 수요일에는 구글이 획기적인 신제품 젬마(Gemma)를 공개했습니다.
Gemma는 실제로 단일 제품이 아니라 두 개의 대규모 언어 모델로 구성된 제품군입니다. 구글의 설명에 따르면, "Gemma는 구글이 Gemini 모델을 개발하는 데 사용한 연구 및 기술을 기반으로 구축된 경량의 개방형 모델 제품군입니다."
발표에 따르면 Gemma는 현재 전 세계 개발자들이 이용할 수 있습니다. 이 모델을 사용하면 챗봇을 비롯한 다양한 도구를 개발할 수 있으며, LLM이 할 수 있는 거의 모든 작업을 수행할 수 있지만 몇 가지 고유한 장점을 제공합니다.
젬마에 대해 알아야 할 몇 가지 정보는 다음과 같습니다.
1. 젬마 오픈 모델
Gemma는 개발자와 연구원이라는 개방형 커뮤니티를 위해 Google이 구축한 첫 번째 주요 모델입니다. Google은 그동안 Gemini를 포함한 자사의 AI 제품에 대해 대부분 폐쇄적인 접근 방식을 유지해 왔는데, Gemini는 Bard(현재 Gemini로 명칭 변경)와 같은 Google 제품의 핵심 동력원인 Google의 가장 진보된 모델입니다.
구글의 폐쇄적인 접근 방식은 메타(Meta)의 수석 과학자인 얀 르쿤(Yann LeCun)과 같은 오픈 소스 옹호자들의 비판을 불러일으켰습니다. 르쿤은 구글의 AI 개발 부서인 딥마인드(DeepMind)가 "점점 더 개방적이지 않게 되고 있다"며 "이는 전체 분야의 발전을 늦출 것이라고 생각한다. 그래서 나는 이 상황이 그다지 마음에 들지 않는다"고 주장했습니다
젬마의 실제 소스 코드나 학습 데이터가 "오픈 모델"로 공개되는 것은 아니지만, 모델의 "가중치", 즉 사전 학습된 매개변수는 공개될 것이라고 포브스는 구글 대변인 제인 박의 말을 인용해 보도했습니다.
2. 젬마 모델 웨이트는 두 가지 사이즈로 제공됩니다
Gemma는 Gemma 2B와 Gemma 7B 두 가지 가중치 버전으로 제공됩니다. 발표에 따르면 각 버전은 사전 학습된 버전과 명령어 튜닝된 버전으로 출시됩니다. 파라미터는 모델 내의 연결과 가중치를 나타내며, 이를 통해 모델은 데이터의 미묘한 차이와 관계를 포착할 수 있습니다.
모델의 매개변수 수가 많을수록 복잡한 패턴을 학습하고 언어 번역, 다양한 유형의 창의적인 텍스트 작성, 복잡한 질문 이해와 같은 정교한 작업을 더 잘 수행할 수 있습니다.
3. Gemma는 노트북 사용에 적합합니다
젬마는 강력한 언어 모델이지만, 다른 대규모 언어 모델에 비해 효율성을 높이고 요구 사양이 낮은 환경에서도 실행되도록 특별히 설계되었습니다. 구글은 이 모델이 다양한 기기(노트북, 데스크톱, IoT, 모바일, 클라우드 등)에서 호환되어 실행될 수 있으므로 AI 기능을 널리 활용할 수 있다고 밝혔습니다.
"사전 학습 및 명령어 튜닝이 완료된 Gemma 모델은 Vertex AI 및 Google Kubernetes Engine(GKE)에 간편하게 배포하여 노트북, 워크스테이션 또는 Google Cloud에서 실행할 수 있습니다."라고 발표문은 밝혔습니다.

