유럽의 비밀 병기, 생성형 인공지능 분야에서 빅테크 기업에 도전장을 내밀다

- 유럽의 언어 정보 유출 사태를 해결하기 위해 유럽연합(EU)의 방대한 언어 데이터를 기반으로 다국어 AI 모델 '포로(Poro)'를 개발한 유럽 사일로(Silo)가 빅테크 기업에 도전장을 내밀었습니다.
- 기술 주권과 슈퍼컴퓨팅은 유럽의 인공지능(AI)에 대한 열망을 고조시킨다.
- 다양성과 협력은 유럽이 AI 분야에서 두각을 나타내는 길을 열어주었습니다.
생성형 인공지능은 현재 기술 업계에서 가장 뜨거운 관심사이며, 마이크로소프트, 구글, 아마존, 메타와 같은 주요 기업들이 대규모 언어 모델(LLM)을 앞세워 시장을 장악하고 있습니다. 이러한 LLM은 차세대 기술 혁신의 핵심으로 널리 인식되고 있습니다. 그러나 유럽은 특히 영어 이외의 언어 분야에서 빅테크 기업들의 패권에 도전할 희망을 품고 있습니다.
컴퓨팅과 데이터의 딜레마
빅테크 기업들이 AI 분야에서 우위를 점하는 것은 막강한 컴퓨팅 파워뿐만 아니라 인터넷에서 수집되는 방대한 언어 데이터에 대한 접근성 덕분입니다. 유럽 기업이 영어 LLM(법학 석사) 학위 취득에서 빅테크 기업을 앞지르는 것은 쉽지 않은 과제일 수 있지만, 핀란드 AI 기업 Silo는 Poro(핀란드어로 순록)라는 다국어 모델로 유망한 성과를 거두었습니다.
Poro는 핀란드어와 영어 텍스트 모두를 사용하여 학습되었으며, 이는 서로 다른 언어를 결합하여 고성능 언어 모델(LLM)을 만들 수 있음을 입증하는 사례입니다. Silo는 초기 결과가 Meta의 오픈 소스 Llama 모델과 경쟁력이 있음을 보여준다고 주장합니다. Silo는 투르쿠 대학교와의 협력을 통해 EU 자금 지원 프로젝트인 고성능 언어 기술(HPLT) 프로젝트에서 수집한 방대한 데이터를 활용했습니다. 이 프로젝트는 2022년부터 80개 언어에 걸쳐 무려 7페타바이트(7,000테라바이트)의 언어 데이터를 축적해 왔습니다. 참고로 ChatGPT 출시 버전에 사용된 GPT-3.5는 45테라바이트의 텍스트 데이터로 학습되었습니다.
HPLT의 경우처럼 공공 자금으로 지원되는 고품질 텍스트 데이터에 접근할 수 있다면, Silo와 같은 모델은 온라인 데이터 가용성이 제한적인 언어에서 우위를 점할 수 있을 것입니다.
다국어 접근법
핀란드어와 같은 언어에 대한 데이터가 부족하기 때문에 Silo는 영어와 핀란드어 데이터를 모두 사용하여 모델을 "교차 학습"하는 다국어 전략을 채택했습니다. 이 접근 방식은 모델에 두 언어의 텍스트를 모두 입력하여 두 언어 간의 관계를 학습하도록 합니다. 결과적으로, 모델은 이전에 핀란드어 코드를 접한 적이 없더라도 핀란드어로 응답을 생성할 수 있습니다.
Silo의 공동 창립자이자 CEO인 피터 사를린은 "모델이 핀란드어 코드를 전혀 접하지 않았더라도 핀란드어로 코드를 생성할 수 있습니다."라고 설명합니다. Silo는 자사의 크로스 트레이닝 기술을 오픈 소스로 공개할 계획이며, 이를 통해 데이터가 제한적인 언어를 포함하여 모든 유럽 언어에 걸쳐 모델 개발의 길을 열 수 있을 것으로 기대됩니다.
기술적 주권 추구
사린은 영어 이외의 언어로 된 LLM(법학 석사) 시장에 상당한 기회가 있다고 지적합니다. 그는 유럽 기업들이 미국 대기업이 소유한 기술에만 의존해서는 안 된다는 점을 강조합니다. 빅테크 기업의 AI 모델을 기반으로 사업을 구축하는 것은 유럽 내에서 실질적인 가치 창출로 이어지지 않을 수 있습니다. 따라서 유럽이 기술 주권을 확립해야 할 필요성이 점점 커지고 있습니다.
LUMI의 슈퍼컴퓨팅 성능
포로의 훈련은 2022년에 가동을 시작한 EU 자금 지원 슈퍼컴퓨터인 LUMI의 도움을 받기도 했습니다. 특히 LUMI는 업계 표준인 NVIDIA 칩 대신 AMD 칩을 사용합니다. 일부에서는 AMD 칩이 비싸고 AI에 비효율적이라고 생각하지만, 실로의 팀은 AMD 칩에 최적화된 AI 훈련 소프트웨어 개발에 상당한 투자를 했습니다.
사린은 이 소프트웨어의 상당 부분을 오픈소스로 공개할 계획이며, 다른 기업들이 LUMI를 활용해 모델을 학습시킬 수 있도록 지원하는 데 전념하고 있다고 밝혔습니다. 유럽 기업들이 LUMI와 같은 자원을 활용하여 AI 학습을 진행할 수 있다면, AI 시대에 유럽이 주도권을 잡으려는 노력에 있어 획기적인 전환점이 될 수 있을 것입니다.
유럽의 인공지능 르네상스
실리콘 밸리의 빅테크 기업들이 인공지능 분야에서 막강한 영향력을 행사하는 가운데, 유럽은 조용히 자체적인 기술력을 구축하고 있습니다. 유럽의 강점은 다국어 환경에 대한 이해, 공공 자금으로 확보된 언어 데이터 활용, 그리고 LUMI와 같은 대안 컴퓨팅 방식 탐구에 있습니다. 앞으로 나아갈 길이 험난할 수도 있지만, 글로벌 인공지능 무대에서 경쟁하려는 유럽의 의지는dent.
빅테크 기업들의 생성형 AI 지배에 맞서는 유럽의 비밀 병기는 다양성, 협력, 그리고 기술 주권에 대한 확고한 의지에 있습니다. 실로(Silo)의 포로(Poro) 모델이 보여준 것처럼, 유럽은 AI 분야에서 두각을 나타낼 수 있는 충분한 가능성을 가지고 있습니다.
이 글을 읽고 계시다면 이미 앞서 나가고 계신 겁니다. 뉴스레터를 구독하시면 더욱 유익한 정보를 받아보실 수 있습니다.
면책 조항: 제공된 정보는 투자 조언이 아닙니다. Cryptopolitan이 페이지에 제공된 정보를 바탕으로 이루어진 투자에 대해 어떠한 책임도 지지 않습니다.tron권장합니다dent .

에디타 패트릭
에디타는 블록체인 분야에 대한 깊은 이해를 가진 다재다능한 핀테크 분석가입니다. 기술 자체에 매료된 그녀는 기술과 금융이 만나는 지점에 큰 흥미를 느낍니다. 특히 디지털 지갑과 블록체인에 대한 그녀의 관심은 청중들에게 큰 도움이 됩니다.
화폐 속성 강좌
- 어떤 암호화폐로 돈을 벌 수 있을까요?
- 지갑으로 보안을 강화하는 방법 (그리고 실제로 사용할 만한 지갑은 무엇일까요?)
- 전문가들이 사용하는 잘 알려지지 않은 투자 전략
- 암호화폐 투자 시작하는 방법 (어떤 거래소를 사용해야 하는지, 어떤 암호화폐를 사는 것이 가장 좋은지 등)














