- 세레브라스는 주당 115~125달러를 목표로 월요일에 기업공개(IPO) 로드쇼를 시작합니다.
- 인공지능 산업이 학습에서 추론으로 전환함에 따라 특수 칩에 대한 수요가 증가하고 있습니다.
- 주요 업체들이 분산 추론 방식을 도입하고 있습니다.
세레브라스 시스템즈는 월요일부터 투자자들에게 주식 매각을 제안할 예정이며, 주당 115달러에서 125달러 사이의 가격으로 주식을 판매할 계획이라고 로이터 통신이 입수한 소식통이 전했다.
인공지능 칩 제조업체가 두 번째 기업공개(IPO)를 시도하고 있다. 이 회사는 지난해 10월 첫 번째 IPO 시도를 철회한 바 있다.
세레브라스는 발표했습니다.tron회사의 매출은 5억 1천만 달러로 전년도 2억 9천30만 달러에서 크게 증가했습니다. 또한 주당 순이익은 1.38달러를 기록했는데, 이는 전년도 주당 9.90달러 손실과 대비되는 수치입니다.
모건 스탠리, 시티그룹, 바클레이즈, UBS가 담당하고 있습니다 주식 매각을
산업계가 변화를 겪고 있다
세레브라스의 전략은 우연이 아닙니다. AI 업계는 새로운 AI 모델 개발에서 실제 활용을 위한 모델 실행으로 전환하고 있습니다. 이러한 변화는 엔비디아(NASDAQ: NVDA)의 독점과 경쟁하는 중소기업들에게 절호의 기회입니다. Cryptopolitan, 오픈AI조차도 확신하지 못하고 있습니다 엔비디아의 추론 하드웨어에 대해
이는 인공지능 모델을 실행하는 추론 과정이 모델 학습 과정과는 다른 역량을 요구하기 때문입니다. 이러한 특성 덕분에 특수 칩 제조업체들이 시장에서 입지를 확보할 수 있는 기회가 생겼습니다. 대량의 정보를 처리하는 데 필요한 컴퓨팅 성능, 메모리, 데이터 전송 속도의 균형은 인공지능 챗봇이나 코딩 도우미를 실행하는 데 필요한 균형과는 완전히 다릅니다.
이처럼 다양한 요구 사항으로 인해 추론 시장은 더욱 다채로워졌습니다. 어떤 작업은 기존 그래픽 칩에서 더 잘 작동하는 반면, 다른 작업은 더 고급 장비를 필요로 합니다.
엔비디아가 작년 12월 그로크(Groq)를 200억 달러에 인수한 것은 이러한 상황이 어떻게 전개되고 있는지를 보여주는 사례입니다. 그로크는 고속 SRAM 메모리가 탑재된 칩을 개발하여 일반 그래픽 칩보다 빠르게 AI 응답을 처리할 수 있었습니다. 그러나 칩의 컴퓨팅 성능이 제한적이고 구형 기술을 기반으로 제작되었기 때문에 규모 확장에 어려움을 겪었습니다.
엔비디아는 작업을 분할함으로써 이 문제를 해결했습니다. 인공지능 응답 생성의 핵심 연산 부분인 프리필(prefill)에는 자사의 일반 그래픽 칩을 사용하고, 연산량은 적지만 빠른 데이터 접근이 필요한 디코딩 단계에는 Groq의 칩을 사용했습니다.
다른 대기업들도 비슷한 움직임을 보이고 있습니다. 아마존 웹 서비스(AWS)는 주요 기술 컨퍼런스 직후 자체 분할 시스템을 발표했습니다. 이 시스템은 프리필 작업을 위한 자체 개발 트레이니움(Trainium) 칩과 디코딩 작업을 위한 세레브라스(Cerebras)의 웨이퍼 크기 칩을 결합한 것입니다.
인텔도 이 대열에 합류하여 삼바노바라는 또 다른 스타트업의 프로세서와 그래픽 칩을 결합할 계획을 발표했습니다. 그래픽 칩은 프리필을 처리하고 삼바노바의 칩은 디코딩을 담당할 예정입니다.
대부분의 소규모 칩 회사들은 디코딩 작업에서 성공을 거두었습니다. SRAM 메모리는 많은 정보를 저장할 수는 없지만 속도가 매우 빠릅니다. 충분한 수의 칩이나 세레브라(Cerebra) 에서 만드는 것과 같은 매우 큰 칩 하나만 있으면 이러한 시스템은 디코딩 작업에서 탁월한 성능을 발휘합니다. 하지만 회사들은 여기서 멈추지 않고 있습니다.
새로운 기술은 스플릿칩 방식에 도전 과제를 제시합니다
또 다른 스타트업인 루마이는 이번 주 인공지능 작업의 핵심인 수학 연산에 전기 대신 빛을 사용하는 칩을 개발했다고 발표했습니다. 이 방식은 기존 칩보다 전력 소모가 훨씬 적습니다.
이 회사는 자사의 차세대 아이리스 테트라 시스템이 2029년까지 단 10킬로와트의 전력만 사용하면서 엑사OPS급 AI 성능을 제공할 것으로 기대하고 있습니다.
이 칩들은 광 기반 부품과 전기 부품을 혼합하여 사용하지만, 추론 과정에서는 광이 대부분의 작업을 처리합니다. 루마이는 우선 이 칩들을 배치 처리 작업에서 그래픽 칩을 대체하는 독립형 칩으로 사용할 계획입니다. 이후에는 사전 처리 작업에도 활용할 예정입니다.
작업을 여러 칩으로 분산하는 것이 타당하다고 생각하는 사람은 많지 않습니다. 텐스토렌트는 이번 주에 갤럭시 블랙홀 시스템을 출시했는데, CEO 짐 켈러는 이러한 접근 방식을 비판했습니다.
"업계의 모든 기업이 협력하여 가속기, 가속기, 또 가속기를 구축하고 있습니다. CPU는 코드를 실행하고, GPU는 CPU를 가속하고, TPU는 GPU를 가속하고, LPU는 TPU를 가속하는 식이죠. 이런 방식은 AI 모델과 활용 방식의 변화에 대응하기 어려운 복잡한 솔루션으로 이어집니다. 텐스토렌트에서는 좀 더 범용적이고 간단한 방식이 효과적일 거라고 생각했습니다."라고 켈러는 말했습니다.
에 대한 무료 영상을 시청하세요. 나만의 은행이 되는 방법
화폐 속성 강좌
- 어떤 암호화폐로 돈을 벌 수 있을까요?
- 지갑으로 보안을 강화하는 방법 (그리고 실제로 사용할 만한 지갑은 무엇일까요?)
- 전문가들이 사용하는 잘 알려지지 않은 투자 전략
- 암호화폐 투자 시작하는 방법 (어떤 거래소를 사용해야 하는지, 어떤 암호화폐를 사는 것이 가장 좋은지 등)















