최신 뉴스
당신을 위해 엄선되었습니다
주간
최고 자리를 유지하세요

최고의 암호화폐 관련 정보를 이메일로 받아보세요.

Mistral이 Voxtral이라는 새로운 AI 오디오 모델을 출시했습니다

에 의해란다 모세스란다 모세스
읽는 데 2분 소요
미스트랄(Mistral)이 복스트랄(Voxtral)이라는 새로운 AI 오디오 모델을 출시했습니다.
  • 미스트랄(Mistral)은 복스트랄(Voxtral)이라는 새로운 AI 오디오 모델을 출시했다고 발표했습니다.
  • 오디오 모델은 Voxtral Small과 Voxtral Mini의 두 가지 버전으로 제공됩니다.
  • 미스트랄은 복스트랄이 위스퍼 라지-v3 및 스크라이브와 같은 다른 오디오 모델보다 성능이 뛰어나다고 밝혔습니다.

미스트랄(Mistral)은 복스트랄(Voxtral)이라는 새로운 오디오 AI 모델을 출시했다고 발표했습니다. 프랑스의 AI 기업인 미스트랄은 이 모델이 기업을 대상으로 하며, 오디오 AI에 초점을 맞춘 최초의 대규모 언어 모델(LLM) 제품군이라고 밝혔습니다.

프랑스의 AI 기업에 따르면, Voxtral은 실제 응용 분야에서 실용적인 음성 인텔리전스를 제공하도록 설계되었습니다. 이 AI 오디오 모델은 최고의 오픈 소스 오디오 전사 모델 중 하나인 Whisper large-v3보다 뛰어난 성능을 보여줍니다.

Voxtral은 Mistral Small 3.1로 구동됩니다

Voxtral은 대규모 언어 모델(LLM)인 Mistral Small 3.1을 기반으로 작동합니다. 이 오디오 AI 모델은 영어, 프랑스어, 스페인어, 포르투갈어, 이탈리아어, 독일어, 네덜란드어, 힌디어 등 다양한 언어를 이해할 수 있습니다.

이 오디오 모델은 최대 30분 분량의 오디오를 텍스트로 변환할 수 있습니다. 또한 Voxtral은 최대 40분 분량의 오디오를 이해할 수 있어 사용자가 쉽게 대화하고 관련 질문을 할 수 있도록 지원합니다. 사용자는 오디오 파일의 텍스트 요약을 생성하거나 분석 및 자세한 정보를 제공하도록 요청할 수도 있습니다. API 호출을 통해 함수를 실행하는 등의 다른 작업도 수행할 수 있습니다.

Mistral은 Voxtral의 "음성 이해 모델"을 Voxtral Small과 Voxtral Mini라는 두 가지 버전으로 제공합니다. 두 모델 모두 음성 기반 프롬프트 또는 음성 및 텍스트 기반 프롬프트의 조합과 상호 작용할 수 있습니다.

두 모델 중 더 강력한 Voxtral Small은 240억 개의 파라미터를 갖추고 있어 대규모 생산 환경에 적합합니다. 미스트랄은 밝혔 "Voxtral Small은 모든 작업에서 GPT-4o-mini 및 Gemini 2.5 Flash와 경쟁력이 있다"고

미스트랄(Mistral)이 복스트랄(Voxtral)이라는 새로운 AI 오디오 모델을 출시했습니다.
출처: Mistral AI.

Voxtral Mini는 30억 개의 파라미터를 지원하는tron옵션으로, 로컬 및 엣지 환경에 배포하기에 적합합니다. API 버전인 Voxtral Mini Transcribe는 비용 효율적일 뿐만 아니라 OpenAI의 Whisper보다 성능이 뛰어나며 가격은 절반 이하입니다.

Voxtral Small(24B)과 Voxtral Mini(3B)는 모두 Hugging Face에서 다운로드 및 로컬 호스팅이 가능합니다. 개발자는 단일 API 호출을 통해 모든 애플리케이션에 오디오 모델을 통합할 수도 있습니다. 가격은 분당 0.001달러부터 시작하여 확장성이 뛰어납니다. Mistral은 Voxtral이 Le Chat 향후 몇 주 내에

미스트랄은 유럽을 선도하는 인공지능 기업 중 하나입니다. 보도에 따르면 2023년에 설립된 이 회사는 안드레센 호로위츠, 엔비디아, 삼성, 세일즈포스 등 유명 기업으로부터 10억 유로(약 12억 달러) 이상을 투자받았습니다.

암호화폐 뉴스를 단순히 읽는 데 그치지 마세요. 이해하세요. 저희 뉴스레터를 구독하세요. 무료입니다.

이 기사를 공유하세요
더 많은 뉴스
심층 암호
화폐 속성 강좌