Stability AI는 자사의 이미지 생성 모델 중 가장 진보된 버전인 Stable Diffusion 3의 출시를 앞두고 있습니다.
해당 스타트업은 목요일에 Stable Diffusion 3의 사전 체험 대기자 명단을 개설했다고 발표했습니다. 발표에 따르면, 사전 체험 단계는 모델을 더욱 개선하고 버그 및 문제를 수정하는 데 필요한 통찰력을 수집하는 데 중요하며, 정식 출시일은 아직 발표되지 않았습니다.
Stable Diffusion의 최첨단 AI 아트 여정
Stable Diffusion 3 이전에는 Stability에서 1.4, 1.5, 2.0, 2.1, XL, XL Turbo를 포함하여 약 7가지 버전의 이미지 모델을 사용했습니다.
DALL-E 3 및 Midjourney와 같은 인기 있고 고급 이미지 모델과 비교했을 때, Stable Diffusion 3는 웹사이트에 제공된 이미지 샘플을 기준으로 판단하면 거의 동등하거나 오히려 더 나은 성능을 보여줍니다.
Stability는 최신 모델이 여러 주제를 다루는 프롬프트 처리, 이미지 품질 및 맞춤법 기능을 크게 개선했다고 밝혔습니다. Midjourney와 같은 프로그램은 여전히 이미지 속 단어를 정확하게 철자하는 데 어려움을 겪고 있습니다.
Stable Diffusion 3은 다양한 매개변수 크기를 제공합니다
발표에 따르면 Stable Diffusion 3는 8억에서 80억에 이르는 다양한 파라미터 크기로 출시될 예정입니다. 파라미터 크기는 모델의 복잡성과 직접적인 상관관계가 있습니다. 일반적으로 파라미터 수가 많을수록 복잡한 패턴을 포착하고 특정 작업을 수행하는 능력이 향상됩니다.
이 AI 스타트업은 모델의 다양한 매개변수를 출시하는 것이 "우리의 핵심 가치와 일치하며 접근성을 민주화하여 사용자에게 확장성과 품질 측면에서 다양한 옵션을 제공함으로써 창의적인 요구 사항을 가장 잘 충족할 수 있도록 한다"고 밝혔습니다
인공지능 이미지 생성기는 지난 몇 년간 꾸준히 발전하여 가능성의 한계를 넓히고 현실과 인공지능이 생성한 이미지 사이의 경계를 모호하게 만들었습니다.
빠른 발전은 흥미로운 기회를 제공하는 동시에 책임 있는 사용과 관련하여 해결해야 할 중요한 문제들을 제기합니다.
Stability는 Stable Diffusion 3에서 "책임감 있는 AI 관행"을 강조하며, 악의적인 행위자에 의한 모델 오용을 방지하기 위해 이번 초기 미리보기 버전에 앞서 여러 안전장치를 도입했다고 밝혔습니다.

