Midjourney ha lanzado su primer modelo de generación de vídeo con IA, V1, lo que marca la transición de la compañía de la generación de imágenes a la creación completa de contenido multimedia. A partir de hoy, los casi 20 millones de usuarios de Midjourney pueden animar imágenes subidas o generadas con IA a través del sitio web.
David Holz, director ejecutivo de Midjourney, afirmó que el modelo V1 era el siguiente paso de la compañía hacia su objetivo final: crear modelos de IA capaces de realizar simulaciones de mundo abierto en tiempo real. La compañía también afirmó que tenía planes más ambiciosos para sus modelos de vídeo de IA que la simple generación de material adicional para películas de Hollywood o anuncios publicitarios.
Nick St. Pierre, director creativo y colaborador no oficial de Midjourney, observó que la V1 solo realizaba conversiones de imagen a vídeo. Los usuarios podían generar cuatro secuencias a 24 fps a 480p por clip, y funcionaban con cualquier relación de aspecto. También destacó la rentabilidad de la V1, afirmando que 20 videoclips por unos 4 $ eran mejores que los 3 $ por video en Veo. La velocidad de generación era notablemente mayor.
Según Pierre, V1 cuenta con configuraciones personalizadas que permiten a los usuarios controlar las salidas del modelo de video. La configuración de animaciónmatic hará que la imagen se mueva aleatoriamente, y la configuración manual permitirá a los usuarios describir, en texto, una animación específica que deseen agregar a su video. Si bien los videos generados con V1 duran solo cinco segundos, los usuarios pueden extenderlos cuatro segundos hasta cuatro veces, lo que significa que los videos de V1 pueden alcanzar una duración de hasta 21 segundos.
Midjourney dice que cobrará 8 veces más por la generación de video
¡Tuve la oportunidad de probar de @midjourney !
Estoy realmente impresionado con muchos de mis resultados: hace una gran diferencia comenzar con una imagen de calidad y la coherencia es muytron.
El aviso automático es genial. Y además es un modelo relativamente rápido y económico, lo cual nunca viene mal 😅 pic.twitter.com/yvf3nN9dmC
— Justine Moore (@venturetwins) 18 de junio de 2025
El equipo de Midjourney afirmó que cobraría ocho veces más por la generación de video que por la generación de imágenes típicas, lo que significa que los suscriptores agotarán sus generaciones mensuales asignadas mucho más rápido al crear videos que imágenes. También mencionó que planea desarrollar modelos de IA para producir renderizado 3D y modelos de IA en tiempo real.
La forma más económica de probar la versión 1 en el lanzamiento será suscribiéndose al plan Básico de Midjourney, de $10 al mes. Los suscriptores del plan Pro de Midjourney, de $60 al mes, y del plan Mega, de $120 al mes, tendrán generación de video ilimitada en el modo "Relax", más lento, de la compañía. Midjourney afirmó que reevaluará los precios de los modelos de video durante el próximo mes. Holz afirmó que los precios de Midjourney eran más de 25 veces más bajos que los que se ofrecían anteriormente en el mercado.
Nuestro objetivo es ofrecerles algo divertido, fácil, bonito y asequible para que todos puedan explorar. Creemos que hemos logrado un equilibrio perfecto. Aunque muchos sentirán la necesidad de subir de nivel para disfrutar de más minutos rápidos
– David Holz , director ejecutivo de Midjourney
Según Holz, era difícil predecir los costos reales de producción de los modelos y los precios que cobraba Midjourney. Añadió que la empresa haría todo lo posible para que los usuarios tuvieran acceso de inmediato. Sin embargo, aclaró que el equipo de Midjourney supervisaría el uso de la tecnología por parte de todos durante el próximo mes y ajustaría todo para garantizar la sostenibilidad de la empresa.
Holz dice que los modelos capaces de realizar simulaciones de mundo abierto en tiempo real son el próximo paso
El CEO de Midjourney presentó los planes para el próximo año, afirmando que el destino inevitable de la tecnología de V1 eran modelos capaces de simular mundos abiertos en tiempo real. Básicamente, la compañía buscaba construir un sistema de IA que generara imágenes en tiempo real. Los usuarios podían controlarlo para que se moviera en un espacio 3D donde los entornos y personajes también se movían, y los usuarios podían interactuar con todo.
Holz señaló que, para lograrlo, la compañía necesitaba elementos visuales (nuestros primeros modelos de imagen), que esas imágenes se movieran (modelos de video), que los usuarios pudieran moverse por el espacio (modelos 3D) y que todo esto fuera rápido (modelos en tiempo real). Añadió que el año siguiente se desarrollarían estas piezas individualmente, se lanzarían y se integrarían gradualmente en un sistema unificado. El director de Midjourney comentó que al principio podría ser costoso, pero que el producto final sería algo que todos pudieran usar.
Holz prometió que su empresa aportaría más en las próximas semanas y meses, y añadió que su equipo había aprendido mucho al crear modelos de vídeo. También señaló que gran parte de este aprendizaje se aplicaría a de Midjourney en las próximas semanas o meses. Pero por ahora, Holz recomienda pulsar "Animar" para que esas imágenes se muevan.

