El arte generativo de difusión estable ahora se puede animar, IA de estabilidad del desarrollador Anunciado. La empresa lanzó un nuevo producto llamado Transmisión de video estable en una vista de búsqueda, lo que permite a los usuarios crear videos a partir de una sola imagen. «Este modelo de vídeo generativo de IA de próxima generación representa un paso importante en nuestro viaje hacia la creación de modelos para todos, de todo tipo», escribió la empresa.
La nueva herramienta se lanzó en forma de dos plantillas de imagen a vídeo, cada una capaz de generar de 14 a 25 fotogramas a velocidades de entre 3 y 30 fotogramas por segundo y una resolución de 576 × 1024. Ajuste fino de un solo fotograma en conjuntos de datos de vistas múltiples . «En el lanzamiento en su forma fundamental, a través de una evaluación externa, descubrimos que estos modelos superan a los modelos cerrados líderes en los estudios de preferencia de los usuarios», dijo la compañía, comparándolos con las plataformas de texto a video Runway y Laboratorios Pika.
La transmisión de video estable solo está disponible para fines de investigación en este momento y no para aplicaciones comerciales o del mundo real. Los usuarios potenciales pueden inscribirse para unirse a una lista de espera para acceder a una “próxima experiencia web con una interfaz de texto a video”, escribió Stability AI. La herramienta mostrará aplicaciones potenciales en industrias como la publicidad, la educación, el entretenimiento y más.
Las muestras que se muestran en el vídeo de arriba parecen ser de una calidad relativamente alta y coinciden con los sistemas generadores rivales. Sin embargo, tiene algunas limitaciones, la empresa el escribio: genera videos relativamente cortos (menos de 4 segundos), no tiene un fotorrealismo perfecto, no puede realizar movimientos de cámara excepto movimientos lentos, no tiene control de texto, no puede generar texto legible y es posible que no genere personas y rostros correctamente.
La herramienta se entrenó en un conjunto de datos de millones de videos y luego se ajustó en un conjunto más pequeño, y Stability AI solo dijo que usaba videos que estaban disponibles públicamente con fines de investigación. El origen del conjunto de datos es importante, ya que Getty Images demandó recientemente a Stability AI por copiar sus archivos de imagen.
El vídeo es un objetivo clave de la IA generativa debido a su potencial para simplificar la creación de contenido. Sin embargo, también es una herramienta con mayor potencial de abuso a través de deepfakes, infracciones de derechos de autor y más. Y a diferencia de OpenAI con su producto ChatGPT, Stability tuvo menos éxito en la comercialización de su producto Stable Diffusion y quemó efectivo a un ritmo elevado. TechCrunch observado. Y la semana pasada, el vicepresidente de audio de Stability AI, Ed Newton-Rex, renunció por el uso de contenido protegido por derechos de autor para entrenar modelos generativos de IA.
«Introvertido. Solucionador de problemas. Aficionado total a la cultura pop. Estudiante independiente. Creador».