«Impresionante»: la actualización de mitad de viaje impresiona a los artistas de IA con la función de cámara – Ars Technica
El jueves, Midjourney presentó la versión 5.2 de su modelo de síntesis de imágenes impulsado por IA, que incluye una nueva función de «alejar» que le permite mantener una imagen central sintetizada mientras construye automáticamente una escena más grande a su alrededor, simulando un acercamiento con una lente de cámara.
Igual a pintura exterior— una técnica de imágenes de IA introducida por DALL-E 2 de OpenAI en agosto de 2022 — La función de alejamiento de Midjourney puede tomar una imagen existente generada por IA y expandir sus bordes, manteniendo el objeto original centrado en la nueva imagen. Pero a diferencia de DALL-E y la función de relleno generativo de Photoshop, no puede seleccionar una imagen personalizada para expandirla. Actualmente, el zoom-out v5.2 solo funciona en imágenes generadas en Midjourney, un inscripción Servicio de generador de imágenes de IA.
En el servidor de Midjourney Discord (todavía la interfaz oficial de Midjourney, aunque hay planes para cambiar eso), los usuarios pueden experimentar alejando la imagen generando cualquier imagen v5.2 (ahora la predeterminada) y acercando el resultado. Después de eso, aparecen botones especiales de «Zoom» debajo de la salida. Puede alejar por un factor de 1.5x, 2x o un valor personalizado entre 1 y 2. Otro botón llamado «Hacer cuadrado» generará material alrededor de la imagen existente de una manera que crea una relación de aspecto cuadrada de 1: 1.
David Holz, el creador de Midjourney, anunció las nuevas funciones y mejoras en la versión 5.2 en el servidor de Discord el jueves por la noche. Además de «alejar», las adiciones más significativas incluyen un sistema estético revisado, que promete una mejor calidad de imagen y un comando «–estilizar» más fuerte que influye de manera efectiva en la apariencia de una imagen poco realista. También hay un nuevo «modo de alta variación», activado de forma predeterminada, que aumenta la variedad de composición entre generaciones de imágenes. Además, un nuevo comando «/shorten» permite a los usuarios evaluar indicaciones en un intento de eliminar palabras no esenciales.
A pesar del lanzamiento inmediato de la versión 5.2, Holz enfatizó en su anuncio que pueden ocurrir cambios sin previo aviso. Las versiones anteriores de la plantilla Midjourney aún están disponibles mediante el comando «/settings» o el argumento de línea de comando «–v 5.1».
Para los fanáticos de esta nueva forma de arte de síntesis de imágenes que a veces se denomina «sintografía» por defensores como Julie Wieland, los cambios en la versión 5.2 son bienvenidos, y algunos usuarios de Midjourney los llaman «espléndido» Es «sorprendente«, que no son superlativos poco comunes en el mundo de la IA en este momento. Pero los fanáticos probablemente argumentarán que las mejoras visuales de Midjourney justifican el asombro. reacciones entre ellos.
La última actualización es parte de una serie de mejoras de calidad desde marzo de 2022, cuando el modelo generado imágenes relativamente mal definidas que carecían de detalles. Más recientemente, Midjourney presentó la versión 5.0 en marzo y la versión 5.1 en mayo de este año, las cuales mejoran el realismo y los detalles de la imagen. La introducción de la serie de modelos v5 permitió la creación de imágenes realistas del Papa Francisco y Donald Trump, lo que generó preocupaciones sobre las falsificaciones profundas en las redes sociales.
A pesar del entusiasmo por las nuevas funciones entre los entusiastas de Midjourney, la síntesis de imágenes sigue siendo muy controvertida entre algunos artistas debido a la forma en que se entrenan estos sistemas de inteligencia artificial, utilizando millones de imágenes extraídas de la web. sin Consulta, crédito o permiso del artista. Midjourney nunca ha revelado oficialmente el contenido exacto de sus datos de entrenamiento. Adobe está probando un camino más ético con Firefly, pero Venture Beat informó recientemente que el consentimiento activo del artista es aún marginal.
Por ahora, es difícil no apreciar los asombrosos avances técnicos de Midjourney y al mismo tiempo preguntarse si existe un camino más ético para esta tecnología, uno que atraiga a los artistas, tanto tradicionales como sintetizadores.
«Introvertido. Solucionador de problemas. Aficionado total a la cultura pop. Estudiante independiente. Creador».