El modelo Gemini AI de Google es una vez más capaz de generar imágenes de humanos después de que esta función fuera «pausada» en febrero tras las protestas por las representaciones raciales históricamente inexactas en muchos resultados. una publicación de blogGoogle dijo que su modelo Imagen 3, que se anunció por primera vez en mayo, «comenzará a implementar imágenes de personas» para los usuarios de Gemini Advanced, Business y Enterprise en los «próximos días». Pero recientemente se puso a disposición del público una versión de este modelo de Imagen, completo con capacidades de imágenes humanas. a través del entorno de pruebas de Gemini Labs sin una suscripción paga (aunque se requiere una cuenta de Google para iniciar sesión).
Este nuevo modelo viene con algunas salvaguardas para intentar evitar crear imágenes polémicas, por supuesto. Google escribe en su anuncio que no apoya «la generación de individuos fotorrealistas, identificables, representaciones de menores o escenas excesivamente sangrientas, violentas o sexuales». preguntas frecuentesGoogle aclara que la prohibición de «individuos identificables» incluye «ciertas consultas que pueden conducir a resultados de personas importantes». En las pruebas de Ars, esto significaba que una consulta como «El presidente Biden jugando baloncesto» sería rechazada, mientras que una solicitud más genérica de «un presidente de Estados Unidos jugando baloncesto» generaría múltiples opciones.
En algunas pruebas rápidas del nuevo sistema Imagen 3, Ars descubrió que evitaba muchos de los errores raciales «históricamente inexactos» ampliamente compartidos que llevaron a Google a pausar las imágenes humanas de Gemini en primer lugar. Al pedirle a Imagen 3 una «representación históricamente precisa de un rey británico», por ejemplo, ahora se obtiene un conjunto de hombres blancos barbudos con túnicas rojas en lugar de la mezcla racialmente diversa de guerreros del modelo Géminis anterior a la ruptura. En la galería a continuación se pueden encontrar más ejemplos de antes y después del antiguo Gemini y el nuevo Imagen 3.
Sin embargo, algunos intentos de describir escenas históricas genéricas parecen entrar en conflicto con las reglas de inteligencia artificial de Google. Al pedir ilustraciones de «un soldado alemán de 1943», a lo que Gemini respondió anteriormente que mostraba a asiáticos y negros con uniformes nazis, ahora les dice a los usuarios que «prueben con un mensaje diferente y verifiquen nuestras políticas de contenido». Las solicitudes de imágenes de «antiguos filósofos chinos», «un líder del sufragio femenino dando un discurso» y «un grupo de manifestantes no violentos» también condujeron al mismo mensaje de error en las pruebas de Ars.
«Por supuesto, como ocurre con cualquier herramienta de inteligencia artificial generativa, no todas las imágenes creadas por Gemini serán perfectas, pero continuaremos escuchando los comentarios de los primeros usuarios a medida que continuamos mejorando», escribe la compañía en su blog. «Implementaremos esto gradualmente, con el objetivo de llevarlo pronto a más usuarios e idiomas».
Imagen de listado de Google / Ars Technica