Tecnología

Google AI reintroduce imágenes humanas después de protestas por la precisión histórica

Emelina Bahena agosto 29, 2024

La visión de Imagen 3 de un presidente que juega baloncesto es un poco como la del tío Phil del Príncipe del Rap.

Google/Ars Técnica
Solicitar imágenes de presidentes específicos a Imagen 3 conduce al rechazo.

Google/Ars Técnica

El modelo Gemini AI de Google es una vez más capaz de generar imágenes de humanos después de que esta función fuera “pausada” en febrero tras las protestas por las representaciones raciales históricamente inexactas en muchos resultados. una publicación de blogGoogle dijo que su modelo Imagen 3, que se anunció por primera vez en mayo, “comenzará a implementar imágenes de personas” para los usuarios de Gemini Advanced, Business y Enterprise en los “próximos días”. Pero recientemente se puso a disposición del público una versión de este modelo de Imagen, completo con capacidades de imágenes humanas. a través del entorno de pruebas de Gemini Labs sin una suscripción paga (aunque se requiere una cuenta de Google para iniciar sesión).

Este nuevo modelo viene con algunas salvaguardas para intentar evitar crear imágenes polémicas, por supuesto. Google escribe en su anuncio que no apoya “la generación de individuos fotorrealistas, identificables, representaciones de menores o escenas excesivamente sangrientas, violentas o sexuales”. preguntas frecuentesGoogle aclara que la prohibición de “individuos identificables” incluye “ciertas consultas que pueden conducir a resultados de personas importantes”. En las pruebas de Ars, esto significaba que una consulta como “El presidente Biden jugando baloncesto” sería rechazada, mientras que una solicitud más genérica de “un presidente de Estados Unidos jugando baloncesto” generaría múltiples opciones.

En algunas pruebas rápidas del nuevo sistema Imagen 3, Ars descubrió que evitaba muchos de los errores raciales “históricamente inexactos” ampliamente compartidos que llevaron a Google a pausar las imágenes humanas de Gemini en primer lugar. Al pedirle a Imagen 3 una “representación históricamente precisa de un rey británico”, por ejemplo, ahora se obtiene un conjunto de hombres blancos barbudos con túnicas rojas en lugar de la mezcla racialmente diversa de guerreros del modelo Géminis anterior a la ruptura. En la galería a continuación se pueden encontrar más ejemplos de antes y después del antiguo Gemini y el nuevo Imagen 3.

La imagen 3 imagina algunos papas estereotipados…

Google Imagen / Ars Técnica
…y la versión previa a la pausa de Gemini.
La imaginación de Imagen sobre un senador del siglo XIX…

Google Imagen / Ars Técnica
…y Géminis antes de la ruptura. La primera mujer fue elegida para el Senado en la década de 1920.
Versión de la Imagen 3 de los pescadores de hielo escandinavos…
…y la versión previa a la pausa de Gemini.
Versión de la Imagen 3 de una pareja de ancianos escoceses…

Google Imagen / Ars Técnica
…y la versión previa a las vacaciones de Gemini.
Versión de la Imagen 3 de un jugador de hockey canadiense…

Google Imagen / Ars Técnica
…y pausar previamente la versión Gemini.
Imagen 3 versión de un padre fundador genérico de EE. UU….

Google Imagen / Ars Técnica
…y la versión previa a las vacaciones de Gemini.
Los exploradores del Nuevo Mundo del siglo XV en la Imagen 3 parecen adecuadamente europeos.

Google Imagen / Ars Técnica

Sin embargo, algunos intentos de describir escenas históricas genéricas parecen entrar en conflicto con las reglas de inteligencia artificial de Google. Al pedir ilustraciones de “un soldado alemán de 1943”, a lo que Gemini respondió anteriormente que mostraba a asiáticos y negros con uniformes nazis, ahora les dice a los usuarios que “prueben con un mensaje diferente y verifiquen nuestras políticas de contenido”. Las solicitudes de imágenes de “antiguos filósofos chinos”, “un líder del sufragio femenino dando un discurso” y “un grupo de manifestantes no violentos” también condujeron al mismo mensaje de error en las pruebas de Ars.

“Por supuesto, como ocurre con cualquier herramienta de inteligencia artificial generativa, no todas las imágenes creadas por Gemini serán perfectas, pero continuaremos escuchando los comentarios de los primeros usuarios a medida que continuamos mejorando”, escribe la compañía en su blog. “Implementaremos esto gradualmente, con el objetivo de llevarlo pronto a más usuarios e idiomas”.

Imagen de listado de Google / Ars Technica

Emelina Bahena

“Introvertido. Solucionador de problemas. Aficionado total a la cultura pop. Estudiante independiente. Creador”.

DEJA UNA RESPUESTA Cancelar la respuesta

Emelina Bahena

"Introvertido. Solucionador de problemas. Aficionado total a la cultura pop. Estudiante independiente. Creador".

Ver todas las entradas

La MacBook Air Base M3 ofrece velocidades SSD significativamente más rápidas que antes

Tecnología

Cronica

Cronica

Google AI reintroduce imágenes humanas después de protestas por la precisión histórica

DEJA UNA RESPUESTA Cancelar la respuesta

Emelina Bahena

La MacBook Air Base M3 ofrece velocidades SSD significativamente más rápidas que antes

Sitio web del Ministerio de Salud brasileño golpeado por piratas informáticos, datos de vacunación específicos

Google habría dificultado la búsqueda de configuraciones de privacidad para los usuarios de teléfonos inteligentes

Apple TV agrega vista múltiple para deportes en vivo

Navigate

Pages

Google AI reintroduce imágenes humanas después de protestas por la precisión histórica

DEJA UNA RESPUESTA Cancelar la respuesta

Emelina Bahena

También podría gustarte

La MacBook Air Base M3 ofrece velocidades SSD significativamente más rápidas que antes

Sitio web del Ministerio de Salud brasileño golpeado por piratas informáticos, datos de vacunación específicos

Google habría dificultado la búsqueda de configuraciones de privacidad para los usuarios de teléfonos inteligentes

Apple TV agrega vista múltiple para deportes en vivo

Navigate

Pages