Cronica

Mundo completo de noticias

¿El rap de la Mona Lisa?  La nueva IA de Microsoft anima caras en fotos
Tecnología

¿El rap de la Mona Lisa? La nueva IA de Microsoft anima caras en fotos

I Ryu/Visual China Group/Getty Images

Se ve un letrero de Microsoft en la sede de la compañía el 19 de marzo de 2023 en Seattle, Washington.


Nueva York
cnn

Mona Lisa ahora puede hacer más que sonreír gracias a la nueva tecnología de inteligencia artificial de Microsoft.

La semana pasada, los investigadores de Microsoft detallaron un nuevo modelo de inteligencia artificial que desarrollaron y que puede tomar una imagen fija de una cara y un clip de audio de alguien hablando y crear automáticamente un video realista de esa persona hablando. Los vídeos, que pueden estar hechos a partir de rostros fotorrealistas, así como de dibujos animados o obras de arte, se completan con llamativas sincronizaciones de labios y movimientos naturales de la cara y la cabeza.

En un vídeo de demostración, los investigadores mostraron cómo animaron a la Mona Lisa para que recitara un rap cómico de la actriz Anne Hathaway.

Resultados del modelo de IA, llamados VASA-1, son divertidos y un poco impactantes en su realidad. Microsoft dijo que la tecnología podría usarse para educación o «mejorar la accesibilidad para personas con problemas de comunicación», o potencialmente para crear compañeros virtuales para humanos. Pero también es fácil ver cómo se puede abusar de la herramienta y utilizarla para hacerse pasar por personas reales.

Es una preocupación que va más allá de Microsoft: a medida que surgen más herramientas para crear imágenes, vídeos y audio atractivos generados por IA, los expertos se preocupan que su mal uso puede conducir a nuevas formas de desinformación. Algunos también temen que la tecnología pueda perturbar aún más las industrias creativas, desde el cine hasta la publicidad.

READ  Google Discover lanza una interfaz de usuario de tres columnas antes que Pixel Tablet

Por ahora, Microsoft dijo que no planea lanzar el modelo VASA-1 al público de inmediato. La medida es similar a la forma en que OpenAI, socio de Microsoft, está abordando las preocupaciones en torno a tu herramienta de vídeo generada por IASora: OpenAI se burló de Sora en febrero, pero hasta ahora solo lo ha puesto a disposición de algunos usuarios profesionales y profesores de ciberseguridad con fines de prueba.

«Nos oponemos a cualquier comportamiento que cree contenido engañoso o dañino de personas reales», dijeron investigadores de Microsoft en una publicación de blog. Pero, agregaron, la compañía «no tiene planes de lanzar» el producto públicamente «hasta que estemos seguros de que la tecnología se utilizará de manera responsable y de acuerdo con las regulaciones apropiadas».

El nuevo modelo de inteligencia artificial de Microsoft se entrenó en múltiples videos de los rostros de las personas mientras hablaban y está diseñado para reconocer los movimientos naturales de la cara y la cabeza, incluido «el movimiento de los labios, la expresión (sin labios), la mirada fija y el parpadeo, entre otros», dijeron los investigadores. . El resultado es un vídeo más realista cuando el VASA-1 anima una fotografía.

Por ejemplo, en un vídeo de demostración con un clip de alguien que parece agitado, aparentemente mientras juega videojuegos, la cara que habla tiene las cejas fruncidas y los labios fruncidos.

La herramienta de inteligencia artificial también se puede dirigir para producir un video en el que el sujeto mira en una dirección determinada o expresa una emoción específica.

Mirando de cerca, todavía hay signos de que los videos fueron generados por máquinas, como parpadeos poco frecuentes y movimientos exagerados de las cejas. Pero Microsoft dijo que cree que su modelo «supera significativamente» a otras herramientas similares y «allana el camino para interacciones en tiempo real con avatares realistas que emulan comportamientos conversacionales humanos».

READ  Microsoft Edge pronto incluirá una VPN integrada gratuita

DEJA UNA RESPUESTA

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

"Introvertido. Solucionador de problemas. Aficionado total a la cultura pop. Estudiante independiente. Creador".