Cronica

Mundo completo de noticias

Veo de Google genera vídeos de 1080p impulsados ​​por IA de más de un minuto de duración
Tecnología

Veo de Google genera vídeos de 1080p impulsados ​​por IA de más de un minuto de duración

Google ha anunciado un nuevo e innovador modelo de inteligencia artificial llamado «Veo» que se hará cargo de la generación de videos, adaptado a las visiones creativas de los usuarios. Google también está actualizando su modelo de imagen, llevándolo a su tercera generación en Imagen 3.

Bard fue una de nuestras primeras experiencias con los LLM de IA modernos en Google. Esta versión se lanzó hace aproximadamente un año y en los últimos meses se han producido grandes cambios en la plataforma. Uno de los cambios más importantes fue un cambio completo de nombre, cambiando el nombre de la herramienta de inteligencia artificial orientada al usuario a Gemini, que ahora se ha extendido a toda la línea de productos de la compañía con Gemini Nano en dispositivos actuales y futuros y Gemini Pro.

Justo antes de que se cambiara el nombre de Bard a Gemini, Google agregó la capacidad de solicitar imágenes a través del modelo de conversación de IA. Si pides una foto de una vaca en un barco, obtendrás precisamente eso, en el estilo que consideres adecuado. Este proceso fue desarrollado por Imagen 2, que fue la primera versión disponible públicamente.

Plantilla Google Veo

Hoy Google anuncia dos modelos de generación creativa, Veo e Imagen 3. Veo es el más interesante, ya que es algo que el público aún no ha podido experimentar. El modelo está diseñado específicamente para la generación de vídeo que comprende la semántica visual y el lenguaje natural, de forma similar a otros modelos modernos. Este enfoque llevado a la generación de videos ofrece resultados que pueden adaptarse creativamente para adaptarse a ciertos estilos.

READ  La disputa en línea aumenta por las advertencias de la policía después de la actualización del software iOS 17.1

Google señala que el modelo Veo podrá comprender «términos cinematográficos» en las instrucciones del usuario, como tomas aéreas y formatos de lapso de tiempo. Veo es capaz de generar vídeos en 1080p que pueden durar más de un minuto, lo que supera a modelos actuales como el Sora de OpenAI, con una duración máxima de 60 segundos.

Veo se basa en años de nuestro trabajo con modelos de vídeo generativo, incluidos Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet y Lumiere, combinando arquitectura, leyes de escala y otras técnicas innovadoras para mejorar el resultado. calidad y resolución.

Google está invitando a creadores y cineastas a probar Veo para darle forma al modelo de modo que pueda adaptarse a una amplia variedad de estilos artísticos y casos de uso.

Imagen 3

El modelo Imagen también está recibiendo una actualización sustancial. Imagen 3 se posiciona como el modelo de conversión de texto a imagen de “más alta calidad” de Google y ofrece algunas mejoras con respecto al modelo Imagen 2 que vimos en Gemini y Bard.

Se dice que Imagen 3 aporta un mayor nivel de detalle en las imágenes, sin tantos artefactos visuales e impurezas en las imágenes generadas. Las imágenes son más fotorrealistas y realistas cuando se solicita.

Quizás la mayor mejora es la capacidad de Imagen 3 para representar texto. Esto se ha convertido en una debilidad cómica de los modelos de conversión de texto a imagen como DALL-E y Adobe Firefly. Google posiciona el nuevo modelo como una forma de crear imágenes personalizadas con texto, como tarjetas de felicitación o fotografías con mensajes. Queda por ver qué tan bien representa el texto, pero es una mejora prometedora.

READ  Google hizo un ícono más accesible para Chrome

Tanto Veo como Imagen 3 estarán disponibles para su uso en una vista previa privada a través de Google Labs VideoFX. VideoFX utilizará SynthID para garantizar que el contenido creado tenga una marca de agua digital y se genere de manera responsable.

Cualquiera que quiera echar un vistazo a los nuevos modelos puede apuntarse a través de la lista de espera de Google.

FTC: utilizamos enlaces de afiliados automotrices para generar ingresos. Más.

DEJA UNA RESPUESTA

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

"Introvertido. Solucionador de problemas. Aficionado total a la cultura pop. Estudiante independiente. Creador".