Gemini Live ya ha consumido el Asistente de Googlecuerpo y alma. Ahora, la IA que te habla debería estar disponible para todos los usuarios a partir del martes. ISi no le importa un asistente de inteligencia artificial basado en teléfono, Microsoft es oferta características similares en Windows 11 a través de Copilot. Si estás ansioso por replicar la película de Spike Jonze Su con su teléfono o computadora, estos programas pueden ofrecerle su primera oportunidad, pero probablemente no la última, de tener demasiada intimidad con sus dispositivos.
Se puede acceder a Gemini Live en Android presionando prolongadamente el botón de encendido. En lugar de obtener el ícono del Asistente normal, los usuarios ahora verán aparecer el ícono de la estrella azul de Géminis. Gemini ya es capaz de entender lo que sucede en la pantalla si quieres hacer preguntas sobre un vídeo de YouTube que estás viendo. También es capaz de generar rápidamente imágenes de IA en cualquier aplicación de texto que estés usando actualmente. Google mostró por primera vez Gemini Live junto con su Línea de píxeles 9 en agosto, durante su Evento realizado por Google.
Anteriormente, Gemini Live solo estaba disponible para quienes pagaban por Gemini Advanced. Este servicio es gratuito durante el primer mes, pero después cuesta $20 por mes. Si mantienes presionado el botón de encendido, verás una ventana emergente con un ícono en la esquina inferior derecha que te permitirá usar Gemini Live. Debes aceptar un tutorial de una página y elegir una voz entre una selección de dialectos del inglés con sonidos masculinos y femeninos antes de comenzar a molestar tu teléfono con preguntas tontas.
Live ahora está disponible para todos los usuarios de Gemini en inglés en la aplicación de Android. No podemos esperar a que lo pruebes. https://t.co/jev4pnuZJ0
– Aplicación Google Géminis (@GeminiApp) 30 de septiembre de 2024
A través de la interfaz podrás hablar “naturalmente” por teléfono y no tendrás que preocuparte por errores de voz, frases extrañas o acentos que puedan haber molestado al Asistente de Google. Gemini Live debería tener acceso a una amplia variedad de tareas en su teléfono, incluida la interacción entre varias aplicaciones como mensajería y correo electrónico.
El martes, Microsoft declaró que Copilot está recibiendo actualizaciones importantes similares que le permitirán comprender lo que sucede en su pantalla. Esta función se llama Copilot Vision y, en la última actualización de Windows, reconocerá el texto o el video que estás viendo en la pantalla, lo que permitirá a los usuarios hacer más preguntas sobre ese contenido. O, como en el vídeo promocional de Microsoft, podrías tener una conversación muy incómoda sobre fotos de tu abuela con un chatbot de IA imperturbable e imperturbable.
“Tu abuela tiene un estilo tan atemporal”, le dice a Andrew la IA Copilot de Microsoft, sonando un tanto poco sincera, incluso para una IA. «Parece que ella es… uhh… una persona bastante extraordinaria».
Luego está Copilot Voice, una función similar a Gemini Live a la que se puede acceder desde su teléfono a través de la aplicación Copilot. En su blog, Microsoft mostró cómo se puede solicitar Copilot consejo sobre comprar aceites de oliva sofisticados. Desafortunadamente, no detalla los aspectos muy matizados de los aceites de oliva, sobre las importaciones, cómo las diferentes marcas pueden ser en realidad mezclas de exportaciones de varios países, sobre los tipos de aceites más utilizados para condimentar en lugar de cocinar.
También es necesario considerar las implicaciones de seguridad de ambas funciones de IA. Gemini Live enciende automáticamente el micrófono de su teléfono. Debe mantener presionados los botones Mantener o Finalizar o decir «Detener» para salir de la grabación automática. El procesamiento de Gemini se guarda en tu actividad de Gemini Apps y estas conversaciones se guardan durante 72 horas, según Google pagina de privacidad.
Microsoft dijo que Copilot Vision no guarda ningún dato en la nube ni en su computadora y «en el momento en que finaliza su sesión, los datos se descartan permanentemente». Para empezar, también funcionará con una lista limitada de sitios y no funcionará con ningún contenido contenido detrás de un muro de pago. Microsoft probablemente no quiera ser criticado nuevamente por sus malas decisiones en materia de privacidad, como lo hizo con Copiloto + recuperación o negociar con editores en línea y algunos miembros del congreso Molesto porque las grandes tecnológicas descartaron su contenido para desarrollar sus modelos de IA.
Tanto las funciones de Google como las de Microsoft son gratuitas, al menos por ahora. Copilot Voice se está implementando lentamente para los usuarios a partir del martes, pero Copilot Vision puede estar restringido a un número limitado de usuarios beta de Copilot Labs.