NotebookLM de Google ahora le permite guiar conversaciones de audio generadas por IA y lanza un piloto empresarial
Google actualizó el jueves la función de resumen de audio de su asistente de búsqueda y toma de notas NotebookLM AI, que recientemente ha ganado mucha atención por su tipo de podcast conversaciones de audio basadas en contenido compartido por los usuarios, con la capacidad de guiar estas conversaciones y centrarse en temas específicos, en lugar de simplemente generar resúmenes de audio holísticos.
Hoy en día, las resúmenes de audio en NotebookLM permiten a los usuarios digerir y comprender información en documentos o videos extensos a través de conversaciones de audio generadas por IA. Poco después de su lanzamiento el mes pasado, la función ayudó a NotebookLM a ganar atención, ya que muchos comenzaron a compartir resúmenes de audio de su contenido en las redes sociales, incluidos los creados con su diarios o diarios.
Si bien Google no reveló la tracción que recibió NotebookLM como resultado, los datos de la plataforma de análisis de tráfico del sitio webs similares sugiere que NotebookLM experimentó un aumento de más del 371% en su tráfico en septiembre, a 3,07 millones de visitas mensuales, frente a las 652.181 del mes anterior.
Hasta ahora, las resúmenes de audio generaban automáticamente conversaciones de IA a partir de las fuentes de los usuarios. Pero debido a que las conversaciones a veces giran en torno a contenido que no es importante, Google presenta una actualización que le permite personalizar las descripciones generales según sus necesidades. Esto permite a los usuarios hacer que el audio se centre más en un tema específico dentro de su contenido.
Un control dedicado «Personalizar» está disponible antes del botón «Generar» existente para permitirle proporcionar instrucciones a los anfitriones de IA en el audio para que se concentren en un punto específico.
Raiza Martin, líder de producto en NotebookLM y gerente senior de productos de IA en Google Labs, dijo a TechCrunch que la actualización brinda a los usuarios una forma de alentar a la IA a avanzar en la dirección que desean.
“Todo el equipo se ha dedicado a escuchar y analizar todos los comentarios que recibimos. Y la característica principal que surgió y que la gente quería era simplemente darle un pequeño empujón a la IA”, dijo.
Personalizar los resúmenes de audio también puede ayudar a reducir en cierta medida las alucinaciones, es decir, en esos momentos en los que la IA prepara el contenido por sí sola. Sin embargo, Martin dijo que el equipo de NotebookLM rastrea los comentarios de los usuarios e intenta detectar alucinaciones lo más rápido posible.
También enfatizó que personalizar los resúmenes de audio no significa que se utilizarán instrucciones del usuario para entrenar el modelo de IA.
“En general, no entrenamos en base a los datos de los usuarios. Entonces, su uso, o cualquier consulta que ingrese, cualquier respuesta que ingrese, no entrenamos a los modelos con eso”, dijo, y agregó: “Pedimos muchos comentarios de nuestros usuarios”.
Junto con la opción de personalización, los usuarios pueden escuchar en segundo plano en Audio Overviews. Esto le permite continuar trabajando en NotebookLM, consultar sus fuentes, recibir citas y explorar citas relevantes mientras el audio se reproduce en segundo plano.
NotebookLM se lanzó inicialmente como un proyecto en la conferencia de desarrolladores I/O de Google el año pasado y debutó para acceso público en los EE.UU. en diciembre. Se expandió a mercados como India, Reino Unido y más de 200 países en junio. Si bien el producto inicialmente tuvo cierta tracción en casos de uso de educación e investigación, las empresas y organizaciones solo comenzaron a experimentar con él después de que Google amplió su soporte a más fuentes y agregó nuevas funciones.
Ahora, Google dice que más de 80.000 organizaciones utilizan NotebookLM, lo que ve como una oportunidad para explorar la monetización. Con la esperanza de capitalizar esa tracción, la compañía lanzó el jueves el programa piloto NotebookLM Business.
Las empresas pueden inscribirse en el piloto y, si aceptan, según dijo Google, tendrán acceso temprano a las funciones del producto, capacitación y soporte por correo electrónico.
Martin le dijo a TechCrunch que en el piloto empresarial, su equipo capacita a las organizaciones interesadas en utilizar NotebookLM sobre cómo lo utilizan otras empresas.
«A nosotros [also] Queremos que las empresas nos digan que estas son las capacidades que queremos implementar”, dijo.
La disponibilidad general y los precios de NotebookLM Business se anunciarán más adelante este año. Sin embargo, Google aún debe revelar el cronograma exacto y los detalles sobre los niveles de precios.
NotebookLM recibe actualmente 4,17 millones de visitas mensuales, de las cuales 2,5 millones provienen de computadoras de escritorio y 1,6 millones de dispositivos móviles, según SimilarWeb.
Actualmente, el asistente no tiene una aplicación móvil dedicada y está disponible en múltiples pantallas a través de su sitio web. Sin embargo, Martin le dijo a TechCrunch que el equipo está explorando activamente una experiencia móvil nativa para expandir la presencia de NotebookLM entre los usuarios de teléfonos inteligentes. También está explorando más voces, idiomas y controles para descripciones generales de audio.
Además, el equipo exploró y creó prototipos de diferentes números de oradores, para ir más allá de los dos oradores existentes para debates de audio de IA, aunque no es probable que esté disponible pronto, ya que Martin dijo que no era la característica más solicitada por los usuarios.
El mes pasado, NotebookLM agregó videos y archivos de audio de YouTube como fuentes para generar resúmenes junto con fuentes existentes como Google Drive, URL, PDF y texto.
Martin dijo que NotebookLM considera los archivos PDF y los videos de YouTube como las dos fuentes principales. El equipo también observó un «porcentaje muy alto» de usuarios que escucharon una descripción general en audio y utilizaron el chat. El siguiente grupo más grande está formado por usuarios que sólo utilizan el chat sin generar una descripción general de audio.
«Introvertido. Solucionador de problemas. Aficionado total a la cultura pop. Estudiante independiente. Creador».