Los laboratorios de investigación de IA de Meta han creado un nuevo chatbot de última generación y permiten a los miembros del público chatear con el sistema para recopilar comentarios sobre sus funciones.
El bot se llama BlenderBot 3 y se puede acceder en la web. (Aunque por el momento parece que solo los residentes de EE. UU. pueden hacerlo). BlenderBot 3 es capaz de conversar en general, dice Meta, pero también de responder el tipo de preguntas que podría hacerle a un asistente digital, «desde hablar sobre recetas de alimentos saludables hasta encontrar amenidades para niños en la ciudad.”
El bot es un prototipo y se basa en Meta’s trabajo previo con lo que se conoce como modelos de lenguaje grande o LLMS, un software de generación de texto potente pero defectuoso, del cual GPT-3 de OpenAI es el ejemplo más conocido. Como todos los LLM, BlenderBot se entrena inicialmente en vastos conjuntos de datos de texto, que explota patrones estadísticos para generar lenguaje. Dichos sistemas han demostrado ser extremadamente flexibles y se han utilizado para una variedad de usos, desde generar código para programadores por ayudar a los autores a escribir su próximo éxito de ventas. Sin embargo, estos modelos también tienen serios defectos: regurgitar prejuicios en tus datos de entrenamiento y a menudo inventar respuestas a las preguntas de los usuarios (un gran problema si son útiles como asistentes digitales).
Este último problema es algo que Meta quiere probar específicamente con BlenderBot. Una gran característica del chatbot es que puede buscar en Internet para hablar sobre temas específicos. Aún más importante, los usuarios pueden hacer clic en sus respuestas para ver de dónde obtuvieron su información. BlenderBot 3, en otras palabras, puede citar sus fuentes.
Al lanzar el chatbot al público en general, Meta quiere recopilar comentarios sobre los diversos problemas que enfrentan los grandes modelos de lenguaje. Los usuarios que chatean con BlenderBot podrán marcar cualquier respuesta sospechosa del sistema, y Meta dice que ha trabajado duro para «minimizar el uso de lenguaje vulgar, insultos y comentarios culturalmente insensibles por parte de los bots». Los usuarios tendrán que optar por que se recopilen sus datos y, de ser así, sus conversaciones y comentarios serán almacenados y luego publicados por Meta para uso de la comunidad general de investigación de IA.
“Nos comprometemos a publicar todos los datos que recopilamos en la demostración con la esperanza de que podamos mejorar la IA conversacional”, dijo Kurt Shuster, ingeniero de investigación de Meta que ayudó a crear BlenderBot 3. Al borde.
Históricamente, lanzar prototipos de chatbots de IA al público ha sido un movimiento arriesgado para las empresas de tecnología. En 2016, Microsoft lanzó un chatbot llamado Tay en Twitter que aprendió de sus interacciones con el público. Como era de esperar, los usuarios de Twitter pronto entrenaron a Tay para regurgitar una serie de declaraciones racistas, antisemitas y misóginas. En respuesta, Microsoft desconectó el bot menos de 24 horas después.
Meta dice que el mundo de la IA ha cambiado mucho desde el mal funcionamiento de Tay y que BlenderBot tiene todo tipo de rieles de seguridad que deberían evitar que Meta repita los errores de Microsoft.
Crucialmente, dice Mary Williamson, gerente de ingeniería de investigación en Facebook AI Research (FAIR), mientras que Tay está diseñado para aprender en tiempo real de las interacciones del usuario, BlenderBot es un modelo estático. Esto significa que es capaz de recordar lo que dicen los usuarios en una conversación (e incluso conserva esta información a través de las cookies del navegador si un usuario abandona el programa y vuelve más tarde), pero estos datos solo se utilizarán para mejorar el sistema más adelante.
“Es solo mi opinión personal, pero eso [Tay] El episodio es relativamente desafortunado porque creó este invierno de chatbots en el que todas las instituciones tenían miedo de lanzar chatbots públicos para la investigación”, dice Williamson. Al borde.
Williamson dice que la mayoría de los chatbots que se usan hoy en día son limitados y están orientados a tareas. Piense en los bots de servicio al cliente, por ejemplo, que a menudo solo presentan a los usuarios un árbol de diálogo preprogramado, limitando su consulta antes de entregarla a un agente humano que realmente puede hacer el trabajo. El verdadero premio es construir un sistema que pueda llevar a cabo una conversación tan libre y natural como la de un humano, y Meta dice que la única forma de lograrlo es permitir que los bots tengan conversaciones naturales y libres.
“Esta falta de tolerancia hacia los bots que dicen cosas inútiles, en el sentido más amplio, es desafortunada”, dice Williamson. «Y lo que estamos tratando de hacer es publicar eso de manera muy responsable e impulsar la investigación».
Además de poner BlenderBot 3 en la web, Meta también está publicar el código subyacente, el conjunto de datos de entrenamiento y las variantes menores del modelo. Los investigadores pueden solicitar acceso al modelo más grande, que tiene 175 mil millones de parámetros, a través de un formulario aquí.
«Introvertido. Solucionador de problemas. Aficionado total a la cultura pop. Estudiante independiente. Creador».