La startup francesa de IA Mistral ha lanzado sus primeros modelos de IA generativa diseñados para ejecutarse en dispositivos de vanguardia como portátiles y teléfonos.
La nueva familia de plantillas, que Mistral llama “Les Ministraux”, se puede utilizar o modificar para una variedad de aplicaciones, desde la generación de texto básico hasta trabajar en conjunto con plantillas más capaces para completar tareas.
Hay dos modelos de Les Ministraux disponibles: Ministral 3B y Ministral 8B, ambos con una ventana de contexto de 128.000 tokens, lo que significa que pueden consumir aproximadamente el tamaño de un libro de 50 páginas.
«Nuestros clientes y socios más innovadores han solicitado cada vez más inferencias locales que prioricen la privacidad para aplicaciones críticas como traducción en dispositivos, asistentes inteligentes sin Internet, análisis locales y robótica autónoma», dijo Mistral. el escribe en una publicación de blog. «Les Ministraux se creó para proporcionar una solución computacional eficiente y de baja latencia para estos escenarios».
Ministral 8B está disponible para descargar desde hoy, aunque estrictamente con fines de investigación. Mistral exige a los desarrolladores y empresas interesadas en las configuraciones de autoimplementación Ministral 8B o Ministral 3B que se comuniquen con él para obtener una licencia comercial.
De lo contrario, los desarrolladores podrán utilizar Ministral 3B y Ministral 8B a través de la plataforma en la nube de Mistral, Le Platforme, y otras nubes con las que la startup se ha asociado en las próximas semanas. Ministral 8B cuesta 10 centavos por millón de tokens de salida/entrada (~750.000 palabras), mientras que Ministral 3B cuesta 4 centavos por millón de tokens de salida/entrada.
Últimamente ha habido una tendencia hacia modelos pequeños, que son más baratos y más rápidos de entrenar, ajustar y operar que sus homólogos más grandes. Google sigue añadiendo modelos a su familia Gemma de modelos pequeños, mientras que Microsoft ofrece su fi colección de plantillas. En la última actualización de su suite Llama, Meta presentó varios modelos pequeños optimizados para hardware de alta gama.
Mistral afirma que Ministral 3B y Ministral 8B superan a los modelos Llama y Gemma comparables, así como a su propio Mistral 7B, en varios puntos de referencia de IA diseñados para evaluar el seguimiento de instrucciones y las capacidades de resolución de problemas.
Mistral, con sede en París, que recientemente recaudó 640 millones de dólares en capital de riesgo, continúa ampliando gradualmente su cartera de productos de IA. En los últimos meses, la compañía lanzó un servicio gratuito para que los desarrolladores prueben sus plantillas, un SDK para permitir a los clientes modificar esas plantillas y nuevos modelos incluyendo un modelo de código generativo llamado Codestral.
Cofundada por ex alumnos de Meta y DeepMind de Google, la misión declarada de Mistral es crear modelos emblemáticos que rivalicen con los modelos de mejor rendimiento actuales, como el GPT-4o de OpenAI y el Claude de Anthropic, e, idealmente, ganar dinero en el proceso. Si bien la parte de “ganar dinero” está demostrando ser un desafío (como lo es para la mayoría de las nuevas empresas de IA generativa), Mistral según cabe suponer comenzó a generar ingresos este verano.
«Introvertido. Solucionador de problemas. Aficionado total a la cultura pop. Estudiante independiente. Creador».