Mistral AI, una startup francesa de inteligencia artificial que recientemente recaudó una impresionante ronda de financiación inicial, ha presentado su primer modelo de lenguaje, y lo ha hecho accesible para todos de manera gratuita. Este movimiento no solo es un paso audaz en el mundo de la IA, sino que también plantea preguntas interesantes sobre el futuro de los modelos de lenguaje y su accesibilidad.
Un Modelo de Lenguaje para Todos
El modelo Mistral 7B no solo ha sido lanzado, sino que ha sido liberado bajo la licencia Apache 2.0, una de las más permisivas que existen. Esto significa que cualquier persona, desde un aficionado hasta una corporación multimillonaria, puede usar el modelo sin restricciones, siempre y cuando puedan ejecutarlo localmente o estén dispuestos a pagar por los recursos en la nube necesarios.
El modelo está disponible para descargar por varios medios, incluyendo un torrent de 13.4 gigabytes, y la compañía también ha iniciado un repositorio en GitHub y un canal de Discord para colaboración y resolución de problemas.
Mistral 7B: Pequeño pero Poderoso
Mistral 7B se presenta como una mejora de otros modelos de lenguaje grandes «pequeños» como Llama 2, ofreciendo capacidades similares (según algunos benchmarks estándar) pero a un costo computacional considerablemente menor. Aunque los modelos de fundación como GPT-4 pueden hacer mucho más, también son mucho más caros y difíciles de ejecutar, lo que los hace disponibles únicamente a través de APIs o acceso remoto.
El equipo de Mistral escribió en una publicación de blog que acompaña al lanzamiento del modelo: “Nuestra ambición es convertirnos en el principal defensor de la comunidad de IA generativa abierta y llevar los modelos abiertos al rendimiento del estado del arte”.
¿Verdaderamente Abierto?
Aunque Mistral 7B puede ser descargado y utilizado por todos, esto es muy diferente a ser «código abierto» o alguna variante de ese término. Aunque la licencia es altamente permisiva, el modelo en sí fue desarrollado de manera privada, utilizando dinero privado, y los conjuntos de datos y pesos también son privados.
El modelo de negocio de Mistral parece residir aquí: el modelo gratuito es libre de usar, pero si quieres profundizar, querrás su producto de pago. «[Nuestra oferta comercial] se distribuirá como soluciones de caja blanca, haciendo que tanto los pesos como los códigos fuente estén disponibles. Estamos trabajando activamente en soluciones alojadas y despliegue dedicado para empresas», se lee en la publicación del blog.
Conclusión
La liberación de Mistral 7B por parte de Mistral AI es un paso fascinante hacia la democratización del acceso a modelos de lenguaje de gran tamaño. Con la capacidad de ser utilizado por cualquier persona o entidad, abre nuevas posibilidades en el mundo de la IA y el procesamiento del lenguaje natural. Sin embargo, también plantea preguntas sobre la verdadera «apertura» de tales modelos y cómo las empresas que los desarrollan pueden equilibrar la accesibilidad con la necesidad de generar ingresos.