Tal y como pasó hace años con Linux frente a UNIX, los modelos de código abierto están llamados a facilitarnos la vida y sobre todo, a abrir un enorme mundo de posibilidades para los desarrolladores y por tanto, para los usuarios.
Meta acaba de presentar Llama 3.1 y los titulares alertan de la gran revolución que supone este lanzamiento, pero ¿por qué es tan importante?
Un modelo OPEN SOURCE (de código abierto) no es otra cosa que un software que se pone en manos de desarrolladores de forma gratuita. Por poner un ejemplo, si estáis familiarizados con las webs o tiendas online, un modelo open source sería WordPress o WooCommerce, mientras que Shopify tiene su propio código cerrado y nadie puede utilizarlo si no es pagando pero mucho menos modificarlo.
En el mundo de la Inteligencia Artificial existían modelos de código abierto pero eran bastante pobres (es fácil pensar que con la competencia tan feroz a la que están sometidas las grandes empresas de IA, el que tenía un modelo potente, como ChatGPT no lo facilitaba al público).
¿Qué tiene de especial la llegada de Llama 3.1?
Pues resumiendo mucho supone la llegada del primer asistente de código abierto pero muy, muy potente.
Mark Zukerberg cuenta en una carta los beneficios que puede tener, aunque son bastante evidentes.
Para los desarrolladores supone la capacidad de utilizar ese software para adaptar sus herramientas de IA, tener control sobre cómo se implementa, mejorar la gestión y protección de los datos y sobre todo una reducción de costes importantes, al no tener que depender de tecnología de pago.
Para el usuario supone una democratización del acceso a la IA, evitando que el poder se concentre en unas pocas manos.
Los modelos Open Source siempre se han criticado por tener menos seguridad pero en realidad al estar sometidos a muchas más revisiones, por lo que a veces es más fácil detectar agujeros de seguridad.
¿Y qué gana META? ¿Por qué lo hace?
Meta también obtiene beneficios de poner en manos del público su software de manera gratuita.
Pensemos que cualquier dispositivo de Apple tiene integrado ChatGPT y cualquier dispositivo de Microsoft tiene lógicamente Copilot.
OpenAI cedió de forma gratuita su IA a Apple y ya imaginaréis por qué: porque es la forma de que cualquier usuario de iOS se acostumbre a ChatGPT al tenerlo integrado que además se irá personalizando y adaptando a cada usuario, con lo que dará “pereza” cambiar de asistente una vez que tienes uno tan personalizado (cualquier usuario de iPhone sabe de lo que hablo cuando hemos intentado pasar a un móvil Android).
Hacer que LLaMa 3.1 sea open source asegura una buena cuota de mercado para META y lo más importante a la hora de mejorar estos modelos: muchos datos para entrenarlos y por tanto mejorarlos.
Vale, pero ¿por qué dices que LLAmA 3.1 es tan potente? ¿qué cambia?
Dentro de Llama 3.1 aparece el modelo 405B, que es el modelo de LLM de código abierto más potente hasta la fecha, en cuanto a conocimientos generales, rendimiento, matemáticas, uso de herramientas y traducción multilingüe.
Además abre el camino de la generación de datos sintéticos que no es otra cosa que crear datos artificiales (viendo la negativa de Europa a que entrene su IA con los datos de nuestras redes sociales esto tiene todo el sentido) y el entrenamiento de modelos más pequeños (que al utilizarlos menos gente tienen menos datos para entrenarse), así como la depuración de modelos. Casi nada 😉
Además del modelo de 405B han mejorado los modelos 8B y 70B que además de ser multilingües, tienen una longitud de contexto mucho mayor, de 128K y capacidades de razonamiento más potentes en general.
Ya están a disposición de la comunidad para su descarga en llama.meta.com y Hugging Face, pero, ahora viene la mala noticia, es que la extrema regulación europea y las cortapisas que le están poniendo a Meta con la protección de datos hace que a Europa todavía no llegue.
Otra prueba de que Europa se queda atrás en un momento como este 🙁