Las cuatro capas que determinan si un modelo de IA es realmente abierto

Las cuatro capas que determinan si un modelo de IA es realmente abierto

En el artículo anterior vimos que hablar de modelos “open source” en inteligencia artificial puede resultar engañoso. A diferencia del software tradicional, los modelos de IA no están formados únicamente por código, sino por varios componentes distintos que pueden publicarse o mantenerse cerrados.

Por esta razón, cuando analizamos el nivel de apertura de un modelo de inteligencia artificial, no basta con preguntar si es gratuito o si se puede utilizar. La verdadera cuestión es qué partes del sistema están disponibles y cuáles permanecen bajo control de la empresa que lo ha desarrollado.

En la práctica, la apertura de un modelo suele depender de cuatro elementos fundamentales: el código fuente, los pesos entrenados del modelo, los datos utilizados en el entrenamiento y la forma de acceso al sistema.

Cada uno de estos componentes representa una capa diferente de apertura.

Dependiendo de cuáles estén disponibles y cuáles no, el modelo puede ser completamente abierto, parcialmente abierto o completamente cerrado.

1. El código fuente

El código fuente es el conjunto de instrucciones que define la arquitectura del modelo y el proceso necesario para entrenarlo o ejecutarlo. En el caso de los modelos de lenguaje actuales, este código describe la estructura de la red neuronal, el funcionamiento de los algoritmos de entrenamiento y los procedimientos necesarios para realizar inferencias.

Podríamos compararlo con el plano de una máquina: describe cómo está construida y cómo debe funcionar.

Cuando el código fuente se publica, investigadores y desarrolladores pueden estudiarlo, modificarlo o utilizarlo como base para construir nuevos modelos. Plataformas como Hugging Face o GitHub se han convertido en repositorios habituales donde las empresas comparten este tipo de software.

Sin embargo, el hecho de que el código sea público no significa necesariamente que el modelo completo sea reproducible. Un modelo de inteligencia artificial puede compartir su arquitectura sin revelar otros elementos clave, como los pesos entrenados o los datos utilizados durante el entrenamiento.

Por esta razón, el código abierto es solo una parte de la apertura total de un modelo.

2. Los pesos del modelo

Los pesos son los valores numéricos que una red neuronal aprende durante el proceso de entrenamiento. Estos parámetros son el resultado de procesar enormes cantidades de datos y son los que permiten que el modelo realice tareas como generar texto, traducir idiomas o responder preguntas.

Sin estos pesos, el código del modelo sería simplemente una estructura vacía.

Publicar los pesos permite a otros usuarios ejecutar el modelo directamente o adaptarlo mediante técnicas como el fine-tuning, que consiste en ajustar el sistema para tareas específicas.

Este tipo de apertura se conoce normalmente como open weights.

Muchos modelos actuales se sitúan en este punto intermedio: comparten los pesos entrenados, pero no revelan los datos utilizados para generarlos ni el proceso completo de entrenamiento. Esto permite utilizar el modelo, pero dificulta comprender completamente cómo se ha construido o reproducirlo desde cero.

3. Los datos de entrenamiento

El tercer elemento clave son los datos utilizados durante el entrenamiento del modelo.

Los sistemas modernos de inteligencia artificial se entrenan con enormes colecciones de textos, imágenes o vídeos recopilados de diversas fuentes. Estos datasets influyen de forma directa en el comportamiento del modelo: determinan qué conocimientos incorpora, qué patrones aprende y qué sesgos puede reproducir.

Por esta razón, el acceso a los datos de entrenamiento es fundamental para auditar un sistema de inteligencia artificial.

Si los datos están disponibles, los investigadores pueden analizar su composición, detectar posibles sesgos y comprender mejor las limitaciones del modelo. También es posible utilizar esos datos para reproducir o mejorar el sistema.

Sin embargo, en la práctica la mayoría de las empresas no publican estos datasets.

Las razones suelen ser legales, económicas o técnicas. Los datos pueden incluir contenido protegido por derechos de autor, información sensible o material recopilado mediante procesos de scraping cuya distribución pública podría generar conflictos legales.

Como resultado, incluso muchos modelos considerados “abiertos” no comparten completamente sus datos de entrenamiento.

4. El acceso al modelo

Existe una cuarta capa de apertura que a menudo pasa desapercibida: la forma en que los usuarios pueden acceder al modelo.

Algunas empresas no publican ni el código, ni los pesos, ni los datos, pero permiten utilizar el sistema a través de una interfaz online o una API. Este es el caso de muchos de los modelos más conocidos del sector.

En este modelo de acceso, el usuario no descarga el sistema ni tiene control sobre él. En su lugar, envía solicitudes a servidores gestionados por la empresa desarrolladora, que procesa las consultas y devuelve las respuestas.

Este enfoque tiene varias ventajas: simplifica el uso del modelo, elimina la necesidad de hardware potente y permite a la empresa mantener el control sobre el sistema.

Pero también implica una dependencia total del proveedor. El usuario no puede modificar el modelo, auditar su funcionamiento ni garantizar que seguirá disponible en el futuro bajo las mismas condiciones.

Un espectro de apertura

Cuando combinamos estas cuatro capas —código, pesos, datos y acceso— obtenemos distintos grados de apertura.

Algunos modelos comparten prácticamente todos los elementos y permiten reproducir el sistema completo. Otros solo publican los pesos o el código. Y muchos no comparten nada, limitándose a ofrecer acceso a través de servicios online.

Por eso, en inteligencia artificial la apertura no es una categoría única, sino un continuo.

Comprender estas diferencias es fundamental para interpretar correctamente las afirmaciones que aparecen en la industria tecnológica cuando se habla de modelos abiertos.

En el próximo artículo veremos cómo estas capas de acceso dan lugar a distintos tipos de modelos: sistemas completamente cerrados, modelos de código abierto y una categoría intermedia cada vez más común conocida como open weights.