DeepSeek y el regreso de los modelos realmente abiertos

Durante años, el debate sobre la apertura de los modelos de inteligencia artificial ha estado dominado por una sensación creciente de ambigüedad. Muchas empresas han presentado sus sistemas como “abiertos”, pero en la práctica esos modelos solo compartían una parte limitada de su tecnología.

Algunos publicaban el código, pero no los pesos. Otros permitían descargar los pesos, pero imponían licencias restrictivas que limitaban su uso comercial. En muchos casos, los datos de entrenamiento permanecían completamente ocultos.

Este contexto hizo que el término open source comenzara a perder parte de su significado original dentro del sector de la inteligencia artificial.

La aparición de los modelos desarrollados por la empresa china DeepSeek reavivó este debate.

Cuando DeepSeek presentó sus modelos más avanzados, muchos analistas hablaron de un posible punto de inflexión en el equilibrio entre modelos cerrados y modelos abiertos.

Un lanzamiento que sorprendió a la industria

DeepSeek se dio a conocer internacionalmente con modelos como DeepSeek-V3 y DeepSeek-R1, sistemas de lenguaje de gran tamaño capaces de competir con algunos de los modelos más avanzados del sector.

Pero lo que realmente llamó la atención no fue únicamente su rendimiento.

Lo sorprendente fue la forma en que la empresa decidió publicarlos.

DeepSeek distribuyó el código y los pesos de sus modelos bajo una licencia MIT, una de las licencias open source más permisivas del ecosistema tecnológico. Esta licencia permite utilizar, modificar y redistribuir el software, incluso con fines comerciales, siempre que se mantenga el aviso de copyright original.

En la práctica, esto significa que cualquier desarrollador, empresa o investigador puede descargar el modelo, ejecutarlo en sus propios sistemas, adaptarlo a nuevas tareas o integrarlo en aplicaciones comerciales sin necesidad de solicitar permiso.

Este enfoque contrasta con el de muchas otras empresas que han optado por licencias más restrictivas o por mantener sus modelos completamente cerrados.

Acceso real a los modelos

Además de la licencia, DeepSeek puso a disposición del público los pesos completos de sus modelos.

Esto permite que los sistemas puedan descargarse y ejecutarse localmente, algo especialmente relevante para investigadores y empresas que quieren evitar depender de APIs externas.

Los modelos están disponibles en plataformas como GitHub y Hugging Face, lo que facilita enormemente su distribución dentro de la comunidad tecnológica.

Para muchos desarrolladores, esto significa que pueden experimentar con modelos de gran escala sin tener que pagar por cada consulta o depender de infraestructuras controladas por una empresa externa.

Una startup, por ejemplo, podría integrar el modelo directamente en su propio producto, adaptarlo mediante técnicas de fine-tuning o utilizarlo como base para desarrollar nuevos sistemas especializados.

Lo que sigue sin estar abierto

A pesar de esta apertura, DeepSeek tampoco comparte todos los elementos del sistema.

Como ocurre con la mayoría de los modelos actuales, los datos completos utilizados durante el entrenamiento no se han publicado. Las empresas suelen evitar hacerlo debido a cuestiones legales relacionadas con derechos de autor, privacidad o la complejidad técnica de gestionar datasets de enorme tamaño.

Esto significa que, aunque los modelos de DeepSeek son mucho más abiertos que muchos de sus competidores, todavía no permiten reproducir completamente el proceso de entrenamiento desde cero.

En otras palabras, incluso los modelos más abiertos de la industria siguen teniendo ciertas limitaciones.

Un cambio en el equilibrio del sector

La estrategia de DeepSeek ha tenido un impacto importante en el debate sobre el futuro de la inteligencia artificial.

Durante los últimos años, muchos de los modelos más potentes del sector han sido desarrollados por empresas que mantienen sus sistemas bajo control propietario. Esto ha generado preocupaciones sobre la concentración de poder tecnológico en un pequeño número de compañías.

La aparición de modelos avanzados con licencias realmente abiertas introduce un elemento nuevo en este equilibrio.

Si sistemas de alto rendimiento pueden publicarse bajo licencias permisivas, investigadores, startups e incluso gobiernos pueden desarrollar aplicaciones propias sin depender exclusivamente de proveedores externos.

Este tipo de apertura también puede acelerar la innovación, ya que permite que miles de desarrolladores experimenten con el modelo, identifiquen mejoras y construyan nuevas herramientas sobre esa base.

El debate continúa

A pesar del entusiasmo que han generado estos lanzamientos, el debate sobre la apertura de los modelos de inteligencia artificial está lejos de resolverse.

Algunas empresas argumentan que una apertura total puede facilitar usos maliciosos o dificultar el control sobre tecnologías cada vez más potentes. Otras sostienen que la transparencia es fundamental para garantizar la seguridad, la investigación científica y la competencia tecnológica.

En este contexto, los modelos como los desarrollados por DeepSeek representan una alternativa interesante dentro del ecosistema actual.

No son completamente abiertos en todos los aspectos, pero muestran que es posible publicar sistemas avanzados con un grado de accesibilidad mucho mayor que el que ofrecen muchos de los modelos comerciales dominantes.

En el próximo artículo veremos cómo estas diferencias de apertura influyen en la práctica en una pregunta muy concreta: qué tipo de modelo conviene utilizar en función del proyecto que queremos construir.

DeepSeek y el regreso de los modelos realmente abiertos

DeepSeek y el regreso de los modelos realmente abiertos

Un lanzamiento que sorprendió a la industria

Acceso real a los modelos

Lo que sigue sin estar abierto

Un cambio en el equilibrio del sector

El debate continúa

AI insider