Hay cuatro tipos principales de machine learning, en función de los datos que utiliza:
Aprendizaje supervisado (Supervised Learning)
Básicamente, es el que utiliza datos etiquetados.
Los datos etiquetados son conjuntos de datos que, además de contener la información (texto, imágenes, audio o registros numéricos), incluyen una etiqueta o respuesta asociada que indica el resultado esperado o la categoría correspondiente. Esa etiqueta actúa como una “guía” para el modelo durante el entrenamiento, ya que le permite comparar sus predicciones con el resultado correcto y ajustar sus parámetros en función del error.
Por ejemplo:
- En una imagen de un perro, la etiqueta sería “perro”.
- En un correo electrónico, la etiqueta podría ser “spam” o “no spam”.
- En un conjunto de registros médicos, la etiqueta podría ser “diabetes: sí” o “no”.
El aprendizaje supervisado es uno de los enfoques más comunes en machine learning. Los resultados, no cabe duda de que siempre serán mejores. El problema es que depende de que tengamos esos datos etiquetados para que el modelo aprenda a realizar tareas como clasificación, regresión o detección.
Por ejemplo, para clasificar correos como “spam” o “no spam”, el sistema se entrena con correos ya clasificados, ajustando sus parámetros (por ejemplo, mediante backpropagation) para predecir correctamente.
Aprendizaje no supervisado (Unsupervised Learning)
En este tipo de aprendizaje, el modelo busca patrones en datos que no están etiquetados, sin que exista una respuesta correcta como tal.
El modelo agrupa información e intenta extraer patrones o tendencias, sin necesidad de instrucciones previas.
Los resultados no se pueden comparar con nada, ni existe una única respuesta.
Es útil para explorar datos desconocidos, como identificar tendencias o detectar anomalías en grandes volúmenes de información, y se recurre a él cuando los datos que tenemos están sin etiquetar.
Aprendizaje por refuerzo (Reinforcement Learning)
El modelo aprende mediante prueba y error, recibiendo recompensas o penalizaciones según el resultado.
Técnicamente, se basa en una función de recompensa que evalúa el resultado de cada acción y en una política que decide qué hacer en cada momento.
Este tipo de aprendizaje equilibra dos cosas:
- Exploración (probar nuevas opciones)
- Explotación (utilizar lo que ya sabe que funciona)
Suele requerir algoritmos complejos como Q-learning o redes neuronales profundas, y hardware potente para procesar múltiples escenarios.
Es ideal para entornos dinámicos donde no hay datos etiquetados, pero las decisiones tienen consecuencias claras, como ocurre en robótica o en el campo de los videojuegos.
Aprendizaje federado
El aprendizaje federado no es exactamente un “tipo” de aprendizaje, sino una forma de entrenar modelos sin mover los datos a un servidor central, protegiendo así su privacidad.
Por ejemplo, el teclado de nuestro móvil puede aprender a predecir palabras directamente en nuestro dispositivo, sin enviar tus mensajes al servidor (porque ralentizaría mucho la tarea). Solo se envían los ajustes del modelo (llamados “pesos”), que luego se combinan con todos los demás para mejorar el modelo a nivel global.
En el contexto del aprendizaje automático (machine learning), los pesos son los valores numéricos que determinan cómo se combinan las entradas del modelo para obtener una salida y definen la importancia de cada dato en la predicción final.
Durante el entrenamiento del modelo, el algoritmo ajusta esos pesos para ir mejorando la precisión de sus predicciones.
El proceso (simplificado) sería así:
Datos locales: Los datos (tus mensajes o imágenes, por ejemplo) nunca salen de tu dispositivo.
Entrenamiento local: El modelo entrena directamente en el dispositivo (tu móvil, por ejemplo), con los datos que tiene en él.
Envío de ajustes: El dispositivo envía solo los pesos, no los datos reales.
Agregación: El servidor central combina los pesos recibidos desde miles de dispositivos.
Actualización: El modelo global se actualiza y se envía de nuevo a cada dispositivo, repitiendo el ciclo.
Este enfoque depende de técnicas de cifrado para proteger la privacidad, algoritmos de optimización similares a los del aprendizaje supervisado, y dispositivos con cierta capacidad de cálculo.
Los principales retos del aprendizaje federado incluyen coordinar millones de dispositivos, manejar datos muy variados (en nuestro ejemplo del móvil, por ejemplo, teclados en distintos idiomas), y minimizar el consumo recursos (en el ejemplo, de la batería del móvil).

