Aprendizaje supervisado: qué es y cómo funciona
Publicado: 2024-07-03Desde el reconocimiento de imágenes hasta el filtrado de spam, descubra en esta guía informativa cómo el aprendizaje supervisado impulsa muchas de las aplicaciones de IA que encontramos a diario.
Tabla de contenido
- ¿Qué es el aprendizaje supervisado?
- Aprendizaje supervisado versus no supervisado
- Cómo funciona el aprendizaje supervisado
- Tipos de aprendizaje supervisado
- Aplicaciones del aprendizaje supervisado
- Ventajas del aprendizaje supervisado
- Desventajas del aprendizaje supervisado
¿Qué es el aprendizaje supervisado?
El aprendizaje supervisado es un tipo de aprendizaje automático (ML) que entrena modelos utilizando datos etiquetados con la respuesta correcta. El términosupervisadosignifica que estas etiquetas brindan una guía clara sobre la relación entre entradas y salidas. Este proceso ayuda al modelo a realizar predicciones precisas sobre datos nuevos e invisibles.
El aprendizaje automático es un subconjunto de la inteligencia artificial (IA) que utiliza datos y métodos estadísticos para construir modelos que imitan el razonamiento humano en lugar de depender de instrucciones codificadas. El aprendizaje supervisado adopta un enfoque guiado y basado en datos para identificar patrones y relaciones en conjuntos de datos etiquetados. Extrapola sus evaluaciones para predecir resultados a partir de datos nuevos e invisibles. Aprende comparando sus predicciones con las etiquetas conocidas y ajustando su modelo para minimizar los errores.
Aprendizaje supervisado versus no supervisado
A diferencia del aprendizaje supervisado, que utiliza datos etiquetados, el aprendizaje no supervisado encuentra patrones en datos no etiquetados.
Sin la "supervisión" proporcionada por las respuestas correctas explícitas en los datos de entrenamiento, el aprendizaje no supervisado trata todo lo que ve como datos para analizar en busca de patrones y agrupaciones. Los tres tipos principales son:
- Agrupación:esta técnica agrupa los puntos de datos más adyacentes entre sí. Es útil para la segmentación de clientes o la clasificación de documentos.
- Asociación: determinar cuándo las cosas tienden a ocurrir simultáneamente, en particular para ubicar elementos que se compran juntos con frecuencia o sugerir qué transmitir a continuación.
- Reducción de dimensionalidad: Reducir los conjuntos de datos para que sean más fáciles de procesar y al mismo tiempo preservar todos o la mayoría de los detalles.
Por otro lado, el aprendizaje supervisado tiene sentido cuando se quiere que el modelo tome decisiones. Las principales aplicaciones incluyen:
- Decisiones de sí o no:Marcar datos como una clase u otra. A menudo se utiliza para filtrar spam o detectar fraudes.
- Clasificación: averiguar a cuál de varias clases pertenece algo, como identificar objetos dentro de una imagen o reconocer el habla.
- Regresión: predicción de valores continuos basados en datos históricos, como la previsión de precios de la vivienda o las condiciones climáticas.
Otros tipos de ML se sitúan entre estos dos: aprendizaje semisupervisado, de refuerzo y autosupervisado.
Cómo funciona el aprendizaje supervisado
El aprendizaje supervisado implica un proceso estructurado de elección y formato de datos, ejecución del modelo y prueba de su rendimiento.
A continuación se ofrece una breve descripción general del proceso de aprendizaje supervisado:
1 Etiquetado:Los datos etiquetados son esenciales para aprender la asociación correcta entre entradas y salidas. Por ejemplo, si está creando un modelo para analizar el sentimiento en las reseñas de productos, comience haciendo que evaluadores humanos lean las reseñas y las marquen como positivas, negativas o neutrales.
2 Recopilación y limpieza de datos:asegúrese de que sus datos de capacitación sean completos y representativos. Limpie los datos eliminando duplicados, corrigiendo errores y manejando los valores faltantes para prepararlos para el análisis.
3 Selección y extracción de características:identifique y seleccione los atributos más influyentes, haciendo que el modelo sea más eficiente y efectivo. Este paso también puede implicar la creación de nuevas funciones a partir de las existentes para capturar mejor los patrones subyacentes en los datos, como convertir la fecha de nacimiento en edad.
4 División de datos:divida el conjunto de datos en conjuntos de entrenamiento y prueba. Utilice el conjunto de entrenamiento para entrenar el modelo y el conjunto de prueba para ver qué tan bien se generaliza a datos nuevos e invisibles.
5 Selección de algoritmo:elija un algoritmo de aprendizaje supervisado según la tarea y las características de los datos. También puede ejecutar y comparar varios algoritmos para encontrar el mejor.
6 Entrenamiento del modelo:entrene el modelo utilizando los datos para mejorar su precisión predictiva. Durante esta fase, el modelo aprende la relación entre entradas y salidas minimizando iterativamente el error entre sus predicciones y las etiquetas reales proporcionadas en los datos de entrenamiento. Dependiendo de la complejidad del algoritmo y del tamaño del conjunto de datos, esto podría tardar desde segundos hasta días.
7 Evaluación del modelo:evaluar el rendimiento del modelo garantiza que produzca predicciones confiables y precisas sobre nuevos datos. Esta es una diferencia clave con el aprendizaje no supervisado: dado que conoce el resultado esperado, puede evaluar qué tan bien se desempeñó el modelo.
8 Ajuste del modelo:ajuste y vuelva a entrenar los parámetros del modelo para ajustar el rendimiento. Este proceso iterativo, llamado ajuste de hiperparámetros, tiene como objetivo optimizar el modelo y evitar problemas como el sobreajuste. Este proceso debe repetirse después de cada ajuste.
9 Implementación y monitoreo:implemente el modelo entrenado para hacer predicciones sobre nuevos datos en un entorno del mundo real. Por ejemplo, implemente el modelo de detección de spam capacitado para filtrar correos electrónicos, monitorear su rendimiento y realizar ajustes según sea necesario.
10 Ajustes a lo largo del tiempo:a medida que recopile más datos del mundo real, continúe entrenando el modelo para que sea más preciso y relevante.
Tipos de aprendizaje supervisado
Hay dos tipos principales de aprendizaje supervisado: clasificación y regresión. Cada tipo tiene sus propios subtipos y casos de uso específicos. Explorémoslos con más detalle:
Clasificación
La clasificación implica predecir a qué categoría o clase pertenece una entrada. Se utilizan varios subtipos y conceptos para manejar diferentes problemas de clasificación. Aquí hay algunos tipos populares:
- Clasificación binaria:el modelo predice una de dos clases posibles. Esto es útil cuando el resultado es binario, lo que significa que sólo hay dos estados o categorías posibles. Este enfoque se utiliza en decisiones donde se necesita una distinción clara.
- Clasificación multiclase: Como binaria, pero con más de dos opciones para las cuales solo hay una respuesta correcta. Este enfoque se utiliza cuando hay varias categorías a las que puede pertenecer una entrada.
- Clasificación de etiquetas múltiples: cada entrada puede pertenecer a múltiples clases simultáneamente. A diferencia de la clasificación binaria o de clases múltiples, donde cada entrada se asigna a una sola clase, la clasificación de etiquetas múltiples permite asignar múltiples etiquetas a una sola entrada. Este es un análisis más complejo porque en lugar de simplemente elegir la clase a la que es más probable que pertenezca la entrada, es necesario decidir un umbral de probabilidad de inclusión.
- Regresión logística: una aplicación de la regresión (ver más abajo) a la clasificación binaria. Este enfoque puede indicarle la confianza de su predicción en lugar de simplemente esto o aquello.
Hay varias formas de medir la calidad de un modelo de clasificación, entre ellas:
- Precisión:¿Cuántas del total de predicciones fueron correctas?
- Precisión:¿Cuántos de los aspectos positivos son realmente positivos?
- Recuerde:¿cuántos de los aspectos positivos reales marcó como positivos?
- Puntuación F1:en una escala del 0% al 100%, ¿qué tan bien equilibra el modelo la precisión y la recuperación?
Regresión
La regresión implica predecir un valor continuo en función de las características de entrada y generar un número que también se puede llamar predicción. Se utilizan varios tipos de modelos de regresión para capturar las relaciones entre estas características de entrada y la salida continua. Aquí hay algunos tipos populares:
- Regresión lineal:modela la relación entre las características de entrada y la salida como una línea recta. El modelo supone una relación lineal entre la variable dependiente (la salida) y las variables independientes (las entradas). El objetivo es encontrar la línea que mejor se ajuste a través de los puntos de datos y que minimice la diferencia entre los valores previstos y reales.
- Regresión polinómica: más compleja que la regresión lineal porque utiliza polinomios como el cuadrado y el cubo para capturar relaciones más complejas entre las variables de entrada y salida. El modelo puede ajustarse a datos no lineales utilizando estos términos de orden superior.
- Regresión de cresta y lazo: aborda el problema del sobreajuste, que es la tendencia de un modelo a leer demasiado en los datos en los que está entrenado a expensas de generalizar. La regresión de cresta reduce la sensibilidad del modelo a pequeños detalles, mientras que la regresión de lazo elimina de la consideración características menos importantes.
La mayoría de las mediciones de la calidad de la regresión tienen que ver con qué tan alejadas están las predicciones de los valores reales. Las preguntas que responden son:
- Error absoluto medio:en promedio, ¿a qué distancia están las predicciones de los valores reales?
- Error cuadrático medio:¿Cuánto crecen los errores cuando los errores más grandes son más significativos?
- Error cuadrático medio: ¿En qué medida los errores grandes hacen que las predicciones se desvíen de los valores reales?
- R cuadrado: ¿Qué tan bien se ajusta la regresión a los datos?
Aplicaciones del aprendizaje supervisado
El aprendizaje supervisado tiene una amplia gama de aplicaciones en diversas industrias. A continuación se muestran algunos ejemplos comunes:
- Detección de spam:los servicios de correo electrónico utilizan una clasificación binaria para decidir si un correo electrónico debe llegar a su bandeja de entrada o enviarse a spam. Mejoran continuamente en respuesta a las personas que marcan los correos electrónicos en la carpeta de spam como no spam, y viceversa.
- Reconocimiento de imágenes:los modelos se entrenan con imágenes etiquetadas para reconocer y categorizar objetos. Los ejemplos incluyen la función Face ID de Apple, que desbloquea su tableta o dispositivo móvil, el reconocimiento óptico de caracteres (OCR) para convertir palabras impresas en texto digital y la detección de objetos para vehículos autónomos.
- Diagnóstico médico:los modelos supervisados pueden predecir enfermedades y sugerir diagnósticos potenciales utilizando datos de pacientes y registros médicos. Por ejemplo, se pueden entrenar modelos para reconocer tumores cancerosos en resonancias magnéticas o desarrollar planes de control de la diabetes.
- Detección de fraude:las instituciones financieras utilizan el aprendizaje supervisado para identificar transacciones fraudulentas mediante el análisis de patrones en los datos de transacciones etiquetados.
- Análisis de sentimientos:ya sea que midan reacciones o emociones positivas o negativas como la felicidad o el disgusto, los conjuntos de datos etiquetados manualmente informan a los modelos para interpretar entradas como publicaciones en redes sociales, reseñas de productos o resultados de encuestas.
- Mantenimiento predictivo:basándose en datos históricos de rendimiento y factores ambientales, los modelos pueden predecir cuándo es probable que fallen las máquinas para que puedan repararse o reemplazarse antes de que lo hagan.
Ventajas del aprendizaje supervisado
- Preciso y predecible.Suponiendo que se les haya proporcionado buenos datos, los modelos de aprendizaje supervisado tienden a ser más precisos que otros métodos de aprendizaje automático. Los modelos más simples suelen ser deterministas, lo que significa que una entrada determinada siempre producirá el mismo resultado.
- Objetivo claro. Gracias a la supervisión, usted sabe lo que su modelo intenta lograr. Este es un claro contraste con el aprendizaje no supervisado y el autosupervisado.
- Fácil de evaluar. Hay varias medidas de calidad a su disposición para juzgar la precisión de los modelos de clasificación y regresión.
- Interpretable. Los modelos supervisados utilizan técnicas, como regresiones y árboles de decisión, que son relativamente sencillas de entender para los científicos de datos. La interpretabilidad mejora la confianza de quienes toman decisiones, especialmente en entornos de alto impacto e industrias reguladas.
Desventajas del aprendizaje supervisado
- Requiere datos etiquetados.Sus datos deben tener entradas y etiquetas claras. Esto suele ser un desafío para la capacitación en clasificación, con miles (si no millones) de personas empleadas para anotar datos manualmente.
- Errores y juicios inconsistentes en los datos de entrenamiento. El etiquetado humano conlleva falacias humanas, como errores, errores tipográficos y opiniones diferentes. Este último es un aspecto particularmente desafiante del análisis de sentimientos; Los datos de entrenamiento de sentimientos de alta calidad generalmente requieren que varias personas evalúen un punto de datos determinado y se registre un resultado solo si hay acuerdo.
- Sobreajuste. A menudo, un modelo generará cálculos que funcionan muy bien para los datos de entrenamiento, pero mal con datos que aún no ha visto. Un entrenador cuidadoso siempre buscará sobreajustes y utilizará técnicas para reducir el impacto.
- Restringido a patrones conocidos. Si su modelo de predicción del precio de las acciones se basa únicamente en datos de un mercado alcista, no será muy preciso una vez que llegue un mercado bajista. En consecuencia, sea sensible a las limitaciones de los datos que le ha mostrado a su modelo y considere si desea encontrar datos de entrenamiento que lo expongan a más circunstancias o simplemente ignorar su resultado.