Aprendizaje automático versus aprendizaje profundo: diferencias clave explicadas
Publicado: 2024-11-20Si bien el aprendizaje automático y el aprendizaje profundo a menudo se usan indistintamente, se refieren a dos subdominios de la inteligencia artificial. Representan enfoques diferentes (pero relacionados) del análisis de datos; El aprendizaje profundo es un subconjunto del aprendizaje automático. Las distinciones entre ellos son importantes y se vuelven especialmente relevantes cuando se comunica sobre temas técnicos, como al evaluar herramientas y servicios de análisis de datos, decidir qué enfoques adoptar para resolver un problema de datos o tener conversaciones profundas con ingenieros y expertos en el dominio.
Tabla de contenido:
- ¿Qué es el aprendizaje automático?
- ¿Qué es el aprendizaje profundo?
- Aprendizaje automático versus aprendizaje profundo
- Aplicaciones de ML y aprendizaje profundo
- Beneficios del ML y el aprendizaje profundo
- Desafíos del ML y el aprendizaje profundo
- Conclusión
¿Qué es el aprendizaje automático?
El aprendizaje automático (ML) es un subconjunto de la inteligencia artificial (IA). El nombre se refiere a todos los sistemas donde una máquina (generalmente una computadora o una combinación de computadoras) aplica técnicas matemáticas y estadísticas automáticas para descubrir o aprender patrones a partir de datos.
ML tiene como objetivo construir sistemas que sean inteligentes e independientes. Eso significa que aprenderá patrones y los mejorará a partir de los datos, con el objetivo de tener pocos componentes codificados y una interacción humana reducida. El campo del aprendizaje automático existe desde la década de 1960 y existe una gran cantidad de algoritmos y técnicas que se han desarrollado y estudiado desde entonces.
Tipos de aprendizaje automático
Muchos tipos diferentes de sistemas califican como ML. Estos son los más comunes:
- Los modelos de aprendizaje no supervisados utilizan datos no estructurados con poca o ninguna guía humana.
- Los modelos de aprendizaje supervisado requieren orientación y dependen de la aportación humana, incluida, por ejemplo, la aportación sobre el formato y la estructura de los datos.
- Los modelos semisupervisados reciben orientación de una pequeña cantidad de datos estructurados y luego utilizan los conocimientos de esos datos para perfeccionar su precisión en un conjunto más grande de datos no estructurados.
- Los modelos de refuerzo aprenden a tomar decisiones interactuando con su entorno. Estos modelos toman acciones, reciben retroalimentación positiva o negativa y luego ajustan el comportamiento para lograr el objetivo deseado.
- Los modelos autosupervisados crean sus propias etiquetas utilizando datos sin procesar y no estructurados.
¿Qué es el aprendizaje profundo?
Los avances recientes en ML provienen principalmente de un subconjunto especializado de ML conocido como aprendizaje profundo. El aprendizaje profundo se refiere al subconjunto de sistemas de aprendizaje automático que se implementan sobre un subconjunto de redes neuronales que se denominan redes neuronales profundas. Las redes neuronales profundas son redes neuronales grandes, fuertemente interconectadas y que tienen muchas capas de neuronas disponibles para su procesamiento.
Tipos de redes de aprendizaje profundo
Al igual que otras técnicas avanzadas de ML, los sistemas de aprendizaje profundo pueden aprender de forma supervisada o no supervisada. Se pueden construir con solo una o una combinación de dos o más arquitecturas de redes neuronales avanzadas. Algunas redes, como las redes neuronales de retroalimentación (FNN), solo mueven datos en una dirección entre capas de neuronas. Por el contrario, otras, como las redes neuronales recurrentes (RNN), pueden formar bucles internos y, como efecto secundario, comportarse como si tuvieran memoria.
Las arquitecturas avanzadas, como las redes neuronales convolucionales (CNN), estructuran cómo y cuándo se repiten partes de los datos en la entrada de una NN. Esto da pistas sobre en qué parte de los datos la red debería buscar relaciones.
Se pueden desarrollar múltiples redes neuronales en conjunto, y cada subred se especializa en un subconjunto del espacio del problema. Por ejemplo, las redes generativas adversarias (GAN) tienden a entrenar modelos que intentan competir entre sí (uno falsifica nuevos datos que deberían pertenecer a un conjunto de datos y el otro se entrena para detectar fraudes), y las arquitecturas de dos torres colaboran para aprender. sobre dos partes profundamente interconectadas, pero distintas, de un conjunto de datos.
También se suelen utilizar combinaciones de arquitecturas más complejas al crear sistemas de aprendizaje profundo. Estas arquitecturas pueden ampliarse utilizando estructuras neuronales especializadas, como transformadores y unidades rectificadoras, o emplearse para emular, implementar y mejorar otros sistemas de aprendizaje automático, como los árboles de decisión.
Aprendizaje automático versus aprendizaje profundo: diferencias clave
El aprendizaje profundo es un subconjunto del aprendizaje automático y tiene algunas limitaciones y ventajas específicas incorporadas. El aprendizaje automático es un término general y cubre una gama más amplia de opciones y compensaciones para analizar datos y detectar patrones dentro de ellos. Esta tabla resalta las diferencias. Encontrarás más detalles a continuación.
Aprendizaje automático (ML) | Aprendizaje profundo (DL) | |
Flexibilidad | General; un subconjunto de IA que abarca varias técnicas para aprender de los datos, con muchas opciones de implementación. | Implementado exclusivamente con redes neuronales; un subconjunto especializado de ML que se centra en redes neuronales profundas de muchas capas y técnicas que son adecuadas para ellas. |
Participación humana | Cubre toda la gama de algoritmos, desde aquellos que trabajan con datos estructurados y requieren un preprocesamiento humano significativo, hasta aquellos que pueden operar de forma totalmente independiente. | Normalmente se aplica a conjuntos de datos extremadamente grandes. Los modelos funcionan principalmente con datos no estructurados y tienen una menor dependencia del procesamiento y la curación humanos. |
Alcance | Alcance más amplio, incluidos algoritmos tradicionales como regresión lineal, árboles de decisión y agrupación. | Enfoque más limitado dentro del ML, especializado en el manejo de datos a gran escala y tareas complejas. |
Conceptos básicos de tecnología | Emplea una variedad de algoritmos como árboles de decisión, máquinas de vectores de soporte y métodos de conjunto. | Utiliza redes neuronales profundas con muchas capas y técnicas diseñadas específicamente para trabajar con redes neuronales, como el aprendizaje por refuerzo y la retropropagación. |
Áreas de aplicación | Todas y cada una de las áreas de aplicación donde se pueden utilizar algoritmos y computadoras para detectar automáticamente patrones en los datos. | Especializado para tareas que dependen del reconocimiento de patrones complejos a partir de grandes volúmenes de datos no estructurados, como análisis de texto e imágenes de propósito general, resolución de problemas del mundo real y tareas generativas. |
Interpretabilidad | Puede construirse de manera que sea fácil de entender e interpretar para los humanos. Se han estudiado durante mucho más tiempo y tienen propiedades bien conocidas. | Por lo general, es muy preciso, aunque se toman acciones que son mucho más difíciles de seguir y explicar para los humanos. |
Ejemplos | Detección de spam, sistemas de recomendación, segmentación de clientes. | Coches autónomos, asistentes virtuales (por ejemplo, Siri), sistemas de reconocimiento facial. |
El aprendizaje profundo depende de grandes conjuntos de datos
Las técnicas de aprendizaje profundo a menudo dependen de tener acceso a conjuntos de datos extremadamente grandes, mientras que los sistemas de aprendizaje automático pueden resultar útiles cuando hay pocos o ningún dato disponible. Además, si se dispone de aportes humanos capacitados y especializados, ML puede aprovecharlos de manera más explícita que cualquier sistema de aprendizaje profundo.
En general, los sistemas de ML cubren una gama más amplia de técnicas y presentan una gama de implementación más flexible. El aprendizaje profundo se centra exclusivamente en técnicas adecuadas para trabajar con grandes conjuntos de datos, como las redes neuronales profundas y sus algoritmos de soporte.
El aprendizaje automático puede ser más fácil de optimizar y comprender
Con su alcance mucho más amplio, el ML cubre muchos enfoques tradicionales y bien estudiados para el procesamiento de datos, como árboles de decisión, agrupamiento y muchos tipos de regresión. Con décadas dedicadas a su estudio, muchos de estos enfoques tienen un rendimiento integrado bien conocido y otras compensaciones.
Ofrecen implementaciones más flexibles que los sistemas de aprendizaje profundo dependientes de redes neuronales y pueden ser más eficientes en términos de recursos y costos. El aprendizaje profundo suele requerir muchos recursos y se sitúa en el extremo superior de la escala de costos.
El aprendizaje profundo es más potente y no tan general
Los sistemas de aprendizaje profundo son mejores para aplicaciones con un alcance y enfoque más limitados, por ejemplo, problemas con grandes cantidades de datos relacionados disponibles, tiempo suficiente para el entrenamiento prolongado de una red neuronal y cuando se prioriza la precisión de la ejecución sobre la capacidad de rastrear. exactamente qué está haciendo el sistema y por qué.
Los sistemas de aprendizaje automático se pueden aplicar a toda la gama de problemas en los que las máquinas pueden encontrar y aplicar automáticamente patrones en los datos, incluidos aquellos en los que hay menos datos disponibles, en los que los sistemas son fáciles de entender para los humanos y en los que la alta precisión es menos relevante.
Aplicaciones de ML y aprendizaje profundo
Los sistemas y aplicaciones de aprendizaje profundo y basados en ML se integran continuamente en cada vez más aspectos de nuestras vidas. A continuación se muestran algunos ejemplos conocidos.
Detección de spam
Una de las primeras aplicaciones de aprendizaje automático a gran escala fue detectar y filtrar mensajes de correo electrónico no deseado. El problema es ideal para el aprendizaje automático aplicado.
Hay grandes volúmenes de correos electrónicos y tienen una estructura bien definida. Es fácil marcar correos electrónicos no deseados como spam, por lo que no es difícil crear grandes conjuntos de datos de correos electrónicos marcados como "spam" o "ham" (ham es lo opuesto a spam). Se pueden construir fácilmente sistemas de clasificación a partir de estos datos y luego usarlos para filtrar rápidamente los correos electrónicos no deseados a escala de Internet.
La detección de spam es un ejemplo en el que los sistemas de aprendizaje profundo no son (todavía) tan adecuados para resolver como lo son las técnicas de aprendizaje automático más tradicionales. A pesar de las mejoras significativas, el tiempo y el costo necesarios para mantener los sistemas de aprendizaje profundo actualizados con los últimos avances en spam aún no compensan su mayor precisión. Los sistemas de aprendizaje profundo se pueden utilizar para optimizar los canales de ML en general, y los sistemas de capacitación de ML para la detección de spam a gran escala pueden integrarlos para ese propósito.
Sistemas de recomendación
Las tiendas de comercio electrónico, los servicios de transmisión de medios y los mercados en línea son solo algunos de los ejemplos de servicios que dependen de la capacidad de hacer recomendaciones sobre dónde deberían gastar su dinero los usuarios. Los sistemas de recomendación son otro ejemplo típico de un problema adecuado para el aprendizaje automático.
A medida que los usuarios consumen medios y compran en línea, los sistemas subyacentes pueden acumular grandes conjuntos de datos con señales claras (el usuario consumió versus el usuario no consumió). A este problema se pueden aplicar tanto el aprendizaje profundo como las técnicas de ML más tradicionales; Los sistemas de recomendación a gran escala utilizan combinaciones inteligentes de ambos tipos de algoritmos.
Coches que buscan caminos y se conducen solos
Los algoritmos tradicionales de aprendizaje automático no supervisados basados en técnicas de búsqueda de rutas bien conocidas, como el algoritmo de Dijkstra y el algoritmo A*, son los más adecuados para encontrar la mejor ruta entre dos puntos en un mapa de carreteras. Estos algoritmos pueden estudiar mapas, tráfico y otros datos de antemano, descubrir patrones, ajustarse en tiempo real en función de las condiciones del mundo real y funcionar bastante bien.
Sin embargo, cuando se trata de conducir un automóvil entre dos puntos, la cantidad y complejidad de la información a procesar es demasiado alta para que funcione cualquier técnica tradicional de ML. Los sistemas de conducción autónoma se construyen casi exclusivamente con técnicas de aprendizaje profundo.
Beneficios del ML y el aprendizaje profundo
Cuando se utilizan bien, el aprendizaje automático y los sistemas especializados de aprendizaje profundo son transformadores. Pueden aumentar los expertos humanos, haciendo que su producción sea más rápida, más impactante, menos costosa, de mayor calidad o una combinación de todo lo anterior.
Velocidad, escala y costo mejorados con ML
Los sistemas de aprendizaje automático pueden reemplazar parte o la totalidad del trabajo y los procesos de un experto, reduciendo el tiempo y la atención necesarios para completar una tarea. Como resultado, su trabajo se puede aplicar a una escala mucho mayor que antes.
Por ejemplo, un equipo de técnicos que evalúan las resonancias magnéticas en busca de anomalías podría evaluar cada uno seis exploraciones por hora, o alrededor de 200 por semana. Si el mismo equipo se concentrara en entrenar un conjunto de algoritmos de aprendizaje automático para realizar las partes más rutinarias de su análisis, los algoritmos podrían evaluar miles de exploraciones por resonancia magnética por semana, a una fracción del costo.
Mayor impacto y calidad con aprendizaje profundo
Cuando se aplican a problemas para los que los sistemas de aprendizaje profundo son adecuados, pueden aumentar los sistemas que incorporan ML y aumentar su calidad e impacto generales.
Siguiendo con el ejemplo anterior, los sistemas de aprendizaje profundo podrían aplicarse a condiciones con un volumen suficientemente grande de exploraciones por resonancia magnética. Si el volumen de escaneos es suficiente, y después de dedicar suficiente tiempo y recursos a desarrollar los sistemas de aprendizaje profundo, probablemente harán un mejor trabajo que los expertos a la hora de identificar el reducido conjunto de anomalías para las que han sido entrenados.
Luego, estos sistemas se pueden implementar a escala para lograr el máximo impacto, procesando exploraciones de resonancia magnética individuales a costos insignificantes. Los análisis de los técnicos de resonancia magnética y otros expertos pueden aumentar el rendimiento de los sistemas de aprendizaje profundo en casos inusuales o excepcionales, logrando una calidad combinada aún mayor.
Desafíos del ML y el aprendizaje profundo
Si bien muchos tipos de trabajo pueden beneficiarse enormemente del aprendizaje automático aplicado o del aprendizaje profundo, incorporar IA como estos en un sistema puede resultar difícil. Éstos son algunos de los desafíos y obstáculos más comunes que surgen.
La compensación entre costo y precisión
Los sistemas informáticos más grandes y costosos pueden ejecutar algoritmos de aprendizaje profundo y aprendizaje automático más avanzados, más rápido y a mayor escala. Como resultado, existe un equilibrio entre cuánto dinero se gasta en el sistema y qué tan efectivo es en términos de hardware y la contratación de expertos más talentosos para ensamblarlo. La utilización eficaz de recursos limitados en sistemas de aprendizaje profundo y aprendizaje automático requiere un cuidado considerable.
Una dependencia de grandes conjuntos de datos
El aprendizaje automático, en general, y el aprendizaje profundo en particular, dependen de tener acceso a grandes conjuntos de datos actualizados continuamente durante su fase de capacitación. Los algoritmos son tan buenos como la calidad y el volumen de datos con los que están entrenados. Gestionar grandes conjuntos de datos de forma eficaz es difícil y se necesita tiempo e ingenio para aplicar el aprendizaje automático de forma más eficaz a un conjunto de datos determinado.
El equilibrio entre precisión y claridad
Los sistemas de aprendizaje profundo se pueden entrenar para que sean extremadamente precisos, mucho más que otros sistemas de aprendizaje automático creados con parámetros equivalentes. La precisión tiene un costo; Los sistemas manipulan datos a una escala y utilizan algoritmos avanzados que son imposibles de entender para los humanos en un período de tiempo práctico.
Los algoritmos de ML más tradicionales se han estudiado durante mucho más tiempo, tienen características mejor definidas y se les puede inducir a funcionar de maneras que sean fáciles de entender para los humanos. Cualquier implementación de aprendizaje automático y aprendizaje profundo debe encontrar el equilibrio ideal entre precisión y claridad.
El equilibrio entre sesgo técnico y varianza
A medida que los sistemas de aprendizaje automático aumentan en la complejidad de los algoritmos, los recursos dedicados al entrenamiento y la cantidad de datos utilizados para el entrenamiento, pueden aprender cada vez más sobre las propiedades de sus datos de entrenamiento. Este fenómeno se llama sesgo (técnico); Los sistemas extremadamente sesgados serán muy precisos cuando vean datos similares a aquellos en los que fueron entrenados.
Un alto sesgo a menudo se produce a expensas de una variación demasiado baja: el sistema no reaccionará mucho ante datos nuevos que sean muy diferentes de los que vio en el entrenamiento. Los sistemas ideales, que son a la vez de bajo sesgo y baja varianza, son difíciles de construir. Encontrar el equilibrio correcto entre sesgo y varianza para una aplicación específica es más fácil para los algoritmos de ML tradicionales mejor estudiados y más establecidos. Puede resultar difícil lograrlo con los algoritmos de aprendizaje profundo más complejos.
Conclusión
Los sistemas de aprendizaje profundo son un subconjunto especializado de ML que aprovecha redes neuronales profundas de múltiples capas para abordar problemas complejos con grandes conjuntos de datos. Si bien ofrecen capacidades de procesamiento y precisión superiores, conllevan desventajas, como una interpretabilidad reducida, dependencia de una gran cantidad de datos y una flexibilidad de optimización limitada.
Por el contrario, los métodos tradicionales de aprendizaje automático suelen ser más rentables, más fáciles de implementar y proporcionan resultados más transparentes y predecibles. También son más sencillos de ajustar para tareas específicas. Ambos enfoques tienen distintas fortalezas y debilidades, y comprender sus aplicaciones y limitaciones es crucial para una implementación efectiva en escenarios del mundo real.