Aprendizaje automático 101: qué es y cómo funciona

Publicado: 2024-05-23

El aprendizaje automático (ML) se ha convertido rápidamente en una de las tecnologías más importantes de nuestro tiempo. Es la base de productos como ChatGPT, recomendaciones de Netflix, vehículos autónomos y filtros de spam de correo electrónico. Para ayudarle a comprender esta tecnología omnipresente, esta guía cubre qué es el aprendizaje automático (y qué no es), cómo funciona y su impacto.

Tabla de contenido

  • ¿Qué es el aprendizaje automático?
  • Cómo funciona el aprendizaje automático
  • Tipo de aprendizaje automático
  • Aplicaciones
  • Ventajas
  • Desventajas
  • El futuro del aprendizaje automático
  • Conclusión

¿Qué es el aprendizaje automático?

Para comprender el aprendizaje automático, primero debemos comprender la inteligencia artificial (IA). Aunque ambos se usan indistintamente, no son lo mismo. La inteligencia artificial es a la vez un objetivo y un campo de estudio. El objetivo es construir sistemas informáticos capaces de pensar y razonar a niveles humanos (o incluso sobrehumanos). La IA también consta de muchos métodos diferentes para llegar allí. El aprendizaje automático es uno de estos métodos, lo que lo convierte en un subconjunto de la inteligencia artificial.

El aprendizaje automático se centra específicamente en el uso de datos y estadísticas en la búsqueda de la IA. El objetivo es crear sistemas inteligentes que puedan aprender a partir de numerosos ejemplos (datos) y que no necesiten ser programados explícitamente. Con suficientes datos y un buen algoritmo de aprendizaje, la computadora detecta los patrones de los datos y mejora su rendimiento.

Por el contrario, los enfoques de IA que no son de ML no dependen de datos y tienen una lógica codificada escrita. Por ejemplo, podrías crear un robot de IA de tres en raya con un rendimiento sobrehumano simplemente codificando todos los movimientos óptimos (hay 255.168 posibles juegos de tres en raya, por lo que tardaría un poco, pero aún es posible). Sin embargo, sería imposible codificar un robot de ajedrez con inteligencia artificial: hay más juegos de ajedrez posibles que átomos en el universo. ML funcionaría mejor en tales casos.

Una pregunta razonable en este punto es: ¿cómo mejora exactamente una computadora cuando le das ejemplos?

Cómo funciona el aprendizaje automático

En cualquier sistema de ML, necesita tres cosas: el conjunto de datos, el modelo de ML (GPT es un ejemplo) y el algoritmo de entrenamiento. Primero, pasa ejemplos del conjunto de datos. Luego, el modelo predice el resultado correcto para ese ejemplo. Si el modelo es incorrecto, se utiliza el algoritmo de entrenamiento para que sea más probable que el modelo sea correcto para ejemplos similares en el futuro. Repite este proceso hasta que te quedas sin datos o estás satisfecho con los resultados. Una vez que complete este proceso, podrá utilizar su modelo para predecir datos futuros.

Un ejemplo básico de este proceso es enseñarle a una computadora a reconocer dígitos escritos a mano como los que se muestran a continuación.

Fuente

Recopilas miles o cientos de miles de imágenes de dígitos. Comienzas con un modelo de ML que aún no ha visto ningún ejemplo. Introduces las imágenes en el modelo y le pides que prediga qué número cree que hay en la imagen. Devolverá un número entre cero y nueve, digamos uno. Luego, básicamente le dices: "Este número es en realidad cinco, no uno". El algoritmo de entrenamiento actualiza el modelo, por lo que es más probable que responda con cinco la próxima vez. Repite este proceso para (casi) todas las imágenes disponibles e, idealmente, tiene un modelo de buen rendimiento que puede reconocer dígitos correctamente el 90% de las veces. Ahora puedes usar este modelo para leer millones de dígitos a escala más rápido que lo que podría hacerlo un humano. En la práctica, el Servicio Postal de Estados Unidos utiliza modelos ML para leer el 98% de las direcciones escritas a mano.

Podrías pasar meses o años analizando los detalles incluso de una pequeña parte de este proceso (mira cuántas versiones diferentes de algoritmos de optimización existen).

Tipos comunes de aprendizaje automático

En realidad, existen cuatro tipos diferentes de métodos de aprendizaje automático: supervisado, no supervisado, semisupervisado y de refuerzo. La principal diferencia es cómo se etiquetan sus datos (es decir, con o sin la respuesta correcta).

Aprendizaje supervisado

Los modelos de aprendizaje supervisado reciben datos etiquetados (con respuestas correctas). El ejemplo de los dígitos escritos a mano entra en esta categoría: podemos decirle al modelo: "Cinco es la respuesta correcta". El modelo tiene como objetivo aprender las conexiones explícitas entre las entradas y las salidas. Estos modelos pueden generar etiquetas discretas (p. ej., predecir “gato” o “perro” dada una imagen de una mascota) o números (p. ej., el precio previsto de una casa dada la cantidad de camas, baños, ubicación, etc.) .

Aprendizaje sin supervisión

Los modelos de aprendizaje no supervisados ​​reciben datos sin etiquetar (sin respuestas correctas). Estos modelos identifican patrones en los datos de entrada para agruparlos de manera significativa. Por ejemplo, dadas muchas imágenes de perros y gatos sin una respuesta correcta, el modelo ML no supervisado buscaría similitudes y diferencias en las imágenes para agrupar imágenes de perros y gatos. La agrupación, las reglas de asociación y la reducción de dimensionalidad son métodos centrales en el aprendizaje automático no supervisado.

Aprendizaje semisupervisado

El aprendizaje semisupervisado es un enfoque de aprendizaje automático que se encuentra entre el aprendizaje supervisado y el no supervisado. Este método proporciona una cantidad significativa de datos sin etiquetar y un conjunto más pequeño de datos etiquetados para entrenar el modelo. Primero, el modelo se entrena con los datos etiquetados y luego asigna etiquetas a los datos no etiquetados comparando su similitud con los datos etiquetados.

Aprendizaje reforzado

El aprendizaje por refuerzo no tiene un conjunto determinado de ejemplos y etiquetas. En cambio, al modelo se le asigna un entorno (por ejemplo, los juegos son comunes), una función de recompensa y una meta. El modelo aprende a lograr el objetivo mediante prueba y error. Realizará una acción y la función de recompensa le indica si la acción ayuda a lograr el objetivo general. Luego, el modelo se actualiza para realizar más o menos esa acción. El modelo puede aprender a lograr el objetivo haciendo esto muchas veces.

Un ejemplo famoso de modelo de aprendizaje por refuerzo es AlphaGo Zero. Este modelo fue entrenado para ganar juegos de Go y solo se le proporcionó el estado del tablero de Go. Luego jugó millones de partidas contra sí mismo, aprendiendo con el tiempo qué movimientos le daban ventajas y cuáles no. Logró un rendimiento de nivel sobrehumano en 70 horas de entrenamiento, por encima de los campeones del mundo de Go.

Aprendizaje autosupervisado

En realidad, existe un quinto tipo de aprendizaje automático que se ha vuelto importante recientemente: el aprendizaje autosupervisado. Los modelos de aprendizaje autosupervisados ​​reciben datos sin etiquetar, pero aprenden a crear etiquetas a partir de estos datos. Esto es la base de los modelos GPT detrás de ChatGPT. Durante el entrenamiento de GPT, el modelo tiene como objetivo predecir la siguiente palabra dada una cadena de palabras de entrada. Por ejemplo, tomemos la oración "El gato se sentó en la alfombra". A GPT se le asigna "The" y se le pide que prediga qué palabra viene a continuación. Hace su predicción (digamos, “perro”), pero como tiene la oración original, sabe cuál es la respuesta correcta: “gato”. Luego, a GPT se le da "El gato" y se le pide que prediga la siguiente palabra, y así sucesivamente. Al hacerlo, puede aprender patrones estadísticos entre palabras y más.

Aplicaciones del aprendizaje automático

Cualquier problema o industria que tenga muchos datos puede utilizar ML. Muchas industrias han obtenido resultados extraordinarios al hacerlo y constantemente surgen más casos de uso. A continuación se muestran algunos casos de uso comunes de ML:

Escribiendo

Los modelos de ML impulsan productos de escritura de IA generativa como Grammarly. Al estar capacitado en una gran cantidad de escritura excelente, Grammarly puede crear un borrador para usted, ayudarlo a reescribir y pulir, y generar ideas con usted, todo en su tono y estilo preferido.

Trabaja de forma más inteligente con Grammarly
El compañero de redacción de IA para cualquiera que tenga trabajo que hacer

Reconocimiento de voz

Siri, Alexa y la versión de voz de ChatGPT dependen de los modelos de ML. Estos modelos se entrenan con muchos ejemplos de audio, junto con las correspondientes transcripciones correctas. Con estos ejemplos, los modelos pueden convertir el habla en texto. Sin ML, este problema sería casi intratable porque todos tenemos diferentes formas de hablar y pronunciar. Sería imposible enumerar todas las posibilidades.

Recomendaciones

Detrás de sus feeds en TikTok, Netflix, Instagram y Amazon hay modelos de recomendación de ML. Estos modelos se entrenan con muchos ejemplos de preferencias (por ejemplo, a personas como a usted le gustó esta película más que aquella, este producto más que aquel) para mostrarle los elementos y el contenido que desea ver. Con el tiempo, los modelos también pueden incorporar sus preferencias específicas para crear un feed que le atraiga específicamente.

Detección de fraude

Los bancos utilizan modelos de ML para detectar fraudes con tarjetas de crédito. Los proveedores de correo electrónico utilizan modelos de aprendizaje automático para detectar y desviar el correo electrónico no deseado. Los modelos de fraude ML reciben muchos ejemplos de datos fraudulentos; Luego, estos modelos aprenden patrones entre los datos para identificar fraudes en el futuro.

Coches autónomos

Los vehículos autónomos utilizan ML para interpretar y navegar por las carreteras. ML ayuda a los automóviles a identificar peatones y carriles, predecir el movimiento de otros automóviles y decidir su próxima acción (por ejemplo, acelerar, cambiar de carril, etc.). Los vehículos autónomos ganan competencia entrenándose con miles de millones de ejemplos que utilizan estos métodos de aprendizaje automático.

Ventajas del aprendizaje automático

Cuando se hace bien, el aprendizaje automático puede ser transformador. Los modelos de ML generalmente pueden hacer que los procesos sean más baratos, mejores o ambas cosas.

Eficiencia de costos laborales

Los modelos de ML entrenados pueden simular el trabajo de un experto por una fracción del costo. Por ejemplo, un agente inmobiliario experto en humanos tiene una gran intuición cuando se trata de cuánto cuesta una casa, pero eso puede requerir años de capacitación. También es caro contratar agentes inmobiliarios expertos (y expertos de cualquier tipo). Sin embargo, un modelo de ML entrenado con millones de ejemplos podría acercarse al desempeño de un agente inmobiliario experto. Un modelo de este tipo podría entrenarse en cuestión de días y su uso costaría mucho menos una vez entrenado. Los agentes inmobiliarios con menos experiencia pueden utilizar estos modelos para realizar más trabajo en menos tiempo.

Eficiencia de tiempo

Los modelos de aprendizaje automático no están limitados por el tiempo de la misma manera que lo están los humanos. AlphaGo Zero jugó4,9 millones de partidasde Go en tres días de entrenamiento . A un ser humano le llevaría años, si no décadas, hacer esto. Gracias a esta escalabilidad, el modelo pudo explorar una amplia variedad de movimientos y posiciones de Go, lo que condujo a un rendimiento sobrehumano. Los modelos de aprendizaje automático pueden incluso detectar patrones que los expertos pasan por alto; AlphaGo Zero incluso encontró y utilizó movimientos que los humanos no suelen realizar. Sin embargo, esto no significa que los expertos ya no sean valiosos; Los expertos en Go han mejorado mucho al utilizar modelos como AlphaGo para probar nuevas estrategias.

Desventajas del aprendizaje automático

Por supuesto, el uso de modelos ML también tiene desventajas. Es decir, entrenarlos es costoso y sus resultados no son fácilmente explicables.

Entrenamiento costoso

La formación en aprendizaje automático puede resultar costosa. Por ejemplo, desarrollar AlphaGo Zero costó 25 millones de dólares y desarrollar GPT-4 costó más de 100 millones de dólares. Los principales costos para desarrollar modelos de ML son el etiquetado de datos, los gastos de hardware y los salarios de los empleados.

Los grandes modelos de aprendizaje automático supervisados ​​requieren millones de ejemplos etiquetados, cada uno de los cuales debe ser etiquetado por un humano. Una vez recopiladas todas las etiquetas, se necesita hardware especializado para entrenar el modelo. Las unidades de procesamiento de gráficos (GPU) y las unidades de procesamiento de tensor (TPU) son el estándar para el hardware de aprendizaje automático y pueden resultar costosas de alquilar o comprar; la compra de una GPU puede costar entre miles y decenas de miles de dólares.

Por último, desarrollar excelentes modelos de ML requiere contratar investigadores o ingenieros de aprendizaje automático, que pueden exigir salarios altos debido a sus habilidades y experiencia.

Claridad limitada en la toma de decisiones.

Para muchos modelos de ML, no está claro por qué dan los resultados que dan. AlphaGo Zero no puede explicar el razonamiento detrás de su toma de decisiones; sabe que un movimiento funcionará en una situación específica pero no sabepor qué. Esto puede tener consecuencias importantes cuando los modelos de ML se utilizan en situaciones cotidianas. Los modelos de aprendizaje automático utilizados en la atención sanitaria pueden dar resultados incorrectos o sesgados, y es posible que no lo sepamos porque la razón detrás de sus resultados es opaca. El sesgo, en general, es una gran preocupación en los modelos de aprendizaje automático, y la falta de explicabilidad hace que el problema sea más difícil de abordar. Estos problemas se aplican especialmente a los modelos de aprendizaje profundo. Los modelos de aprendizaje profundo son modelos de aprendizaje automático que utilizan redes neuronales de muchas capas para procesar la entrada. Son capaces de manejar datos y preguntas más complicados.

Por otro lado, los modelos de aprendizaje automático más simples y “superficiales” (como los árboles de decisión y los modelos de regresión) no adolecen de las mismas desventajas. Todavía requieren muchos datos, pero de lo contrario es barato entrenarlos. También son más explicables. La desventaja es que estos modelos pueden tener una utilidad limitada; Las aplicaciones avanzadas como GPT requieren modelos más complejos.

El futuro del aprendizaje automático

Los modelos de aprendizaje automático basados ​​en transformadores han estado de moda en los últimos años. Este es el tipo de modelo de ML específico que impulsa GPT (la T en GPT), Grammarly y Claude AI. También han recibido atención los modelos de aprendizaje automático basados ​​en difusión, que impulsan productos de creación de imágenes como DALL-E y Midjourney.

Esta tendencia no parece cambiar pronto. Las empresas de aprendizaje automático se centran en aumentar el tamaño de sus modelos: modelos más grandes que tienen mejores capacidades y conjuntos de datos más grandes para entrenarlos. GPT-4 tenía 10 veces más parámetros de modelo que GPT-3, por ejemplo. Es probable que veamos aún más industrias utilizar IA generativa en sus productos para crear experiencias personalizadas para los usuarios.

La robótica también se está calentando. Los investigadores están utilizando ML para crear robots que puedan moverse y utilizar objetos como los humanos. Estos robots pueden experimentar en su entorno y utilizar el aprendizaje por refuerzo para adaptarse rápidamente y alcanzar sus objetivos (por ejemplo, cómo patear un balón de fútbol).

Sin embargo, a medida que los modelos de aprendizaje automático se vuelven más poderosos y generalizados, surgen preocupaciones sobre su impacto potencial en la sociedad. Se están debatiendo acaloradamente cuestiones como los prejuicios, la privacidad y el desplazamiento laboral, y existe un reconocimiento cada vez mayor de la necesidad de directrices éticas y prácticas de desarrollo responsables.

Conclusión

El aprendizaje automático es un subconjunto de la IA, cuyo objetivo explícito es crear sistemas inteligentes permitiéndoles aprender de los datos. El aprendizaje supervisado, no supervisado, semisupervisado y reforzado son los principales tipos de ML (junto con el aprendizaje autosupervisado). El aprendizaje automático es el núcleo de muchos productos nuevos que aparecen hoy, como ChatGPT, vehículos autónomos y recomendaciones de Netflix. Puede ser más barato o mejor que el desempeño humano, pero al mismo tiempo es costoso inicialmente y menos explicable y controlable. El aprendizaje automático también está preparado para volverse aún más popular en los próximos años.

El aprendizaje automático presenta muchas complejidades y la oportunidad de aprender y contribuir en este campo se está ampliando. En particular, las guías de Grammarly sobre IA, aprendizaje profundo y ChatGPT pueden ayudarle a aprender más sobre otras partes importantes de este campo. Más allá de eso, profundizar en los detalles del ML (como cómo se recopilan los datos, cómo se ven realmente los modelos y los algoritmos detrás del "aprendizaje") puede ayudarlo a incorporarlo de manera efectiva en su trabajo.

Dado que el ML continúa creciendo y con la expectativa de que llegará a casi todas las industrias, ¡ahora es el momento de comenzar su viaje al ML!