Machine Learning 101 : qu'est-ce que c'est et comment ça marche
Publié: 2024-05-23L’apprentissage automatique (ML) est rapidement devenu l’une des technologies les plus importantes de notre époque. Il sous-tend des produits tels que ChatGPT, les recommandations Netflix, les voitures autonomes et les filtres anti-spam. Pour vous aider à comprendre cette technologie omniprésente, ce guide explique ce qu'est le ML (et ce qu'il n'est pas), comment il fonctionne et son impact.
Table des matières
- Qu’est-ce que l’apprentissage automatique ?
- Comment fonctionne l'apprentissage automatique
- Type d'apprentissage automatique
- Applications
- Avantages
- Désavantages
- L'avenir du ML
- Conclusion
Qu’est-ce que l’apprentissage automatique ?
Pour comprendre l’apprentissage automatique, nous devons d’abord comprendre l’intelligence artificielle (IA). Bien que les deux soient utilisés de manière interchangeable, ils ne sont pas identiques. L’intelligence artificielle est à la fois un objectif et un domaine d’étude. L’objectif est de construire des systèmes informatiques capables de penser et de raisonner à des niveaux humains (voire surhumains). L’IA comprend également de nombreuses méthodes différentes pour y parvenir. L’apprentissage automatique est l’une de ces méthodes, ce qui en fait un sous-ensemble de l’intelligence artificielle.
L’apprentissage automatique se concentre spécifiquement sur l’utilisation de données et de statistiques dans le cadre de l’IA. L'objectif est de créer des systèmes intelligents capables d'apprendre en étant alimentés par de nombreux exemples (données) et qui n'ont pas besoin d'être explicitement programmés. Avec suffisamment de données et un bon algorithme d’apprentissage, l’ordinateur détecte les modèles présents dans les données et améliore ses performances.
En revanche, les approches non-ML de l'IA ne dépendent pas des données et ont une logique codée en dur. Par exemple, vous pouvez créer un robot IA tic-tac-toe avec des performances surhumaines en codant simplement tous les mouvements optimaux (il existe 255 168 parties de morpion possibles, donc ça prendrait du temps, mais c'est toujours possible). Il serait cependant impossible de coder en dur un robot d’échecs IA : il y a plus de parties d’échecs possibles que d’atomes dans l’univers. ML fonctionnerait mieux dans de tels cas.
Une question raisonnable à ce stade est la suivante : comment exactement un ordinateur s’améliore-t-il lorsque vous lui donnez des exemples ?
Comment fonctionne l'apprentissage automatique
Dans tout système ML, vous avez besoin de trois éléments : l'ensemble de données, le modèle ML (GPT est un exemple) et l'algorithme de formation. Tout d’abord, vous transmettez des exemples de l’ensemble de données. Le modèle prédit ensuite le bon résultat pour cet exemple. Si le modèle est erroné, vous utilisez l'algorithme d'entraînement pour rendre le modèle plus susceptible d'être correct pour des exemples similaires à l'avenir. Vous répétez ce processus jusqu'à ce que vous manquiez de données ou que vous soyez satisfait des résultats. Une fois ce processus terminé, vous pouvez utiliser votre modèle pour prédire les données futures.
Un exemple simple de ce processus consiste à apprendre à un ordinateur à reconnaître des chiffres manuscrits comme ceux ci-dessous.
Source
Vous collectez des milliers, voire des centaines de milliers d’images de chiffres. Vous commencez avec un modèle ML qui n’a encore vu aucun exemple. Vous introduisez les images dans le modèle et lui demandez de prédire quel nombre il pense être dans l'image. Il renverra un nombre compris entre zéro et neuf, disons un un. Ensuite, vous lui dites essentiellement : « Ce nombre est en fait cinq, pas un. » L'algorithme d'entraînement met à jour le modèle, il est donc plus susceptible de répondre avec cinq la prochaine fois. Vous répétez ce processus pour (presque) toutes les images disponibles et, idéalement, vous disposez d’un modèle performant, capable de reconnaître correctement les chiffres dans 90 % des cas. Vous pouvez désormais utiliser ce modèle pour lire des millions de chiffres à grande échelle plus rapidement qu'un humain ne le pourrait. En pratique, le service postal des États-Unis utilise des modèles ML pour lire 98 % des adresses manuscrites.
Vous pourriez passer des mois ou des années à disséquer les détails, même pour une infime partie de ce processus (regardez combien il existe de versions différentes d'algorithmes d'optimisation).
Types courants d’apprentissage automatique
Il existe en fait quatre types différents de méthodes d’apprentissage automatique : supervisé, non supervisé, semi-supervisé et par renforcement. La principale différence réside dans la manière dont leurs données sont étiquetées (c'est-à-dire avec ou sans la bonne réponse).
Enseignement supervisé
Les modèles d'apprentissage supervisé reçoivent des données étiquetées (avec des réponses correctes). L’exemple des chiffres manuscrits entre dans cette catégorie : nous pouvons dire au modèle : « Cinq est la bonne réponse ». Le modèle vise à apprendre les connexions explicites entre les entrées et les sorties. Ces modèles peuvent produire soit des étiquettes discrètes (par exemple, prédire « chat » ou « chien » à partir de l'image d'un animal de compagnie) ou des chiffres (par exemple, le prix prévu d'une maison en fonction du nombre de lits, de bains, de l'emplacement, etc.) .
Apprentissage non supervisé
Les modèles d'apprentissage non supervisés reçoivent des données non étiquetées (sans réponses correctes). Ces modèles identifient des modèles dans les données d'entrée pour regrouper les données de manière significative. Par exemple, étant donné de nombreuses images de chats et de chiens sans réponse correcte, le modèle ML non supervisé examinerait les similitudes et les différences entre les images pour regrouper les images de chiens et de chats. Le clustering, les règles d'association et la réduction de dimensionnalité sont des méthodes essentielles du ML non supervisé.
Apprentissage semi-supervisé
L'apprentissage semi-supervisé est une approche d'apprentissage automatique qui se situe entre l'apprentissage supervisé et non supervisé. Cette méthode fournit une quantité importante de données non étiquetées et un ensemble plus petit de données étiquetées pour entraîner le modèle. Tout d’abord, le modèle est entraîné sur les données étiquetées, puis il attribue des étiquettes aux données non étiquetées en comparant leur similarité avec les données étiquetées.
Apprentissage par renforcement
L'apprentissage par renforcement n'a pas d'ensemble donné d'exemples et d'étiquettes. Au lieu de cela, le modèle se voit attribuer un environnement (par exemple, les jeux sont courants), une fonction de récompense et un objectif. Le modèle apprend à atteindre l'objectif par essais et erreurs. Il effectuera une action et la fonction de récompense lui indiquera si l'action contribue à atteindre l'objectif primordial. Ensuite, le modèle se met à jour pour effectuer plus ou moins cette action. Le modèle peut apprendre à atteindre l’objectif en faisant cela plusieurs fois.
Un exemple célèbre de modèle d’apprentissage par renforcement est AlphaGo Zero. Ce modèle a été entraîné pour gagner des parties de Go et n'a reçu que l'état du plateau de Go. Il a ensuite joué des millions de parties contre lui-même, apprenant au fil du temps quels mouvements lui donnaient des avantages et lesquels ne lui donnaient pas d'avantages. Il a réalisé des performances surhumaines en 70 heures d’entraînement, au-dessus des champions du monde de Go.
Apprentissage auto-supervisé
Il existe en fait un cinquième type d’apprentissage automatique qui est devenu important récemment : l’apprentissage auto-supervisé. Les modèles d'apprentissage auto-supervisés reçoivent des données non étiquetées mais apprennent à créer des étiquettes à partir de ces données. Cela sous-tend les modèles GPT derrière ChatGPT. Lors de la formation GPT, le modèle vise à prédire le mot suivant à partir d'une chaîne de mots d'entrée. Par exemple, prenons la phrase « Le chat était assis sur le tapis ». GPT reçoit « Le » et est invité à prédire quel mot viendra ensuite. Il fait sa prédiction (disons « chien »), mais comme il possède la phrase originale, il sait quelle est la bonne réponse : « chat ». Ensuite, GPT reçoit « Le chat » et est invité à prédire le mot suivant, et ainsi de suite. Ce faisant, il peut apprendre des modèles statistiques entre les mots et bien plus encore.
Applications de l'apprentissage automatique
Tout problème ou secteur disposant de nombreuses données peut utiliser le ML. De nombreux secteurs ont obtenu des résultats extraordinaires, et de plus en plus de cas d’utilisation se présentent constamment. Voici quelques cas d’utilisation courants du ML :
En écrivant
Les modèles ML alimentent des produits d’écriture d’IA générative comme Grammarly. En étant formé sur de grandes quantités d'écritures de qualité, Grammarly peut créer un brouillon pour vous, vous aider à réécrire et peaufiner, et réfléchir à des idées avec vous, le tout dans le ton et le style que vous préférez.
Reconnaissance de la parole
Siri, Alexa et la version vocale de ChatGPT dépendent tous des modèles ML. Ces modèles sont formés sur de nombreux exemples audio, ainsi que sur les transcriptions correctes correspondantes. Avec ces exemples, les modèles peuvent transformer la parole en texte. Sans ML, ce problème serait presque insoluble car chacun a des façons différentes de parler et de prononcer. Il serait impossible d'énumérer toutes les possibilités.
Recommandations
Derrière vos flux sur TikTok, Netflix, Instagram et Amazon se trouvent des modèles de recommandation ML. Ces modèles sont formés sur de nombreux exemples de préférences (par exemple, des personnes comme vous ont aimé tel film plutôt que tel film, tel produit plutôt que tel produit) pour vous montrer les éléments et le contenu que vous souhaitez voir. Au fil du temps, les modèles peuvent également intégrer vos préférences spécifiques pour créer un flux qui vous intéresse spécifiquement.
Détection de fraude
Les banques utilisent des modèles ML pour détecter la fraude par carte de crédit. Les fournisseurs de messagerie utilisent des modèles ML pour détecter et détourner les courriers indésirables. Les modèles Fraud ML reçoivent de nombreux exemples de données frauduleuses ; ces modèles apprennent ensuite des modèles parmi les données pour identifier les fraudes à l'avenir.
Voitures autonomes
Les voitures autonomes utilisent ML pour interpréter et naviguer sur les routes. ML aide les voitures à identifier les piétons et les voies de circulation, à prédire le mouvement des autres voitures et à décider de leur prochaine action (par exemple, accélérer, changer de voie, etc.). Les voitures autonomes acquièrent des compétences en s'entraînant sur des milliards d'exemples à l'aide de ces méthodes de ML.
Avantages de l'apprentissage automatique
Lorsqu’il est bien fait, le ML peut être transformateur. Les modèles ML peuvent généralement rendre les processus moins chers, meilleurs, ou les deux.
Efficacité des coûts de main d'œuvre
Les modèles ML formés peuvent simuler le travail d’un expert pour une fraction du coût. Par exemple, un agent immobilier expert en humains a une grande intuition en ce qui concerne le coût d’une maison, mais cela peut prendre des années de formation. Les agents immobiliers experts (et les experts de toute sorte) coûtent également cher à embaucher. Cependant, un modèle ML formé sur des millions d’exemples pourrait se rapprocher des performances d’un agent immobilier expert. Un tel modèle pourrait être formé en quelques jours et coûterait beaucoup moins cher une fois formé. Les agents immobiliers moins expérimentés peuvent alors utiliser ces modèles pour effectuer plus de travail en moins de temps.
L'efficacité du temps
Les modèles ML ne sont pas limités par le temps de la même manière que les humains. AlphaGo Zero a joué4,9 millions de partiesde Go en trois jours d'entraînement . Cela prendrait des années, voire des décennies, à un être humain. Grâce à cette évolutivité, le modèle a pu explorer une grande variété de mouvements et de positions de Go, conduisant à des performances surhumaines. Les modèles ML peuvent même détecter des modèles manqués par les experts ; AlphaGo Zero a même trouvé et utilisé des mouvements qui ne sont généralement pas joués par les humains. Cela ne signifie pas pour autant que les experts n’ont plus de valeur ; Les experts Go se sont beaucoup améliorés en utilisant des modèles comme AlphaGo pour essayer de nouvelles stratégies.
Inconvénients de l'apprentissage automatique
Bien entendu, l’utilisation de modèles ML présente également des inconvénients. En effet, leur formation coûte cher et leurs résultats ne sont pas faciles à expliquer.
Formation coûteuse
La formation ML peut coûter cher. Par exemple, AlphaGo Zero a coûté 25 millions de dollars à développer et GPT-4 a coûté plus de 100 millions de dollars à développer. Les principaux coûts de développement de modèles ML sont l’étiquetage des données, les dépenses en matériel et les salaires des employés.
Les bons modèles de ML supervisé nécessitent des millions d’exemples étiquetés, dont chacun doit être étiqueté par un humain. Une fois toutes les étiquettes collectées, un matériel spécialisé est nécessaire pour entraîner le modèle. Les unités de traitement graphique (GPU) et les unités de traitement tensoriel (TPU) sont la norme pour le matériel ML et peuvent être coûteuses à louer ou à acheter : les GPU peuvent coûter entre des milliers et des dizaines de milliers de dollars à l'achat.
Enfin, développer d’excellents modèles de ML nécessite l’embauche de chercheurs ou d’ingénieurs en apprentissage automatique, qui peuvent exiger des salaires élevés en raison de leurs compétences et de leur expertise.
Clarté limitée dans la prise de décision
Pour de nombreux modèles ML, on ne sait pas pourquoi ils donnent les résultats qu’ils donnent. AlphaGo Zero ne peut pas expliquer le raisonnement derrière sa prise de décision ; il sait qu'une démarche fonctionnera dans une situation spécifique mais ne sait paspourquoi. Cela peut avoir des conséquences importantes lorsque les modèles ML sont utilisés dans des situations quotidiennes. Les modèles ML utilisés dans le domaine de la santé peuvent donner des résultats incorrects ou biaisés, et nous ne le savons peut-être pas car la raison derrière leurs résultats est opaque. Le biais, en général, est une préoccupation majeure avec les modèles ML, et un manque d'explicabilité rend le problème plus difficile à résoudre. Ces problèmes s’appliquent particulièrement aux modèles d’apprentissage profond. Les modèles d'apprentissage profond sont des modèles de ML qui utilisent des réseaux neuronaux à plusieurs couches pour traiter les entrées. Ils sont capables de gérer des données et des questions plus complexes.
En revanche, les modèles ML plus simples et plus « superficiels » (tels que les arbres de décision et les modèles de régression) ne souffrent pas des mêmes inconvénients. Ils nécessitent toujours beaucoup de données, mais leur formation est autrement peu coûteuse. Ils sont également plus explicables. L’inconvénient est que l’utilité de ces modèles peut être limitée ; les applications avancées comme GPT nécessitent des modèles plus complexes.
L'avenir de l'apprentissage automatique
Les modèles ML basés sur des transformateurs ont fait fureur ces dernières années. Il s'agit du type de modèle ML spécifique qui alimente GPT (le T dans GPT), Grammarly et Claude AI. Les modèles ML basés sur la diffusion, qui alimentent les produits de création d'images comme DALL-E et Midjourney, ont également retenu l'attention.
Cette tendance ne semble pas vouloir changer de sitôt. Les sociétés de ML se concentrent sur l’augmentation de la taille de leurs modèles : des modèles plus gros dotés de meilleures capacités et des ensembles de données plus volumineux sur lesquels les former. GPT-4 avait 10 fois plus de paramètres de modèle que GPT-3, par exemple. Nous verrons probablement encore plus d’industries utiliser l’IA générative dans leurs produits pour créer des expériences personnalisées pour les utilisateurs.
La robotique s’échauffe également. Les chercheurs utilisent le ML pour créer des robots capables de déplacer et d’utiliser des objets comme les humains. Ces robots peuvent expérimenter dans leur environnement et utiliser l’apprentissage par renforcement pour s’adapter rapidement et atteindre leurs objectifs, par exemple comment taper dans un ballon de football.
Cependant, à mesure que les modèles de ML deviennent plus puissants et omniprésents, des inquiétudes subsistent quant à leur impact potentiel sur la société. Des questions telles que les préjugés, la vie privée et les suppressions d’emplois font l’objet de vifs débats, et la nécessité de lignes directrices éthiques et de pratiques de développement responsable est de plus en plus reconnue.
Conclusion
L'apprentissage automatique est un sous-ensemble de l'IA, dont l'objectif explicite est de créer des systèmes intelligents en leur permettant d'apprendre à partir des données. L'apprentissage supervisé, non supervisé, semi-supervisé et par renforcement sont les principaux types de ML (avec l'apprentissage auto-supervisé). Le ML est au cœur de nombreux nouveaux produits qui sortent aujourd'hui, tels que ChatGPT, les voitures autonomes et les recommandations Netflix. Cela peut être moins cher ou meilleur que la performance humaine, mais en même temps, cela coûte cher au départ et est moins explicable et pilotable. Le ML est également sur le point de devenir encore plus populaire au cours des prochaines années.
Le ML comporte de nombreuses subtilités, et les opportunités d’apprendre et de contribuer dans ce domaine se multiplient. En particulier, les guides de Grammarly sur l'IA, l'apprentissage profond et ChatGPT peuvent vous aider à en savoir plus sur d'autres parties importantes de ce domaine. Au-delà de cela, entrer dans les détails du ML (comme la manière dont les données sont collectées, à quoi ressemblent réellement les modèles et les algorithmes derrière « l'apprentissage ») peut vous aider à l'intégrer efficacement dans votre travail.
Alors que le ML continue de croître et que l'on s'attend à ce qu'il touche presque tous les secteurs, il est maintenant temps de commencer votre voyage ML !