Apprentissage automatique vs apprentissage profond : explication des principales différences
Publié: 2024-11-20Bien que l’apprentissage automatique et l’apprentissage profond soient souvent utilisés de manière interchangeable, ils font référence à deux sous-domaines de l’intelligence artificielle. Ils représentent des approches différentes (mais liées) de l'analyse des données ; l'apprentissage profond est un sous-ensemble de l'apprentissage automatique. Les distinctions entre eux sont importantes et deviennent particulièrement pertinentes lors de la communication sur des sujets techniques, par exemple lors de l'évaluation d'outils et de services d'analyse de données, de la décision des approches à adopter pour résoudre un problème de données ou d'avoir des conversations approfondies avec des ingénieurs et des experts du domaine.
Table des matières:
- Qu’est-ce que l’apprentissage automatique ?
- Qu’est-ce que l’apprentissage profond ?
- Apprentissage automatique contre apprentissage profond
- Applications du ML et de l'apprentissage profond
- Avantages du ML et du deep learning
- Les défis du ML et du deep learning
- Conclusion
Qu’est-ce que l’apprentissage automatique ?
L'apprentissage automatique (ML) est un sous-ensemble de l'intelligence artificielle (IA). Le nom fait référence à tous les systèmes dans lesquels une machine (généralement un ordinateur ou une combinaison d'ordinateurs) applique des techniques mathématiques et statistiques automatiques pour découvrir ou apprendre des modèles à partir de données.
ML vise à créer des systèmes intelligents et indépendants. Cela signifie qu’il apprendra des modèles et les améliorera à partir des données, dans le but d’avoir peu de composants codés en dur et de réduire les interactions humaines. Le domaine de l’apprentissage automatique existe depuis les années 1960 et de nombreux algorithmes et techniques ont été développés et étudiés depuis lors.
Types d'apprentissage automatique
De nombreux types de systèmes différents sont qualifiés de ML. Voici les plus courants :
- Les modèles d'apprentissage non supervisés utilisent des données non structurées avec peu ou pas de conseils humains.
- Les modèles d’apprentissage supervisé nécessitent des conseils et dépendent de la contribution humaine, y compris, par exemple, de la contribution sur le format et la structure des données.
- Les modèles semi-supervisés reçoivent des conseils d'une petite quantité de données structurées, puis utilisent les informations issues de ces données pour affiner leur précision sur un plus grand pool de données non structurées.
- Les modèles de renforcement apprennent à prendre des décisions en interagissant avec leur environnement. Ces modèles prennent des mesures, reçoivent des commentaires positifs ou négatifs, puis ajustent leur comportement pour atteindre l'objectif souhaité.
- Les modèles auto-supervisés créent leurs propres étiquettes à l'aide de données brutes et non structurées.
Qu’est-ce que l’apprentissage profond ?
Les progrès récents en matière de ML proviennent principalement d'un sous-ensemble spécialisé du ML connu sous le nom d'apprentissage profond. L'apprentissage profond fait référence au sous-ensemble de systèmes de ML mis en œuvre au-dessus d'un sous-ensemble de réseaux de neurones appelés réseaux de neurones profonds. Les réseaux de neurones profonds sont des réseaux de neurones étendus, fortement interconnectés et dotés de nombreuses couches de neurones disponibles pour le traitement.
Types de réseaux d'apprentissage profond
Comme d’autres techniques avancées de ML, les systèmes d’apprentissage profond peuvent apprendre de manière supervisée ou non. Ils peuvent être construits avec une seule ou une combinaison de deux ou plusieurs architectures de réseaux neuronaux avancées. Certains réseaux, tels que les réseaux de neurones à action directe (FNN), ne déplacent les données que dans une seule direction entre les couches de neurones. En revanche, d’autres, tels que les réseaux neuronaux récurrents (RNN), peuvent former des boucles internes et, comme effet secondaire, se comporter comme s’ils disposaient de mémoire.
Les architectures avancées telles que les réseaux de neurones convolutifs (CNN) structurent comment et quand certaines parties des données sont répétées dans l'entrée d'un NN. Cela donne des indications sur l'endroit où le réseau doit rechercher des relations dans les données.
Plusieurs réseaux de neurones peuvent être développés en tandem, chaque sous-réseau se spécialisant dans un sous-ensemble de l'espace problématique. Par exemple, les réseaux contradictoires génératifs (GAN) ont tendance à former des modèles qui tentent de se faire concurrence (l'un simulant de nouvelles données qui devraient appartenir à un ensemble de données, et l'autre s'entraînant à détecter les fraudes), et les architectures à deux tours collaborent pour apprendre. environ deux parties profondément interconnectées, mais distinctes, d’un ensemble de données.
Des combinaisons d'architectures plus complexes sont également couramment utilisées ensemble lors de la création de systèmes d'apprentissage en profondeur. Ces architectures peuvent être étendues à l'aide de structures neuronales spécialisées, telles que des transformateurs et des redresseurs, ou utilisées pour émuler, mettre en œuvre et améliorer d'autres systèmes d'apprentissage automatique, tels que des arbres de décision.
Apprentissage automatique et apprentissage profond : principales différences
L'apprentissage profond est un sous-ensemble de l'apprentissage automatique et comporte certaines contraintes et avantages spécifiques. L'apprentissage automatique est un terme général qui couvre un plus large éventail d'options et de compromis pour analyser les données et en détecter les modèles. Ce tableau met en évidence les différences. Vous trouverez plus de détails ci-dessous.
Apprentissage automatique (ML) | Apprentissage profond (DL) | |
Flexibilité | Général; un sous-ensemble de l’IA qui englobe diverses techniques permettant d’apprendre à partir des données, avec de nombreuses options de mise en œuvre. | Mis en œuvre exclusivement avec des réseaux de neurones ; un sous-ensemble spécialisé de ML axé sur les réseaux neuronaux profonds à plusieurs niveaux et sur les techniques qui leur sont bien adaptées. |
Implication humaine | Couvre toute la gamme des algorithmes, de ceux qui fonctionnent avec des données structurées et nécessitent un prétraitement humain important, à ceux qui peuvent fonctionner de manière totalement indépendante. | Généralement appliqué à des ensembles de données extrêmement volumineux. Les modèles fonctionnent principalement avec des données non structurées et dépendent moins du traitement et de la conservation humains. |
Portée | Portée plus large, incluant des algorithmes traditionnels comme la régression linéaire, les arbres de décision et le clustering. | Concentration plus étroite au sein du ML, spécialisée dans la gestion de données à grande échelle et de tâches complexes. |
Bases technologiques | Utilise une variété d'algorithmes tels que des arbres de décision, des machines à vecteurs de support et des méthodes d'ensemble. | Utilise des réseaux de neurones profonds avec de nombreuses couches et techniques spécifiquement destinées à fonctionner avec les réseaux de neurones, comme l'apprentissage par renforcement et la rétro-propagation. |
Domaines d'application | Tous les domaines d'application dans lesquels les algorithmes et les ordinateurs peuvent être utilisés pour détecter automatiquement des modèles dans les données. | Spécialisé pour les tâches qui dépendent de la reconnaissance de formes complexes à partir de volumes élevés de données non structurées, telles que l'analyse générale de textes et d'images, la résolution de problèmes du monde réel et les tâches génératives. |
Interprétabilité | Peut être construit de manière facile à comprendre et à interpréter pour les humains. Sont étudiés depuis bien plus longtemps et possèdent des propriétés bien connues. | Généralement très précis, tout en prenant des mesures beaucoup plus difficiles à suivre et à expliquer pour les humains. |
Exemples | Détection de spam, systèmes de recommandation, segmentation client. | Voitures autonomes, assistants virtuels (par exemple Siri), systèmes de reconnaissance faciale. |
L'apprentissage profond dépend de grands ensembles de données
Les techniques d'apprentissage en profondeur dépendent souvent de l'accès à des ensembles de données extrêmement volumineux, tandis que les systèmes de ML peuvent être utiles lorsque peu ou pas de données sont disponibles. De plus, si une contribution humaine qualifiée et spécialisée est disponible, le ML peut en tirer parti de manière plus explicite que n’importe quel système d’apprentissage profond.
En général, les systèmes ML couvrent un éventail plus large de techniques et présentent une gamme de mise en œuvre plus flexible. L'apprentissage profond se concentre exclusivement sur les techniques adaptées au travail avec de grands ensembles de données, telles que les réseaux neuronaux profonds et les algorithmes qui les prennent en charge.
Le ML peut être plus facile à optimiser et à comprendre
Avec sa portée beaucoup plus large, le ML couvre de nombreuses approches traditionnelles et bien étudiées du traitement des données, telles que les arbres de décision, le clustering et de nombreux types de régression. Après des décennies consacrées à leur étude, bon nombre de ces approches comportent des performances intégrées bien connues et d’autres compromis.
Ils offrent des mises en œuvre plus flexibles que les systèmes d'apprentissage profond dépendant des réseaux neuronaux et peuvent être plus efficaces en termes de ressources et de coûts. L’apprentissage profond nécessite généralement beaucoup de ressources et se situe à l’extrémité supérieure de l’échelle des coûts.
L'apprentissage profond est plus puissant et moins général
Les systèmes d'apprentissage profond conviennent mieux aux applications ayant une portée et un objectif plus restreints, par exemple, des problèmes liés à de grandes quantités de données associées disponibles, suffisamment de temps pour la longue formation d'un réseau neuronal et lorsque la précision de l'exécution est prioritaire sur la capacité de traçage. exactement ce que fait le système et pourquoi.
Les systèmes de ML peuvent être appliqués à toute une gamme de problèmes dans lesquels les machines peuvent trouver et appliquer automatiquement des modèles dans les données, y compris ceux pour lesquels moins de données sont disponibles, où les systèmes sont faciles à comprendre pour les humains et où une grande précision est moins pertinente.
Applications du ML et de l'apprentissage profond
Les systèmes et applications basés sur le ML et l’apprentissage profond sont continuellement intégrés dans de plus en plus d’aspects de nos vies. Voici quelques exemples bien connus ci-dessous.
Détection du spam
L’une des premières applications d’apprentissage automatique à grande échelle consistait à détecter et filtrer les courriers indésirables. Le problème est idéal pour l’apprentissage automatique appliqué.
Il existe de grands volumes d’e-mails et ils ont une structure bien définie. Il est facile de marquer les e-mails indésirables comme spam, il n'est donc pas difficile de créer de grands ensembles de données d'e-mails marqués comme « spam » ou « ham » (ham est l'opposé du spam). Des systèmes de classification peuvent être facilement construits à partir de ces données, puis utilisés pour filtrer rapidement les courriers indésirables à l'échelle d'Internet.
La détection du spam est un exemple dans lequel les systèmes d’apprentissage profond ne sont pas (encore) aussi bien adaptés à la résolution que les techniques de ML plus traditionnelles. Malgré des améliorations significatives, le temps et les coûts nécessaires pour maintenir les systèmes d'apprentissage profond à jour avec les dernières avancées en matière de spam ne justifient pas encore leur plus grande précision. Les systèmes d'apprentissage profond peuvent être utilisés pour optimiser les pipelines ML en général, et les systèmes de formation ML pour la détection du spam à grande échelle peuvent les intégrer à cette fin.
Systèmes de recommandation
Les magasins de commerce électronique, les services de streaming multimédia et les marchés en ligne ne sont que quelques exemples de services qui dépendent de la capacité de faire des recommandations sur les endroits où les utilisateurs devraient dépenser leur argent. Les systèmes de recommandation sont un autre exemple typique de problème bien adapté à l’apprentissage automatique.
À mesure que les utilisateurs consomment des médias et achètent en ligne, les systèmes sous-jacents peuvent créer de grands ensembles de données avec des signaux clairs (l'utilisateur a consommé ou l'utilisateur n'a pas consommé). L'apprentissage en profondeur et les techniques de ML plus traditionnelles peuvent être appliquées à ce problème ; les systèmes de recommandation à grande échelle utilisent des combinaisons intelligentes des deux types d’algorithmes.
Voitures d'orientation et voitures autonomes
Les algorithmes ML non supervisés traditionnels basés sur des techniques de recherche d'itinéraire bien connues, telles que l'algorithme de Dijkstra et l'algorithme A*, sont les mieux adaptés pour trouver le meilleur chemin entre deux points sur une feuille de route. Ces algorithmes peuvent étudier les cartes, le trafic et d’autres données à l’avance, découvrir des modèles, s’ajuster en temps réel en fonction des conditions du monde réel et fonctionnent plutôt bien.
Cependant, lorsqu'il s'agit de conduire une voiture entre deux points, la quantité et la complexité des informations à traiter sont beaucoup trop élevées pour qu'une technique de ML traditionnelle puisse fonctionner. Les systèmes de conduite autonome sont presque exclusivement construits avec des techniques d'apprentissage en profondeur.
Avantages du ML et du deep learning
Lorsqu’ils sont bien utilisés, l’apprentissage automatique et les systèmes spécialisés d’apprentissage profond sont transformateurs. Ils peuvent renforcer les experts humains, rendant leur production plus rapide, plus percutante, moins coûteuse, de meilleure qualité ou un mélange de tout ce qui précède.
Amélioration de la vitesse, de l'évolutivité et des coûts grâce au ML
Les systèmes ML peuvent remplacer tout ou partie du travail et des processus d'un expert, réduisant ainsi le temps et l'attention nécessaires pour accomplir une tâche. En conséquence, leurs travaux peuvent être appliqués à une échelle beaucoup plus élevée qu’auparavant.
Par exemple, une équipe de techniciens qui évaluent les anomalies des examens IRM pourrait chacun être en mesure d’évaluer six examens par heure, soit environ 200 par semaine. Si la même équipe se concentrait plutôt sur la formation d’un ensemble d’algorithmes d’apprentissage automatique pour effectuer les parties les plus courantes de leur analyse, les algorithmes pourraient évaluer des milliers d’examens IRM par semaine, pour une fraction du coût.
Impact et qualité accrus grâce au deep learning
Lorsqu'ils sont appliqués à des problèmes pour lesquels les systèmes d'apprentissage en profondeur sont bien adaptés, ils peuvent augmenter les systèmes qui intègrent le ML et augmenter leur qualité et leur impact globaux.
En poursuivant l’exemple ci-dessus, les systèmes d’apprentissage profond pourraient être appliqués à des conditions comportant un volume suffisamment important d’examens IRM. Si le volume d’analyses est suffisant et après avoir consacré suffisamment de temps et de ressources à la mise en place des systèmes d’apprentissage profond, ils feront probablement un meilleur travail que les experts pour identifier l’ensemble restreint d’anomalies pour lesquelles ils ont été formés.
Ces systèmes peuvent ensuite être déployés à grande échelle pour un impact maximal, en traitant des examens IRM individuels à des coûts négligeables. Les analyses des techniciens IRM et d'autres experts peuvent augmenter le rendement des systèmes d'apprentissage profond pour des cas inhabituels ou exceptionnels, obtenant ainsi une qualité combinée encore plus élevée.
Les défis du ML et du deep learning
Bien que de nombreux types de travail puissent bénéficier énormément du ML appliqué ou de l’apprentissage profond, intégrer une telle IA dans un système peut s’avérer difficile. Voici quelques-uns des défis et obstacles les plus courants qui surviennent.
Le compromis entre coût et précision
Des systèmes informatiques plus grands et plus coûteux peuvent exécuter des algorithmes de ML et d’apprentissage en profondeur plus avancés plus rapidement et à plus grande échelle. En conséquence, il existe un compromis entre le montant dépensé pour le système et son efficacité en termes de matériel et d’embauche d’experts plus talentueux pour l’assembler. L’utilisation efficace de ressources limitées dans les systèmes de ML et d’apprentissage profond nécessite une attention considérable.
Une dépendance à de grands ensembles de données
Le ML, en général, et l’apprentissage profond en particulier, dépendent de l’accès à de grands ensembles de données continuellement mis à jour pendant leur phase de formation. La qualité des algorithmes dépend de la qualité et du volume des données sur lesquelles ils sont formés. Gérer efficacement de grands ensembles de données est difficile, et il faut du temps et de l'ingéniosité pour appliquer le ML le plus efficacement possible à un ensemble de données donné.
Le compromis entre précision et clarté
Les systèmes d'apprentissage profond peuvent être entraînés pour être extrêmement précis, bien plus que d'autres systèmes de ML construits avec des paramètres équivalents. La précision a un coût ; les systèmes manipulent les données à grande échelle et utilisent des algorithmes avancés impossibles à comprendre pour les humains dans un laps de temps pratique.
Les algorithmes de ML plus traditionnels sont étudiés depuis bien plus longtemps, ont des caractéristiques mieux définies et peuvent être amenés à fonctionner de manière facile à comprendre pour les humains. Toute mise en œuvre de ML et d’apprentissage profond doit trouver le compromis idéal entre précision et clarté.
Le compromis entre biais technique et variance
À mesure que les systèmes ML augmentent la complexité des algorithmes, les ressources dédiées à la formation et la quantité de données utilisées pour la formation, ils peuvent en apprendre de plus en plus sur les propriétés de leurs données de formation. Ce phénomène est appelé biais (technique) ; les systèmes extrêmement biaisés seront très précis lorsqu’ils verront des données similaires à celles sur lesquelles ils ont été formés.
Un biais élevé se fait souvent au détriment d'une variance trop faible : le système ne réagira pas beaucoup aux nouvelles données très différentes de celles qu'il a vues lors de l'entraînement. Les systèmes idéaux, qui présentent à la fois un faible biais et une faible variance, sont difficiles à construire. Trouver le bon équilibre entre biais et variance pour une application spécifique est plus facile pour les algorithmes de ML traditionnels mieux étudiés et mieux établis. Cela peut être difficile à réaliser avec les algorithmes d’apprentissage en profondeur plus complexes.
Conclusion
Les systèmes d'apprentissage profond sont un sous-ensemble spécialisé du ML qui exploite des réseaux neuronaux profonds et multicouches pour résoudre des problèmes complexes liés à de grands ensembles de données. Bien qu'ils offrent une précision et des capacités de traitement supérieures, ils comportent des compromis, tels qu'une interprétabilité réduite, une dépendance à des données étendues et une flexibilité d'optimisation limitée.
En revanche, les méthodes traditionnelles de ML sont souvent plus rentables, plus faciles à déployer et fournissent des résultats plus transparents et prévisibles. Ils sont également plus simples à affiner pour des tâches spécifiques. Les deux approches présentent des forces et des faiblesses distinctes, et comprendre leurs applications et leurs limites est crucial pour une mise en œuvre efficace dans des scénarios du monde réel.