Apprentissage supervisé ou non supervisé : différences, avantages et cas d'utilisation

Publié: 2025-01-17

L’apprentissage automatique (ML) alimente de nombreuses technologies sur lesquelles nous nous appuyons quotidiennement, comme la reconnaissance d’images et les véhicules autonomes. Deux approches fondamentales – l’apprentissage supervisé et non supervisé – constituent l’épine dorsale de ces systèmes. Bien que les deux soient essentiels à la formation des modèles ML, ils diffèrent par leur méthodologie, leurs objectifs et leurs applications.

Dans ce guide, nous comparerons ces deux approches, soulignerons leurs différences et explorerons leurs avantages et leurs défis. Nous explorerons également des applications pratiques pour vous aider à comprendre laquelle est la mieux adaptée à diverses tâches.

Table des matières

  • Qu’est-ce que l’apprentissage supervisé ?
  • Qu’est-ce que l’apprentissage non supervisé ?
  • Supervisé ou non supervisé : principales différences
  • Avantages de l’apprentissage supervisé et non supervisé
  • Les défis de l’apprentissage supervisé et non supervisé
  • Applications de l’apprentissage supervisé et non supervisé
  • Conclusion

Qu’est-ce que l’apprentissage supervisé ?

L'apprentissage supervisé entraîne les systèmes ML à l'aide de données étiquetées. Dans ce contexte, « étiqueté » signifie que chaque exemple de formation est associé à un résultat connu. Ces étiquettes, souvent créées par des experts, aident le système à apprendre les relations entre les entrées et les sorties. Une fois formés, les systèmes supervisés peuvent appliquer ces relations apprises à de nouvelles données invisibles pour effectuer des prédictions ou des classifications.

Par exemple, dans le contexte des voitures autonomes, un système d’apprentissage supervisé pourrait analyser des données vidéo étiquetées. Ces annotations identifient les panneaux de signalisation, les piétons et les obstacles, permettant au système de reconnaître et de répondre à des caractéristiques similaires dans des scénarios de conduite réels.

Les algorithmes d’apprentissage supervisé se répartissent en deux catégories principales :

  • Classification: ces algorithmes attribuent des étiquettes aux nouvelles données, telles que l'identification des e-mails comme spam ou non-spam.
  • Régression: ces algorithmes prédisent des valeurs continues, comme la prévision des ventes futures en fonction des performances passées.

À mesure que les ensembles de données augmentent et que les ressources informatiques s'améliorent, les systèmes supervisés deviennent plus précis et efficaces, prenant en charge des applications telles que la détection des fraudes et les diagnostics médicaux.

En savoir plus sur l'apprentissage supervisé →

Qu’est-ce que l’apprentissage non supervisé ?

L’apprentissage non supervisé, en revanche, analyse les données sans exemples étiquetés, en s’appuyant sur des algorithmes statistiques pour découvrir des modèles ou des relations cachés. Contrairement aux systèmes supervisés, ces modèles déduisent une structure et mettent à jour leurs résultats de manière dynamique à mesure que de nouvelles informations deviennent disponibles. Même si l’apprentissage non supervisé excelle dans la découverte de modèles, il est généralement moins efficace pour les tâches prédictives.

Un exemple pratique est celui des services d’agrégation d’actualités. Ces systèmes regroupent des articles connexes et des publications sur les réseaux sociaux concernant un événement d'actualité sans étiquetage externe. En identifiant les points communs en temps réel, ils effectuent un apprentissage non supervisé pour mettre en évidence les histoires clés.

Voici quelques algorithmes spécialisés d’apprentissage non supervisé :

  • Clustering :ceux-ci sont utilisés pour segmenter les consommateurs et ajuster les segments à mesure que les comportements changent.
  • Association :celles-ci détectent des modèles dans les données, telles que l'identification d'anomalies qui pourraient indiquer des failles de sécurité.
  • Réduction de la dimensionnalité :celles-ci simplifient les structures de données tout en préservant les informations critiques et sont souvent utilisées pour compresser et visualiser des ensembles de données complexes.

L'apprentissage non supervisé fait partie intégrante de l'analyse exploratoire des données et de la découverte d'informations dans des scénarios où les données étiquetées ne sont pas disponibles.

En savoir plus sur l'apprentissage non supervisé →

Supervisé ou non supervisé : principales différences

L’apprentissage supervisé et non supervisé remplit des rôles distincts dans le ML. Ces approches diffèrent par les exigences en matière de données, l'implication humaine, les tâches et les applications. Le tableau ci-dessous met en évidence ces différences, que nous explorerons plus en détail.

Apprentissage supervisé Apprentissage non supervisé
Données d'entrée Nécessite des données étiquetées Nécessite des données non étiquetées
Objectif Prédire ou classer les étiquettes de sortie en fonction des caractéristiques d'entrée Découvrez et mettez à jour des modèles, des structures ou des représentations cachés dans les données
Implication humaine Effort manuel important pour l'étiquetage de grands ensembles de données et conseils d'experts pour le choix des fonctionnalités Intervention humaine minimale mais très spécialisée. Principalement pour définir les paramètres des algorithmes, optimiser l’utilisation des ressources à grande échelle et rechercher des algorithmes.
Tâches principales Régression, classification Clustering, association, réduction de dimensionnalité
Algorithmes courants Régression linéaire et logistique, arbres de décision, réseaux de neurones Clustering K-means, analyse en composantes principales (ACP), auto-encodeurs
Sortir Modèles prédictifs capables de classer ou de régresser de nouveaux points de données Regroupements ou représentations des données (par exemple, clusters, composants)
Applications Détection de spam, détection de fraude, classification d'images, prévision de prix, etc. Segmentation client, analyse du panier de marché, détection d'anomalies, etc.

Différences pendant la phase de formation

La principale différence entre les deux types d’algorithmes réside dans le type d’ensembles de données dont ils dépendent. L’apprentissage supervisé bénéficie de grands ensembles de données étiquetées. Par conséquent, les systèmes supervisés les plus avancés dépendent d’un travail humain non spécialisé à grande échelle pour passer au crible les données et générer des étiquettes. Les données étiquetées nécessitent également généralement plus de ressources à traiter, de sorte que les systèmes supervisés ne peuvent pas traiter autant de données à l'extrémité supérieure de l'échelle.

Les systèmes d’apprentissage non supervisés peuvent commencer à être efficaces avec des ensembles de données plus petits et traiter des quantités de données beaucoup plus importantes avec les mêmes ressources. Leurs données sont plus faciles à obtenir et à traiter puisqu’elles ne dépendent pas d’un travail humain non spécialisé à grande échelle. En contrepartie, les systèmes n'atteignent généralement pas un degré de précision aussi élevé dans les tâches de prévision et dépendent souvent de travaux spécialisés pour devenir efficaces. Au lieu d’être utilisés là où la précision est cruciale, ils sont plus fréquemment utilisés pour déduire et mettre à jour des modèles de données, à grande échelle et à mesure que les données évoluent.

Différences lors du déploiement

Les applications d’apprentissage supervisé disposent généralement d’un mécanisme intégré permettant d’obtenir davantage de données étiquetées à grande échelle. Par exemple, il est facile pour les utilisateurs de messagerie de déterminer si les messages entrants sont du spam ou non. Un fournisseur de messagerie peut accumuler les messages marqués dans un ensemble de formation, puis former des systèmes de régression logistique pour la détection du spam. Ils échangent une formation plus longue et plus gourmande en ressources pour une prise de décision plus rapide lors du déploiement. Outre les systèmes de régression logistique, d'autres algorithmes d'entraînement supervisés courants incluent les arbres de décision et les réseaux neuronaux, qui sont utilisés partout pour prédire et prendre des décisions et pour la reconnaissance de formes complexes.

Les systèmes non supervisés se distinguent lorsqu'ils sont appliqués à des problèmes impliquant de grandes quantités de données non structurées. Ils peuvent détecter des modèles dans les données, même lorsqu'ils sont transitoires, et doivent être détectés avant que la formation à l'apprentissage supervisé ne soit terminée. Par exemple, les algorithmes de clustering, un type de système d’apprentissage non supervisé, peuvent détecter et mettre à jour les segments de consommateurs à mesure que les tendances évoluent. Si les tendances évoluent vers des modèles nouveaux et invisibles, elles restent pertinentes sans nécessiter de temps d'arrêt pour se recycler.

Un exemple d’apprentissage non supervisé est l’utilisation de l’analyse en composantes principales (ACP) en finance. PCA est un algorithme qui peut être appliqué à des groupes d'investissements à grande échelle et permet de déduire et de mettre à jour les propriétés émergentes du groupe. Ceux-ci incluent des indicateurs financiers importants, tels que les sources les plus importantes de risque d'investissement et les facteurs susceptibles d'avoir un impact sur les rendements. D'autres types courants de systèmes d'apprentissage non supervisés sont les encodeurs automatiques, qui compressent et simplifient les données, souvent à titre d'étape préparatoire avant l'application d'autres algorithmes de ML.

Travaillez plus intelligemment avec Grammarly
Le partenaire d'écriture IA pour tous ceux qui ont du travail à faire

Avantages de l’apprentissage supervisé et non supervisé

Les systèmes supervisés et non supervisés sont utiles pour traiter les données à une échelle et à une vitesse qui dépassent celles des humains sans aide. Cependant, ils conviennent mieux à différentes applications. Ci-dessous, nous comparons certains de leurs principaux avantages.

Systèmes supervisés

  • Exceller lorsqu’il existe des données historiques importantes disponibles
  • Sont bien meilleurs que les systèmes non supervisés pour entraîner des données avec une structure, des caractéristiques et des modèles connus
  • Sont idéaux pour détecter et appliquer les caractéristiques connues des données à grande échelle
  • Peut produire des résultats qui sont compris et qui ont un sens intuitif pour les humains
  • Peut avoir une plus grande précision sur les données nouvelles et invisibles
  • Peut faire des prédictions plus rapidement et à une plus grande échelle que les systèmes non supervisés

Systèmes non supervisés

  • Sont particulièrement doués pour identifier des structures et des relations inédites ou inconnues dans les données
  • Réussir lorsque les données sont moins structurées et que leurs propriétés sont moins connues
  • Travailler dans certaines conditions où les systèmes supervisés ne fonctionnent pas bien (par exemple, dans des situations où les données ne sont pas disponibles ou lorsqu'elles sont disponibles mais n'ont pas été traitées par des humains)
  • Nécessitent moins de ressources et moins de temps pendant la formation que les systèmes supervisés pour des quantités de données équivalentes
  • Peut être formé et utilisé lorsqu'il y a trop de données pour être correctement traitées avec des systèmes supervisés

Les défis de l’apprentissage supervisé et non supervisé

Les systèmes supervisés et non supervisés nécessitent chacun des compromis différents, et les défis auxquels ils sont confrontés sont parfois très différents. Nous soulignons ci-dessous certaines des principales différences.

Systèmes supervisés

  • Exiger l’accès à de grandes quantités de données traitées par l’homme, qui ne sont que parfois disponibles ou faciles à obtenir
  • Avoir souvent des phases de formation plus longues et plus gourmandes en ressources
  • Peut avoir du mal à s'adapter rapidement si les caractéristiques des données de base changent
  • Relever des défis lors du traitement de données intrinsèquement non structurées, telles que la vidéo ou l'audio.

Systèmes non supervisés

  • Détectera plus fréquemment les modèles qui ne se généralisent pas bien à de nouveaux exemples de données
  • Peut être difficile à rendre aussi précis que les systèmes supervisés
  • Ils produisent des résultats difficiles à interpréter pour les humains, et les interprétations de ces résultats peuvent être plus subjectives.
  • Peut prendre plus de temps et de ressources par prédiction faite dans le monde réel

Applications de l’apprentissage supervisé et non supervisé

Certaines applications et certains problèmes sont mieux résolus avec des systèmes d'apprentissage supervisés, d'autres avec des systèmes non supervisés et certains fonctionnent mieux en utilisant un mélange. Voici trois exemples bien connus.

Systèmes d'apprentissage mixtes et apprentissage semi-supervisé

Il est important de noter que la plupart des applications réelles utilisent un mélange de modèles supervisés et non supervisés. Les systèmes d'apprentissage sont souvent combinés en fonction d'éléments tels que le budget, la disponibilité des données, les exigences de performances et la complexité de l'ingénierie. Parfois, un sous-ensemble spécialisé d’algorithmes d’apprentissage qui tente de combiner les avantages des deux approches (apprentissage semi-supervisé) peut également être utilisé. Dans les exemples ci-dessous, nous identifions le système le plus probable ou principal susceptible d'être utilisé.

Prédiction du trafic (supervisé)

La prévision du trafic est une tâche difficile. Heureusement, de nombreuses données labellisées sont disponibles puisque les villes auditent et enregistrent régulièrement les volumes de trafic routier. Les algorithmes de régression, un type d’apprentissage supervisé, sont faciles à appliquer à ces données et peuvent produire des prédictions assez précises des flux de trafic. Leurs prédictions peuvent aider à éclairer la prise de décision concernant la construction de routes, la signalisation routière et l’emplacement des feux de circulation. Les algorithmes non supervisés sont moins efficaces à cette phase. Ils peuvent cependant être exécutés sur la base des données de trafic accumulées après la mise en œuvre d'un changement dans la structure routière. À ce stade, ils aident automatiquement à identifier et à déduire si des problèmes nouveaux et inédits pourraient survenir.

Regroupement génétique (non supervisé)

L'analyse des données génétiques peut être lente et fastidieuse car les volumes de données sont importants et la plupart des données ne sont pas bien analysées. Souvent, nous ne savons pas grand-chose de ce que contiennent les données génétiques : où les gènes et autres composants génétiques peuvent être stockés dans le génome, comment ils sont décodés et interprétés, etc. Les algorithmes non supervisés sont particulièrement pertinents pour ce problème car ils peuvent traiter de grandes quantités de données. de données et en déduire automatiquement les modèles qu'elles contiennent. Ils peuvent également aider à collecter des informations génétiques d’apparence similaire dans des groupes distincts. Une fois les données génétiques regroupées en fonction de leur similarité, les groupes peuvent être facilement traités et testés pour identifier la fonction biologique (le cas échéant) qu'ils remplissent.

LLM et apprentissage par renforcement (mixtes)

Les grands modèles de langage (LLM) sont un exemple d'application combinant des systèmes d'apprentissage non supervisés et supervisés. Le système initial, le LLM, est généralement un exemple de système non supervisé. Pour produire un LLM, des données à grande échelle sont analysées (par exemple, tous les textes en anglais disponibles sur Internet) par un système non supervisé. Le système déduit de nombreux modèles à partir des données et développe des règles de base pour converser en anglais.

Cependant, les déductions faites par un LLM ne permettent pas de l'aider à ressembler à un humain typique dans une conversation. Ils ne l’aident pas non plus à prendre en compte les préférences individuelles en matière de communication. Un système supervisé – en particulier un système de renforcement qui utilise les commentaires annotés des utilisateurs (appelé apprentissage par renforcement à partir du feedback humain, ou RLHF en abrégé) – est un moyen de résoudre ce problème. RLHF peut être appliqué à un LLM déjà formé pour l'aider à bien parler avec les humains en général. Il peut également connaître les préférences individuelles et parler de la manière qu’une personne spécifique préfère.

Conclusion

En résumé, l’apprentissage supervisé et non supervisé sont deux sous-ensembles fondamentaux du ML, chacun offrant des atouts uniques. L'apprentissage supervisé excelle dans les scénarios comportant de nombreuses données étiquetées, des ressources suffisantes pour une formation initiale et un besoin de prise de décision rapide et évolutive. D’un autre côté, l’apprentissage non supervisé brille lorsqu’il révèle des structures et des relations cachées dans les données, en particulier lorsque les données étiquetées ou les ressources de formation sont limitées et que la prise de décision peut prendre en charge plus de temps et de complexité. En comprenant les avantages, les défis et les cas d’utilisation des deux approches, vous pouvez prendre des décisions éclairées sur le moment et la manière de les appliquer efficacement.