Apprendimento automatico e apprendimento profondo: spiegazione delle differenze chiave
Pubblicato: 2024-11-20Sebbene l’apprendimento automatico e l’apprendimento profondo siano spesso usati in modo intercambiabile, si riferiscono a due sottodomini dell’intelligenza artificiale. Rappresentano approcci diversi (ma correlati) all'analisi dei dati; il deep learning è un sottoinsieme del machine learning. Le distinzioni tra loro sono importanti e diventano particolarmente rilevanti quando si comunica su argomenti tecnici, ad esempio quando si valutano strumenti e servizi di analisi dei dati, si decide quali approcci adottare per risolvere un problema relativo ai dati o si hanno conversazioni approfondite con ingegneri ed esperti di dominio.
Sommario:
- Cos'è l'apprendimento automatico?
- Cos'è l'apprendimento profondo?
- Apprendimento automatico e apprendimento profondo
- Applicazioni di ML e deep learning
- Vantaggi del machine learning e del deep learning
- Sfide del machine learning e del deep learning
- Conclusione
Cos'è l'apprendimento automatico?
L'apprendimento automatico (ML) è un sottoinsieme dell'intelligenza artificiale (AI). Il nome si riferisce a tutti i sistemi in cui una macchina (di solito un computer o una combinazione di computer) applica tecniche matematiche e statistiche automatiche per scoprire o apprendere modelli dai dati.
Il ML mira a costruire sistemi intelligenti e indipendenti. Ciò significa che apprenderà modelli e li migliorerà dai dati, con l’obiettivo di avere pochi componenti codificati e una ridotta interazione umana. Il campo dell’apprendimento automatico esiste dagli anni ’60 e da allora è stato sviluppato e studiato un ampio corpus di algoritmi e tecniche.
Tipi di apprendimento automatico
Molti tipi diversi di sistemi si qualificano come ML. Questi sono i più comuni:
- I modelli di apprendimento non supervisionato utilizzano dati non strutturati con poca o nessuna guida umana.
- I modelli di apprendimento supervisionato richiedono una guida e dipendono dall’input umano, incluso, ad esempio, l’input sul formato e sulla struttura dei dati.
- I modelli semi-supervisionati ricevono indicazioni da una piccola quantità di dati strutturati, quindi utilizzano le informazioni ricavate da tali dati per affinare la loro accuratezza su un pool più ampio di dati non strutturati.
- I modelli di rinforzo imparano a prendere decisioni interagendo con il loro ambiente. Questi modelli intraprendono azioni, ricevono feedback positivi o negativi, quindi adattano il comportamento per raggiungere l’obiettivo desiderato.
- I modelli autosupervisionati creano le proprie etichette utilizzando dati grezzi e non strutturati.
Cos'è l'apprendimento profondo?
I recenti progressi nel machine learning provengono principalmente da un sottoinsieme specializzato di machine learning noto come deep learning. L'apprendimento profondo si riferisce al sottoinsieme di sistemi ML implementati su un sottoinsieme di reti neurali chiamate reti neurali profonde. Le reti neurali profonde sono reti neurali grandi, fortemente interconnesse e dotate di molti strati di neuroni disponibili per l'elaborazione.
Tipi di reti di deep learning
Come altre tecniche ML avanzate, i sistemi di deep learning possono apprendere in modi supervisionati o non supervisionati. Possono essere costruiti con una sola o una combinazione di due o più architetture di rete neurale avanzate. Alcune reti, come le reti neurali feed-forward (FNN), spostano i dati solo in una direzione tra gli strati neuronali. Al contrario, altri, come le reti neurali ricorrenti (RNN), potrebbero formare circuiti interni e, come effetto collaterale, comportarsi come se avessero memoria.
Architetture avanzate come le reti neurali convoluzionali (CNN) strutturano come e quando parti dei dati vengono ripetute nell'input di una NN. Ciò fornisce suggerimenti su dove nei dati la rete dovrebbe cercare le relazioni.
È possibile sviluppare più reti neurali in tandem, con ciascuna sottorete specializzata in un sottoinsieme dello spazio problematico. Ad esempio, le reti generative avversarie (GAN) tendono ad addestrare modelli che cercano di competere tra loro (uno falsifica nuovi dati che dovrebbero appartenere a un set di dati e l’altro addestra per rilevare le frodi) e le architetture a due torri collaborano per apprendere circa due parti profondamente interconnesse, ma distinte, di un set di dati.
Anche combinazioni più complesse di architetture vengono comunemente utilizzate insieme durante la creazione di sistemi di deep learning. Queste architetture possono essere estese utilizzando strutture neuronali specializzate, come trasformatori e unità raddrizzatrici, o impiegate per emulare, implementare e migliorare altri sistemi di apprendimento automatico, come gli alberi decisionali.
Apprendimento automatico e apprendimento profondo: differenze chiave
Il deep learning è un sottoinsieme dell’apprendimento automatico e presenta alcuni vincoli e vantaggi specifici integrati. L’apprendimento automatico è un termine generale e copre una gamma più ampia di opzioni e compromessi per analizzare i dati e rilevare modelli al loro interno. Questa tabella evidenzia le differenze. Di seguito troverai maggiori dettagli.
Apprendimento automatico (ML) | Apprendimento profondo (DL) | |
Flessibilità | Generale; un sottoinsieme dell’intelligenza artificiale che comprende varie tecniche per apprendere dai dati, con molte opzioni di implementazione. | Implementato esclusivamente con reti neurali; un sottoinsieme specializzato di ML incentrato su reti neurali profonde e multistrato e su tecniche adatte ad esse. |
Coinvolgimento umano | Copre l'intera gamma di algoritmi, da quelli che funzionano con dati strutturati e richiedono una significativa pre-elaborazione umana, a quelli che possono operare in modo completamente indipendente. | Tipicamente applicato a set di dati estremamente grandi. I modelli funzionano principalmente con dati non strutturati e hanno una minore dipendenza dall'elaborazione e dalla cura umana. |
Ambito | Ambito più ampio, inclusi algoritmi tradizionali come regressione lineare, alberi decisionali e clustering. | Focus più ristretto all'interno del machine learning, specializzato nella gestione di dati su larga scala e attività complesse. |
Nozioni di base sulla tecnologia | Impiega una varietà di algoritmi come alberi decisionali, macchine a vettori di supporto e metodi di ensemble. | Utilizza reti neurali profonde con molti livelli e tecniche specificatamente pensate per funzionare con le reti neurali, come l'apprendimento per rinforzo e la backpropagation. |
Aree di applicazione | Qualsiasi area applicativa in cui è possibile utilizzare algoritmi e computer per rilevare automaticamente modelli nei dati. | Specializzato per attività che dipendono dal riconoscimento di modelli complessi da elevati volumi di dati non strutturati, come l'analisi generale di testo e immagini, la risoluzione di problemi nel mondo reale e attività generative. |
Interpretabilità | Può essere costruito in modi che siano facili da comprendere e interpretare per gli esseri umani. Sono studiati da molto più tempo e hanno proprietà ben note. | In genere molto accurato, pur intraprendendo azioni che sono molto più difficili da seguire e spiegare per gli esseri umani. |
Esempi | Rilevamento dello spam, sistemi di raccomandazione, segmentazione della clientela. | Auto a guida autonoma, assistenti virtuali (es. Siri), sistemi di riconoscimento facciale. |
Il deep learning dipende da grandi set di dati
Le tecniche di deep learning spesso dipendono dall’accesso a set di dati estremamente grandi, mentre i sistemi ML possono essere utili quando sono disponibili pochi o nessun dato. Inoltre, se è disponibile un input umano qualificato e specializzato, il ML può trarne vantaggio in modo più esplicito rispetto a qualsiasi sistema di deep learning.
In generale, i sistemi ML coprono una gamma più ampia di tecniche e presentano una gamma di implementazione più flessibile. Il deep learning si concentra esclusivamente su tecniche adatte a lavorare con grandi set di dati, come le reti neurali profonde e i relativi algoritmi di supporto.
Il machine learning può essere più facile da ottimizzare e comprendere
Con il suo ambito molto più ampio, il machine learning copre molti approcci tradizionali e ben studiati all'elaborazione dei dati, come alberi decisionali, clustering e molti tipi di regressione. Con decenni dedicati al loro studio, molti di questi approcci hanno prestazioni integrate ben note e altri compromessi.
Offrono implementazioni più flessibili rispetto ai sistemi di deep learning dipendenti dalla rete neurale e possono essere più efficienti in termini di risorse e costi. Il deep learning è solitamente pesante in termini di risorse e si colloca nella fascia alta della scala dei costi.
Il deep learning è più potente e non così generale
I sistemi di deep learning sono ideali per applicazioni con un ambito e un focus più ristretti, ad esempio, problemi con grandi quantità di dati correlati disponibili, tempo sufficiente per l'addestramento prolungato di una rete neurale e quando viene data priorità all'accuratezza dell'esecuzione rispetto alla capacità di tracciare esattamente cosa sta facendo il sistema e perché.
I sistemi ML possono essere applicati all’intera gamma di problemi in cui le macchine possono trovare e applicare automaticamente modelli nei dati, compresi quelli in cui sono disponibili meno dati, dove i sistemi sono facili da comprendere per gli esseri umani e dove l’elevata precisione è meno rilevante.
Applicazioni di ML e deep learning
I sistemi e le applicazioni basati su ML e deep learning sono continuamente integrati in sempre più aspetti della nostra vita. Ecco alcuni esempi ben noti di seguito.
Rilevamento dello spam
Una delle prime applicazioni di machine learning su larga scala è stata quella di rilevare e filtrare i messaggi e-mail di spam. Il problema è ideale per l’apprendimento automatico applicato.
Esistono grandi volumi di e-mail e hanno una struttura ben definita. È facile contrassegnare le email indesiderate come spam, quindi non è difficile creare grandi set di dati di email contrassegnate come "spam" o "ham" (ham è l'opposto di spam). I sistemi di classificazione possono essere facilmente creati sulla base di questi dati e quindi utilizzati per filtrare rapidamente le e-mail di spam su scala Internet.
Il rilevamento dello spam è un esempio in cui i sistemi di deep learning non sono (ancora) così adatti a risolvere i problemi come lo sono le tecniche ML più tradizionali. Nonostante i miglioramenti significativi, il tempo e i costi necessari per mantenere i sistemi di deep learning aggiornati con gli ultimi progressi nello spam non valgono ancora la loro maggiore precisione. I sistemi di deep learning possono essere utilizzati per ottimizzare le pipeline ML in generale e i sistemi di formazione ML per il rilevamento dello spam su larga scala possono integrarli a tale scopo.
Sistemi di raccomandazione
Negozi di e-commerce, servizi di streaming multimediale e mercati online sono solo alcuni degli esempi di servizi che dipendono dalla capacità di fornire consigli su dove gli utenti dovrebbero spendere i propri soldi. I sistemi di raccomandazione sono un altro tipico esempio di problema che ben si adatta all’apprendimento automatico.
Man mano che gli utenti consumano contenuti multimediali e acquistano online, i sistemi sottostanti possono creare grandi set di dati con segnali chiari (l'utente ha consumato rispetto all'utente che non ha consumato). A questo problema possono essere applicate sia il deep learning che le tecniche ML più tradizionali; I sistemi di raccomandazione su larga scala utilizzano combinazioni intelligenti di entrambi i tipi di algoritmi.
Auto che individuano il percorso e guidano da sole
I tradizionali algoritmi ML non supervisionati basati su tecniche di ricerca del percorso ben note, come l'algoritmo di Dijkstra e l'algoritmo A*, sono più adatti per trovare il percorso migliore tra due punti su una mappa stradale. Questi algoritmi possono studiare in anticipo mappe, traffico e altri dati, scoprire modelli, adattarsi in tempo reale in base alle condizioni del mondo reale e funzionare abbastanza bene.
Quando si tratta di guidare effettivamente un’auto tra due punti, tuttavia, la quantità e la complessità delle informazioni da elaborare sono troppo elevate per poter funzionare con qualsiasi tecnica ML tradizionale. I sistemi di guida autonoma sono costruiti quasi esclusivamente con tecniche di deep learning.
Vantaggi del machine learning e del deep learning
Se usati bene, il machine learning e i sistemi specializzati di deep learning sono trasformativi. Possono potenziare gli esperti umani, rendendo i loro risultati più rapidi, di maggiore impatto, meno costosi, di qualità superiore o un mix di tutto quanto sopra.
Velocità, scalabilità e costi migliorati con il machine learning
I sistemi ML possono sostituire parte o tutto il lavoro e i processi di un esperto, riducendo il tempo e l'attenzione necessari per completare un'attività. Di conseguenza, il loro lavoro può essere applicato su una scala molto più elevata rispetto a prima.
Ad esempio, un team di tecnici che valutano le scansioni MRI per individuare eventuali anomalie potrebbe essere in grado di valutare ciascuno sei scansioni all’ora, ovvero circa 200 a settimana. Se lo stesso team si concentrasse invece sull’addestramento di una serie di algoritmi di apprendimento automatico per eseguire le parti più di routine delle loro analisi, gli algoritmi potrebbero valutare migliaia di scansioni MRI a settimana, a una frazione del costo.
Maggiore impatto e qualità con il deep learning
Se applicati a problemi per i quali i sistemi di deep learning sono adatti, possono potenziare i sistemi che incorporano il machine learning e aumentarne la qualità e l’impatto complessivi.
Continuando l’esempio sopra, i sistemi di deep learning potrebbero essere applicati a condizioni con un volume sufficientemente ampio di scansioni MRI. Se il volume delle scansioni è sufficiente e dopo che tempo e risorse sufficienti sono stati dedicati alla costruzione dei sistemi di deep learning, probabilmente faranno un lavoro migliore di quello degli esperti nell’identificare il ristretto insieme di anomalie che sono stati addestrati a identificare.
Questi sistemi possono quindi essere implementati su larga scala per ottenere il massimo impatto, elaborando singole scansioni MRI a costi trascurabili. Le analisi dei tecnici MRI e di altri esperti possono aumentare i risultati dei sistemi di deep learning per casi insoliti o eccezionali, ottenendo una qualità combinata ancora più elevata.
Sfide del machine learning e del deep learning
Sebbene molti tipi di lavoro possano trarre enormi vantaggi dal ML applicato o dal deep learning, incorporare l’intelligenza artificiale come queste in un sistema può essere difficile. Ecco alcune delle sfide e degli ostacoli più comuni che si presentano.
Il compromesso tra costo e accuratezza
Sistemi informatici più grandi e costosi possono eseguire algoritmi di ML e deep learning più avanzati più velocemente e su scala più ampia. Di conseguenza, esiste un compromesso tra la quantità di denaro spesa per il sistema e la sua efficacia in termini di hardware e l’assunzione di esperti più talentuosi per assemblarlo. L’utilizzo efficace di risorse limitate nei sistemi ML e di deep learning richiede una notevole attenzione.
Una dipendenza da set di dati di grandi dimensioni
Il ML, in generale, e il deep learning in particolare, dipendono dall'accesso a grandi set di dati continuamente aggiornati durante la fase di formazione. La qualità degli algoritmi dipende dalla qualità e dal volume dei dati su cui vengono addestrati. Gestire in modo efficace set di dati di grandi dimensioni è difficile e sono necessari tempo e ingegno per applicare il machine learning nel modo più efficace a un determinato set di dati.
Il compromesso tra accuratezza e chiarezza
I sistemi di deep learning possono essere addestrati per essere estremamente accurati, molto più di altri sistemi ML costruiti con parametri equivalenti. La precisione ha un costo; i sistemi manipolano i dati su larga scala e utilizzano algoritmi avanzati che sono impossibili da comprendere per gli esseri umani in un arco di tempo pratico.
Gli algoritmi ML più tradizionali sono stati studiati per molto più tempo, hanno caratteristiche meglio definite e possono essere indotti a funzionare in modi facili da comprendere per gli esseri umani. Qualsiasi implementazione di machine learning e deep learning deve trovare il compromesso ideale tra accuratezza e chiarezza.
Il compromesso tra bias tecnico e varianza
Man mano che i sistemi ML aumentano nella complessità degli algoritmi, nelle risorse dedicate all'addestramento e nella quantità di dati utilizzati per l'addestramento, possono apprendere sempre di più sulle proprietà dei loro dati di addestramento. Questo fenomeno è chiamato bias (tecnico); i sistemi estremamente parziali saranno molto accurati quando vedranno dati simili a quelli su cui sono stati addestrati.
Un bias elevato spesso va a scapito di una varianza troppo bassa: il sistema non reagirà molto ai nuovi dati che sono molto diversi da quelli visti durante l'addestramento. I sistemi ideali, che sono sia a bassa distorsione che a bassa varianza, sono difficili da costruire. Trovare il corretto equilibrio tra bias e varianza per un'applicazione specifica è più semplice per gli algoritmi ML tradizionali meglio studiati e più consolidati. Può essere difficile da ottenere con gli algoritmi di deep learning più complessi.
Conclusione
I sistemi di deep learning sono un sottoinsieme specializzato di ML che sfrutta reti neurali profonde e multistrato per affrontare problemi complessi con set di dati di grandi dimensioni. Sebbene offrano precisione e capacità di elaborazione superiori, presentano dei compromessi, come una ridotta interpretabilità, la dipendenza da dati estesi e una flessibilità di ottimizzazione limitata.
Al contrario, i metodi ML tradizionali sono spesso più convenienti, più facili da implementare e forniscono risultati più trasparenti e prevedibili. Sono anche più semplici da ottimizzare per compiti specifici. Entrambi gli approcci presentano punti di forza e di debolezza distinti e comprenderne le applicazioni e i limiti è fondamentale per un’implementazione efficace negli scenari del mondo reale.