Învățare automată vs. Învățare profundă: diferențele cheie explicate
Publicat: 2024-11-20În timp ce învățarea automată și învățarea profundă sunt adesea folosite în mod interschimbabil, ele se referă la două subdomenii ale inteligenței artificiale. Ele reprezintă abordări diferite (dar legate) ale analizei datelor; învățarea profundă este un subset al învățării automate. Distincțiile dintre ele sunt importante și devin deosebit de relevante atunci când se comunică pe subiecte tehnice, cum ar fi atunci când se evaluează instrumentele și serviciile de analiză a datelor, se decide ce abordări să fie luate pentru rezolvarea unei probleme de date sau se poartă conversații profunde cu ingineri și experți în domeniu.
Cuprins:
- Ce este învățarea automată?
- Ce este învățarea profundă?
- Învățare automată vs învățare profundă
- Aplicații ale ML și deep learning
- Beneficiile ML și ale învățării profunde
- Provocările ML și învățarea profundă
- Concluzie
Ce este învățarea automată?
Învățarea automată (ML) este un subset al inteligenței artificiale (AI). Numele se referă la toate sistemele în care o mașină (de obicei un computer sau o combinație de calculatoare) aplică tehnici matematice și statistice automate pentru a descoperi sau învăța modele din date.
ML își propune să construiască sisteme inteligente și independente. Aceasta înseamnă că va învăța modele și le va îmbunătăți din date, urmărind să aibă puține componente codificate și o interacțiune umană redusă. Domeniul învățării automate există încă din anii 1960 și există un corp mare de algoritmi și tehnici care au fost dezvoltate și studiate de atunci.
Tipuri de învățare automată
Multe tipuri diferite de sisteme se califică drept ML. Acestea sunt cele mai comune:
- Modelele de învățare nesupravegheate folosesc date nestructurate cu îndrumare umană mică sau deloc.
- Modelele de învățare supravegheată necesită îndrumare și depind de aportul uman, inclusiv, de exemplu, de intrarea în formatul și structura datelor.
- Modelele semi-supravegheate primesc îndrumări de la o cantitate mică de date structurate, apoi folosesc informații din acele date pentru a-și rafina acuratețea pe un număr mai mare de date nestructurate.
- Modelele de întărire învață să ia decizii interacționând cu mediul lor. Aceste modele iau acțiuni, primesc feedback pozitiv sau negativ, apoi ajustează comportamentul pentru a atinge scopul dorit.
- Modelele auto-supravegheate își creează propriile etichete folosind date brute, nestructurate.
Ce este învățarea profundă?
Progresele recente în ML au venit în principal dintr-un subset specializat de ML cunoscut sub numele de deep learning. Învățarea profundă se referă la subsetul de sisteme ML care sunt implementate peste un subset de rețele neuronale care sunt numite rețele neuronale profunde. Rețelele neuronale profunde sunt rețele neuronale care sunt mari, puternic interconectate și au multe straturi de neuroni disponibile pentru procesare.
Tipuri de rețele de învățare profundă
Ca și alte tehnici avansate de ML, sistemele de învățare profundă pot învăța în moduri supravegheate sau nesupravegheate. Ele pot fi construite doar cu una sau o combinație de două sau mai multe arhitecturi de rețele neuronale avansate. Unele rețele, cum ar fi rețelele neuronale feed-forward (FNN), mută datele doar într-o singură direcție între straturile de neuroni. În schimb, altele, cum ar fi rețelele neuronale recurente (RNN), ar putea forma bucle interne și, ca efect secundar, se pot comporta ca și cum ar avea memorie.
Arhitecturile avansate, cum ar fi rețelele neuronale convoluționale (CNN) structurează cum și când părți ale datelor sunt repetate în intrarea unui NN. Acest lucru oferă indicii despre unde în date ar trebui să caute rețeaua relații.
Pot fi dezvoltate mai multe rețele neuronale în tandem, fiecare subrețea fiind specializată într-un subset al spațiului cu probleme. De exemplu, rețelele adverse generative (GAN) tind să antreneze modele care încearcă să concureze între ele (unul falsifică date noi care ar trebui să aparțină unui set de date, iar celălalt antrenament pentru a detecta fraudele), iar arhitecturile cu două turnuri colaborează pentru a învăța despre două părți profund interconectate, dar distincte, ale unui set de date.
Combinații mai complexe de arhitecturi sunt, de asemenea, utilizate în mod obișnuit împreună la construirea sistemelor de învățare profundă. Aceste arhitecturi pot fi extinse folosind structuri neuronale specializate, cum ar fi transformatoare și unități de redresare, sau utilizate pentru a emula, implementa și îmbunătăți alte sisteme de învățare automată, cum ar fi arbori de decizie.
Învățarea automată vs. învățarea profundă: diferențe cheie
Învățarea profundă este un subset al învățării automate și are unele constrângeri și avantaje specifice încorporate în acesta. Învățarea automată este un termen general și acoperă o gamă mai largă de opțiuni și compromisuri pentru analiza datelor și detectarea tiparelor din cadrul acestuia. Acest tabel evidențiază diferențele. Mai multe detalii veți găsi mai jos.
Învățare automată (ML) | Învățare profundă (DL) | |
Flexibilitate | General; un subset de AI care cuprinde diverse tehnici de învățare din date, cu multe opțiuni de implementare. | Implementat exclusiv cu rețele neuronale; un subset specializat de ML care se concentrează pe rețele neuronale profunde, cu mai multe straturi și pe tehnici care sunt potrivite pentru acestea. |
Implicarea umană | Acoperă întreaga gamă de algoritmi, de la cei care funcționează cu date structurate și necesită o preprocesare umană semnificativă, până la cei care pot funcționa complet independent. | Se aplică de obicei la seturi de date extrem de mari. Modelele funcționează în cea mai mare parte cu date nestructurate și au o dependență mai mică de procesarea și curatarea umană. |
Domeniul de aplicare | Domeniu de aplicare mai larg, inclusiv algoritmi tradiționali precum regresia liniară, arbori de decizie și gruparea. | Focalizare mai restrânsă în ML, specializată în manipularea datelor la scară largă și a sarcinilor complexe. |
Bazele tehnologiei | Utilizează o varietate de algoritmi, cum ar fi arbori de decizie, mașini vectori suport și metode de ansamblu. | Utilizează rețele neuronale profunde cu multe straturi și tehnici special menite să lucreze cu rețele neuronale, cum ar fi învățarea prin consolidare și propagarea inversă. |
Domenii de aplicare | Oricare și toate domeniile de aplicație în care algoritmii și computerele pot fi utilizați pentru a detecta automat modele în date. | Specializat pentru sarcini care depind de recunoașterea modelelor complexe din volume mari de date nestructurate, cum ar fi analiza de text și imagini cu scop general, rezolvarea problemelor din lumea reală și sarcini generative. |
Interpretabilitate | Poate fi construit în moduri ușor de înțeles și interpretat de către oameni. Au fost studiate mult mai mult timp și au proprietăți binecunoscute. | De obicei, foarte precise, în timp ce întreprind acțiuni care sunt mult mai greu de urmărit și explicat pentru oameni. |
Exemple | Detectare spam, sisteme de recomandare, segmentare a clienților. | Mașini cu conducere autonomă, asistenți virtuali (de exemplu, Siri), sisteme de recunoaștere facială. |
Învățarea profundă depinde de seturi mari de date
Tehnicile de învățare profundă depind adesea de accesul la seturi de date extrem de mari, în timp ce sistemele ML pot fi utile atunci când sunt disponibile puține sau deloc date. De asemenea, dacă este disponibilă input uman calificat și specializat, ML poate profita de el mai explicit decât orice sistem de deep learning.
În general, sistemele ML acoperă o gamă mai largă de tehnici și prezintă o gamă mai flexibilă de implementare. Învățarea profundă se concentrează exclusiv pe tehnici potrivite pentru lucrul cu seturi mari de date, cum ar fi rețelele neuronale profunde și algoritmii lor de sprijin.
ML poate fi mai ușor de optimizat și de înțeles
Cu domeniul său mult mai larg, ML acoperă multe abordări tradiționale și bine studiate ale procesării datelor, cum ar fi arbori de decizie, clustering și multe arome de regresie. Cu decenii dedicate studiului lor, multe dintre aceste abordări au performanțe încorporate bine-cunoscute și alte compromisuri.
Ele oferă implementări mai flexibile decât sistemele de învățare profundă dependente de rețele neuronale și pot fi mai eficiente din punct de vedere al resurselor și al costurilor. Învățarea profundă este, de obicei, grea în resurse și se află la capătul superior al scalei de costuri.
Învățarea profundă este mai puternică și nu la fel de generală
Sistemele de învățare profundă sunt cele mai bune pentru aplicații cu o sferă și o concentrare mai restrânsă, de exemplu, probleme cu depozite mari de date conexe disponibile, timp suficient pentru antrenamentul îndelungat al unei rețele neuronale și când acuratețea execuției este prioritară față de capacitatea de a urmări. exact ce face sistemul și de ce.
Sistemele ML pot fi aplicate la întreaga gamă de probleme în care mașinile pot găsi și aplica automat modele în date, inclusiv cele în care sunt disponibile mai puține date, în care sistemele sunt ușor de înțeles de către oameni și în care precizia ridicată este mai puțin relevantă.
Aplicații ale ML și deep learning
Sistemele și aplicațiile de învățare profundă și bazate pe ML sunt integrate continuu în tot mai multe aspecte ale vieții noastre. Iată câteva exemple binecunoscute mai jos.
Detectare spam
Una dintre cele mai vechi aplicații de învățare automată la scară largă a fost detectarea și filtrarea mesajelor de e-mail spam. Problema este una ideală pentru învățarea automată aplicată.
Există volume mari de e-mailuri și au o structură bine definită. Este ușor să marcați e-mailurile nedorite ca spam, așa că nu este dificil să creați seturi mari de date de e-mailuri marcate ca „spam” sau „șuncă” (ham este opusul spam-ului). Sistemele de clasificare pot fi construite cu ușurință pe deasupra acestor date și apoi utilizate pentru a filtra rapid e-mailurile spam la scară de internet.
Detectarea spamului este un exemplu în care sistemele de învățare profundă nu sunt (încă) la fel de potrivite pentru rezolvare precum tehnicile ML mai tradiționale. În ciuda îmbunătățirilor semnificative, timpul și costurile necesare pentru a menține sistemele de învățare profundă la zi cu cele mai recente progrese în spam nu merită încă o acuratețe mai mare. Sistemele de învățare profundă pot fi utilizate pentru a optimiza conductele ML în general, iar sistemele de instruire ML de detectare a spam-ului la scară largă le pot integra în acest scop.
Sisteme de recomandare
Magazinele de comerț electronic, serviciile de streaming media și piețele online sunt doar câteva dintre exemplele de servicii care depind de posibilitatea de a face recomandări despre locurile în care utilizatorii ar trebui să-și cheltuiască banii. Sistemele de recomandare sunt un alt exemplu tipic de problemă potrivită pentru învățarea automată.
Pe măsură ce utilizatorii consumă media și cumpără online, sistemele de bază pot construi seturi mari de date cu semnale clare (utilizatorul a consumat vs. utilizatorul nu a consumat). Atât învățarea profundă, cât și tehnicile ML mai tradiționale pot fi aplicate acestei probleme; sistemele de recomandare pe scară largă folosesc combinații inteligente ale ambelor tipuri de algoritmi.
Mașini care găsesc trasee și se conduc singure
Algoritmii tradiționali ML nesupravegheați, bazați pe tehnici bine-cunoscute de găsire a rutei, cum ar fi algoritmul lui Dijkstra și algoritmul A*, sunt cei mai potriviți pentru a găsi cea mai bună cale între două puncte de pe o hartă rutieră. Acești algoritmi pot studia hărțile, traficul și alte date în avans, pot descoperi tipare, pot ajusta în timp real pe baza condițiilor din lumea reală și pot funcționa destul de bine.
Când vine vorba de navigarea efectivă a unei mașini între două puncte, totuși, cantitatea și complexitatea informațiilor care trebuie procesate sunt mult prea mari pentru ca orice tehnică tradițională ML să funcționeze. Sistemele de conducere autonomă sunt construite aproape exclusiv cu tehnici de deep-learning.
Beneficiile ML și ale învățării profunde
Când sunt utilizate bine, învățarea automată și sistemele specializate de învățare profundă sunt transformatoare. Ele pot spori experții umani, făcându-și producția mai rapidă, mai de impact, mai puțin costisitoare, de calitate superioară sau o combinație a tuturor celor de mai sus.
Viteză, scară și cost îmbunătățite cu ML
Sistemele ML pot înlocui o parte sau toate lucrările și procesele unui expert, reducând timpul și atenția necesare pentru a finaliza o sarcină. Drept urmare, munca lor poate fi aplicată la o scară mult mai mare decât înainte.
De exemplu, o echipă de tehnicieni care evaluează scanările RMN pentru anomalii ar putea fi în măsură să evalueze fiecare șase scanări pe oră sau aproximativ 200 pe săptămână. Dacă aceeași echipă s-ar concentra în schimb pe antrenarea unui set de algoritmi de învățare automată pentru a face cele mai rutine părți ale analizei lor, algoritmii ar putea evalua mii de scanări RMN pe săptămână, la o fracțiune din cost.
Impact și calitate mai mare cu învățare profundă
Atunci când sunt aplicate problemelor pentru care sistemele de învățare profundă sunt bine adaptate, pot crește sistemele care încorporează ML și pot crește calitatea și impactul lor general.
Continuând exemplul de mai sus, sistemele de învățare profundă ar putea fi aplicate condițiilor cu un volum suficient de mare de scanări RMN. Dacă volumul scanărilor este suficient și după ce sunt dedicate suficient timp și resurse pentru construirea sistemelor de învățare profundă, probabil că vor face o treabă mai bună decât experții în identificarea setului restrâns de anomalii pe care au fost instruiți să le identifice.
Aceste sisteme pot fi apoi implementate la scară pentru un impact maxim, procesând scanări RMN individuale la costuri neglijabile. Analizele tehnicienilor RMN și ale altor experți pot spori rezultatele sistemelor de învățare profundă pentru cazuri neobișnuite sau excepționale, obținând o calitate combinată și mai mare.
Provocările ML și învățarea profundă
În timp ce multe tipuri de muncă pot beneficia enorm de pe urma ML aplicată sau învățarea profundă, încorporarea AI ca acestea într-un sistem poate fi dificilă. Iată câteva dintre cele mai frecvente provocări și obstacole care apar.
Compartimentul dintre cost și precizie
Sistemele informatice mai mari și mai scumpe pot rula algoritmi mai avansati de ML și de învățare profundă mai rapid și la o scară mai mare. Ca rezultat, există un compromis între câți bani sunt cheltuiți pe sistem și cât de eficient este acesta în ceea ce privește hardware-ul și angajarea mai multor experți talentați pentru a-l asambla. Utilizarea eficientă a resurselor limitate în ML și sistemele de învățare profundă necesită o atenție considerabilă.
O dependență de seturi mari de date
ML, în general, și deep learning în mod specific, depind de accesul la seturi mari de date actualizate continuu în timpul fazei de antrenament. Algoritmii sunt la fel de buni ca calitatea și volumul datelor pe care sunt antrenați. Gestionarea eficientă a seturilor mari de date este dificilă și este nevoie de timp și ingeniozitate pentru a aplica ML cel mai eficient la un anumit set de date.
Compartimentul dintre acuratețe și claritate
Sistemele de învățare profundă pot fi antrenate pentru a fi extrem de precise, mult mai mult decât alte sisteme ML construite cu parametri echivalenti. Precizia are un cost; sistemele manipulează datele la scară și folosesc algoritmi avansați care sunt imposibil de înțeles de oameni într-un interval de timp practic.
Algoritmii ML mai tradiționali au fost studiați mult mai mult timp, au caracteristici mai bine definite și pot fi induși să funcționeze în moduri ușor de înțeles de către oameni. Orice implementare de ML și de deep learning trebuie să găsească compromisul ideal între acuratețe și claritate.
Compartimentul dintre părtinirea tehnică și variație
Pe măsură ce sistemele ML cresc în complexitatea algoritmilor, resursele dedicate antrenamentului și cantitatea de date utilizate pentru antrenament, ei pot afla din ce în ce mai multe despre proprietățile datelor lor de antrenament. Acest fenomen se numește părtinire (tehnică); sistemele extrem de părtinitoare vor fi foarte precise atunci când vor vedea date similare cu ceea ce au fost instruiți.
Prejudecățile ridicate sunt adesea în detrimentul unei variații prea mici - sistemul nu va reacționa prea mult la date noi care sunt foarte diferite de ceea ce a văzut la antrenament. Sistemele ideale, care sunt atât prejudecăți reduse, cât și varianță scăzută, sunt dificil de construit. Găsirea echilibrului corect între părtinire și varianță pentru o anumită aplicație este mai ușoară pentru algoritmii tradiționali ML mai bine studiati și mai consacrați. Poate fi dificil de realizat cu algoritmii mai complexi de învățare profundă.
Concluzie
Sistemele de învățare profundă sunt un subset specializat de ML care utilizează rețele neuronale profunde, multistratificate pentru a aborda probleme complexe cu seturi mari de date. Deși oferă o precizie și capacități de procesare superioare, ele vin cu compromisuri, cum ar fi interpretabilitate redusă, dependență de date extinse și flexibilitate limitată de optimizare.
În schimb, metodele tradiționale ML sunt adesea mai rentabile, mai ușor de implementat și oferă rezultate mai transparente și mai previzibile. De asemenea, sunt mai ușor de ajustat pentru sarcini specifice. Ambele abordări au puncte forte și puncte slabe distincte, iar înțelegerea aplicațiilor și limitărilor lor este crucială pentru implementarea eficientă în scenariile din lumea reală.