Machine Learning 101: Ce este și cum funcționează
Publicat: 2024-05-23Învățarea automată (ML) a devenit rapid una dintre cele mai importante tehnologii ale timpului nostru. Acesta stă la baza produselor precum ChatGPT, recomandări Netflix, mașini cu conducere autonomă și filtre de spam prin e-mail. Pentru a vă ajuta să înțelegeți această tehnologie generalizată, acest ghid acoperă ce este ML (și ce nu este), cum funcționează și impactul său.
Cuprins
- Ce este învățarea automată?
- Cum funcționează învățarea automată
- Tip de învățare automată
- Aplicații
- Avantaje
- Dezavantaje
- Viitorul ML
- Concluzie
Ce este învățarea automată?
Pentru a înțelege învățarea automată, trebuie mai întâi să înțelegem inteligența artificială (AI). Deși cele două sunt folosite interschimbabil, nu sunt la fel. Inteligența artificială este atât un scop, cât și un domeniu de studiu. Scopul este de a construi sisteme informatice capabile să gândească și să raționeze la niveluri umane (sau chiar supraomenești). AI constă, de asemenea, în multe metode diferite de a ajunge acolo. Învățarea automată este una dintre aceste metode, ceea ce o face un subset al inteligenței artificiale.
Învățarea automată se concentrează în mod special pe utilizarea datelor și a statisticilor în urmărirea AI. Scopul este de a crea sisteme inteligente care să poată învăța prin furnizarea de numeroase exemple (date) și care nu trebuie să fie programate în mod explicit. Cu date suficiente și un algoritm de învățare bun, computerul preia tiparele din date și își îmbunătățește performanța.
În schimb, abordările non-ML ale AI nu depind de date și au o logică codificată scrisă. De exemplu, puteți crea un bot AI cu performanțe supraomenești doar codând toate mișcările optime (există 255.168 posibile jocuri tic-tac-toe, deci ar dura ceva timp, dar tot este posibil). Totuși, ar fi imposibil să codificați un bot de șah AI – există mai multe jocuri de șah posibile decât atomi în univers. ML ar funcționa mai bine în astfel de cazuri.
O întrebare rezonabilă în acest moment este, cum se îmbunătățește exact un computer când îi dați exemple?
Cum funcționează învățarea automată
În orice sistem ML, aveți nevoie de trei lucruri: setul de date, modelul ML (GPT este un exemplu) și algoritmul de antrenament. Mai întâi, introduceți exemple din setul de date. Modelul prezice apoi rezultatul potrivit pentru acel exemplu. Dacă modelul este greșit, utilizați algoritmul de antrenament pentru a face ca modelul să fie mai potrivit pentru exemple similare în viitor. Repetați acest proces până când rămâneți fără date sau sunteți mulțumit de rezultate. Odată ce finalizați acest proces, puteți utiliza modelul pentru a prezice datele viitoare.
Un exemplu de bază al acestui proces este învățarea unui computer să recunoască cifrele scrise de mână precum cele de mai jos.
Sursă
Colectați mii sau sute de mii de imagini cu cifre. Începi cu un model ML care nu a văzut încă niciun exemplu. Introduceți imaginile în model și îi cereți să prezică ce număr crede că este în imagine. Va returna un număr între zero și nouă, să spunem unul. Apoi, în esență îi spui: „Acest număr este de fapt cinci, nu unul.” Algoritmul de antrenament actualizează modelul, astfel încât este mai probabil să răspundă cu cinci data viitoare. Repeți acest proces pentru (aproape) toate pozele disponibile și, în mod ideal, ai un model performant, care poate recunoaște corect cifrele în 90% din timp. Acum puteți folosi acest model pentru a citi milioane de cifre la scară mai repede decât ar putea un om. În practică, Serviciul Poștal al Statelor Unite folosește modele ML pentru a citi 98% din adresele scrise de mână.
Puteți petrece luni sau ani disecând detaliile chiar și pentru o mică parte a acestui proces (uitați-vă la câte versiuni diferite de algoritmi de optimizare există).
Tipuri comune de învățare automată
Există de fapt patru tipuri diferite de metode de învățare automată: supravegheată, nesupravegheată, semi-supravegheată și de întărire. Principala diferență este modul în care sunt etichetate datele lor (adică, cu sau fără răspunsul corect).
Învățare supravegheată
Modelele de învățare supravegheată primesc date etichetate (cu răspunsuri corecte). Exemplul de cifre scrise de mână se încadrează în această categorie: putem spune modelului: „Cinci este răspunsul corect”. Modelul urmărește să învețe conexiunile explicite dintre intrări și ieșiri. Aceste modele pot scoate fie etichete discrete (de exemplu, prezice fie „pisica” fie „câine” având în vedere o imagine a unui animal de companie) sau numere (de exemplu, prețul estimat al unei case având în vedere numărul de paturi, băi, locație etc.) .
Învățare nesupravegheată
Modelele de învățare nesupravegheate primesc date neetichetate (fără răspunsuri corecte). Aceste modele identifică modele în datele de intrare pentru a grupa datele în mod semnificativ. De exemplu, având în vedere multe imagini cu pisici și câini fără un răspuns corect, modelul ML nesupravegheat ar analiza asemănările și diferențele dintre imagini pentru a grupa imaginile de câini și pisici împreună. Clustering, regulile de asociere și reducerea dimensionalității sunt metode de bază în ML nesupravegheat.
Învățare semi-supravegheată
Învățarea semi-supravegheată este o abordare de învățare automată care se află între învățarea supravegheată și nesupravegheată. Această metodă oferă o cantitate semnificativă de date neetichetate și un set mai mic de date etichetate pentru antrenarea modelului. În primul rând, modelul este antrenat pe datele etichetate și apoi atribuie etichete datelor neetichetate, comparând asemănarea acestora cu datele etichetate.
Consolidarea învățării
Învățarea prin întărire nu are un set dat de exemple și etichete. În schimb, modelului i se oferă un mediu (de exemplu, jocurile sunt obișnuite), o funcție de recompensă și un scop. Modelul învață să atingă obiectivul prin încercare și eroare. Va face o acțiune, iar funcția de recompensă îi spune dacă acțiunea ajută la îndeplinirea obiectivului general. Apoi, modelul se actualizează pentru a face mai mult sau mai puțin din acea acțiune. Modelul poate învăța să atingă obiectivul făcând acest lucru de mai multe ori.
Un exemplu faimos de model de învățare prin întărire este AlphaGo Zero. Acest model a fost antrenat pentru a câștiga jocuri de Go și a primit doar starea tablei Go. Apoi a jucat milioane de jocuri împotriva sa, învățând în timp care mișcări i-au oferit avantaje și care nu. A atins performanțe la nivel supraomenesc în 70 de ore de antrenament, peste campionii mondiali Go.
Învățare auto-supravegheată
Există de fapt un al cincilea tip de învățare automată care a devenit important recent: învățarea auto-supravegheată. Modelele de învățare auto-supravegheate primesc date neetichetate, dar învață să creeze etichete din aceste date. Aceasta stă la baza modelelor GPT din spatele ChatGPT. În timpul antrenamentului GPT, modelul își propune să prezică următorul cuvânt având în vedere un șir de cuvinte introduse. De exemplu, luați propoziția „Pisica sa așezat pe saltea”. GPT primește „The” și i se cere să prezică ce cuvânt urmează. Își face predicția (să zicem „câine”), dar din moment ce are propoziția originală, știe care este răspunsul corect: „pisica”. Apoi, GPT primește „Pisica” și i se cere să prezică următorul cuvânt și așa mai departe. Procedând astfel, poate învăța modele statistice între cuvinte și multe altele.
Aplicații ale învățării automate
Orice problemă sau industrie care are o mulțime de date poate folosi ML. Multe industrii au înregistrat rezultate extraordinare în acest sens, iar mai multe cazuri de utilizare apar în mod constant. Iată câteva cazuri comune de utilizare a ML:
Scris
ML modelează produse de scriere AI generatoare de putere, cum ar fi Grammarly. Fiind instruit pe cantități mari de scriere excelentă, Grammarly vă poate crea o schiță, vă poate ajuta să rescrieți și să lustruiți și să faceți brainstorming idei cu dvs., totul în tonul și stilul preferat.
Recunoaștere a vorbirii
Siri, Alexa și versiunea vocală a ChatGPT depind toate de modelele ML. Aceste modele sunt instruite pe multe exemple audio, împreună cu transcrierile corecte corespunzătoare. Cu aceste exemple, modelele pot transforma vorbirea în text. Fără ML, această problemă ar fi aproape insolubilă, deoarece toată lumea are moduri diferite de a vorbi și de a pronunța. Ar fi imposibil de enumerat toate posibilitățile.
Recomandări
În spatele fluxurilor tale de pe TikTok, Netflix, Instagram și Amazon se află modele de recomandare ML. Aceste modele sunt instruite pe multe exemple de preferințe (de exemplu, oamenilor ca tine le-a plăcut acest film peste acel film, acest produs față de acel produs) pentru a vă arăta articole și conținut pe care doriți să le vedeți. De-a lungul timpului, modelele pot include, de asemenea, preferințele dvs. specifice pentru a crea un feed care să vă atragă în mod special.
Detectarea fraudei
Băncile folosesc modele ML pentru a detecta frauda cu cardul de credit. Furnizorii de e-mail folosesc modele ML pentru a detecta și redirecționa e-mailurile spam. Modelelor de fraudă ML li se oferă multe exemple de date frauduloase; aceste modele învață apoi modele printre date pentru a identifica frauda în viitor.
Mașini cu conducere autonomă
Mașinile cu conducere autonomă folosesc ML pentru a interpreta și a naviga pe drumuri. ML ajută mașinile să identifice pietonii și benzile de drum, să prezică mișcarea altor mașini și să decidă următoarea lor acțiune (de exemplu, accelerarea, schimbarea benzii etc.). Mașinile cu conducere autonomă dobândesc competențe prin instruirea pe miliarde de exemple folosind aceste metode ML.
Avantajele învățării automate
Când este făcut bine, ML poate fi transformator. În general, modelele ML pot face procesele mai ieftine, mai bune sau ambele.
Eficiența costurilor forței de muncă
Modelele ML instruite pot simula munca unui expert pentru o fracțiune din cost. De exemplu, un agent imobiliar expert uman are o mare intuiție când vine vorba de cât costă o casă, dar asta poate dura ani de pregătire. Agenții imobiliari experți (și experți de orice fel) sunt, de asemenea, scump de angajat. Cu toate acestea, un model ML antrenat pe milioane de exemple s-ar putea apropia de performanța unui agent imobiliar expert. Un astfel de model ar putea fi antrenat în câteva zile și ar costa mult mai puțin de utilizat odată antrenat. Agenții imobiliari mai puțin experimentați pot folosi aceste modele pentru a lucra mai mult în mai puțin timp.
Eficiența timpului
Modelele ML nu sunt constrânse de timp în același mod în care sunt oamenii. AlphaGo Zero a jucat4,9 milioanede jocuri Go în trei zile de antrenament . Acest lucru ar dura ani umani, dacă nu decenii, pentru a face acest lucru. Datorită acestei scalabilități, modelul a putut explora o mare varietate de mișcări și poziții Go, ducând la performanțe supraomenești. Modelele ML pot chiar să înțeleagă modelele pe care experții le dor; AlphaGo Zero chiar a găsit și a folosit mișcări care nu sunt jucate de obicei de oameni. Acest lucru nu înseamnă însă că experții nu mai sunt valoroși; Experții Go s-au îmbunătățit mult folosind modele precum AlphaGo pentru a încerca noi strategii.
Dezavantajele învățării automate
Desigur, există și dezavantaje în utilizarea modelelor ML. Și anume, sunt scumpe de antrenat, iar rezultatele lor nu sunt ușor de explicat.
Antrenament scump
Antrenamentul ML poate deveni costisitor. De exemplu, AlphaGo Zero a costat 25 de milioane de dolari pentru dezvoltare, iar GPT-4 a costat mai mult de 100 de milioane de dolari pentru a dezvolta. Principalele costuri pentru dezvoltarea modelelor ML sunt etichetarea datelor, cheltuielile cu hardware-ul și salariile angajaților.
Modelele ML supravegheate excelente necesită milioane de exemple etichetate, fiecare dintre ele trebuie să fie etichetat de un om. Odată ce toate etichetele sunt colectate, este nevoie de hardware specializat pentru a antrena modelul. Unitățile de procesare grafică (GPU) și unitățile de procesare tensor (TPU) sunt standardul pentru hardware-ul ML și pot fi costisitoare de închiriat sau cumpărat – GPU-urile pot costa între mii și zeci de mii de dolari pentru cumpărare.
În cele din urmă, dezvoltarea unor modele ML excelente necesită angajarea de cercetători sau ingineri de învățare automată, care pot cere salarii mari datorită abilităților și expertizei lor.
Claritate limitată în luarea deciziilor
Pentru multe modele ML, nu este clar de ce dau rezultatele pe care le fac. AlphaGo Zero nu poate explica raționamentul din spatele luării deciziilor; știe că o mutare va funcționa într-o situație specifică, dar nude ce. Acest lucru poate avea consecințe semnificative atunci când modelele ML sunt utilizate în situații de zi cu zi. Modelele ML utilizate în asistența medicală pot da rezultate incorecte sau părtinitoare și este posibil să nu le știm deoarece motivul din spatele rezultatelor sale este opac. Prejudecățile, în general, reprezintă o mare preocupare cu modelele ML, iar lipsa de explicabilitate face problema mai greu de rezolvat. Aceste probleme se aplică în special modelelor de învățare profundă. Modelele de învățare profundă sunt modele ML care utilizează rețele neuronale cu mai multe straturi pentru a procesa intrarea. Ei sunt capabili să gestioneze date și întrebări mai complicate.
Pe de altă parte, modelele ML mai simple, mai „superficiale” (cum ar fi arbori de decizie și modele de regresie) nu suferă de aceleași dezavantaje. Încă necesită o mulțime de date, dar sunt ieftine de antrenat altfel. Ele sunt, de asemenea, mai explicabile. Dezavantajul este că astfel de modele pot fi limitate ca utilitate; aplicațiile avansate precum GPT necesită modele mai complexe.
Viitorul învățării automate
Modelele ML bazate pe transformatoare au făcut furori în ultimii ani. Acesta este tipul specific de model ML care alimentează GPT (T în GPT), Grammarly și Claude AI. Modelele ML bazate pe difuzie, care alimentează produse de creare de imagini precum DALL-E și Midjourney, au primit, de asemenea, atenție.
Această tendință nu pare să se schimbe prea curând. Companiile ML se concentrează pe creșterea dimensiunii modelelor lor - modele mai mari, care au capabilități mai bune și seturi de date mai mari pentru a le instrui. GPT-4 a avut de 10 ori numărul de parametri de model pe care îl avea GPT-3, de exemplu. Probabil vom vedea și mai multe industrii care folosesc AI generativă în produsele lor pentru a crea experiențe personalizate pentru utilizatori.
Robotica se încălzește și ea. Cercetătorii folosesc ML pentru a crea roboți care pot muta și utiliza obiecte precum oamenii. Acești roboți pot experimenta în mediul lor și pot folosi învățarea prin întărire pentru a se adapta rapid și a-și atinge obiectivele, de exemplu, cum să lovească o minge de fotbal.
Cu toate acestea, pe măsură ce modelele ML devin mai puternice și mai răspândite, există îngrijorări cu privire la impactul lor potențial asupra societății. Probleme precum părtinirea, confidențialitatea și înlocuirea locurilor de muncă sunt dezbătute aprins și există o recunoaștere din ce în ce mai mare a nevoii de linii directoare etice și practici de dezvoltare responsabile.
Concluzie
Învățarea automată este un subset al AI, cu scopul explicit de a realiza sisteme inteligente, permițându-le să învețe din date. Învățarea supravegheată, nesupravegheată, semi-supravegheată și prin întărire sunt principalele tipuri de ML (împreună cu învățarea auto-supravegheată). ML se află în centrul multor produse noi care apar astăzi, cum ar fi ChatGPT, mașinile cu conducere autonomă și recomandările Netflix. Poate fi mai ieftin sau mai bun decât performanța umană, dar, în același timp, este costisitor inițial și mai puțin explicabil și orientabil. ML este, de asemenea, gata să devină și mai popular în următorii câțiva ani.
Există o mulțime de complexități în ML, iar oportunitatea de a învăța și de a contribui la domeniu se extinde. În special, ghidurile Grammarly despre AI, deep learning și ChatGPT vă pot ajuta să aflați mai multe despre alte părți importante ale acestui domeniu. Dincolo de asta, intrarea în detaliile ML (cum ar fi modul în care sunt colectate datele, cum arată de fapt modelele și algoritmii din spatele „învățarii”) vă poate ajuta să le încorporați eficient în munca dvs.
Având în vedere că ML continuă să crească – și cu așteptarea că va atinge aproape fiecare industrie – acum este momentul să începeți călătoria dvs. ML!