Uczenie maszynowe a uczenie głębokie: objaśnienie kluczowych różnic

Opublikowany: 2024-11-20

Chociaż uczenie maszynowe i głębokie uczenie się są często używane zamiennie, odnoszą się one do dwóch poddziedzin sztucznej inteligencji. Reprezentują różne (ale powiązane) podejścia do analizy danych; głębokie uczenie się jest podzbiorem uczenia maszynowego. Rozróżnienia między nimi są ważne i stają się szczególnie istotne podczas komunikowania się na tematy techniczne — na przykład podczas oceny narzędzi i usług analizy danych, podejmowania decyzji, jakie podejście zastosować do rozwiązania problemu z danymi lub prowadzenia głębokich rozmów z inżynierami i ekspertami dziedzinowymi.

Spis treści:

  • Co to jest uczenie maszynowe?
  • Co to jest głębokie uczenie się?
  • Uczenie maszynowe a uczenie głębokie
  • Zastosowania ML i głębokiego uczenia się
  • Korzyści z uczenia maszynowego i głębokiego uczenia się
  • Wyzwania ML i głębokiego uczenia się
  • Wniosek

Co to jest uczenie maszynowe?

Uczenie maszynowe (ML) jest podzbiorem sztucznej inteligencji (AI). Nazwa odnosi się do wszystkich systemów, w których maszyna (zwykle komputer lub kombinacja komputerów) stosuje automatyczne techniki matematyczne i statystyczne w celu odkrywania lub uczenia się wzorców na podstawie danych.

Celem ML jest budowanie systemów inteligentnych i niezależnych. Oznacza to, że będzie uczyć się wzorców i ulepszać je na podstawie danych, starając się mieć kilka zakodowanych na stałe elementów i ograniczyć interakcję między ludźmi. Dziedzina uczenia maszynowego istnieje od lat 60. XX wieku i od tego czasu opracowano i zbadano wiele algorytmów i technik.

Rodzaje uczenia maszynowego

Wiele różnych typów systemów kwalifikuje się jako ML. Oto najczęstsze:

  • Modele uczenia się bez nadzoru wykorzystują nieustrukturyzowane dane przy niewielkim lub żadnym wsparciu ze strony człowieka.
  • Modele uczenia się pod nadzorem wymagają wskazówek i zależą od wkładu człowieka, w tym na przykład od wkładu w zakresie formatu i struktury danych.
  • Modele częściowo nadzorowane otrzymują wskazówki na podstawie niewielkiej ilości ustrukturyzowanych danych, a następnie wykorzystują wnioski z tych danych w celu udoskonalenia ich dokładności na większej puli danych nieustrukturyzowanych.
  • Modele wzmocnienia uczą się podejmować decyzje poprzez interakcję z otoczeniem. Modele te podejmują działania, otrzymują pozytywną lub negatywną informację zwrotną, a następnie dostosowują zachowanie, aby osiągnąć pożądany cel.
  • Modele samonadzorowane tworzą własne etykiety, korzystając z surowych, nieustrukturyzowanych danych.

Pracuj mądrzej dzięki Grammarly
Partner w pisaniu AI dla każdego, kto ma pracę do wykonania

Co to jest głębokie uczenie się?

Najnowsze postępy w uczeniu maszynowym wynikają głównie z wyspecjalizowanego podzbioru uczenia maszynowego znanego jako głębokie uczenie się. Głębokie uczenie się odnosi się do podzbioru systemów uczenia maszynowego, które są wdrażane na podzbiorze sieci neuronowych zwanych głębokimi sieciami neuronowymi. Głębokie sieci neuronowe to sieci neuronowe, które są duże, silnie ze sobą powiązane i mają wiele warstw neuronów dostępnych do przetwarzania.

Rodzaje sieci głębokiego uczenia się

Podobnie jak inne zaawansowane techniki uczenia maszynowego, systemy głębokiego uczenia się mogą uczyć się w sposób nadzorowany lub bez nadzoru. Można je zbudować w oparciu o jedną lub kombinację dwóch lub większej liczby zaawansowanych architektur sieci neuronowych. Niektóre sieci, takie jak sieci neuronowe ze sprzężeniem zwrotnym (FNN), przesyłają dane tylko w jednym kierunku między warstwami neuronów. Z kolei inne, takie jak rekurencyjne sieci neuronowe (RNN), mogą tworzyć wewnętrzne pętle i jako efekt uboczny zachowywać się tak, jakby miały pamięć.

Zaawansowane architektury, takie jak splotowe sieci neuronowe (CNN), organizują sposób i czas powtarzania części danych na wejściu sieci NN. Daje to wskazówki dotyczące tego, gdzie w danych sieć powinna szukać relacji.

Można rozwijać wiele sieci neuronowych w tandemie, przy czym każda podsieć specjalizuje się w podzbiorze przestrzeni problemowej. Na przykład generatywne sieci kontradyktoryjne (GAN) mają tendencję do uczenia modeli, które próbują ze sobą konkurować (jeden fałszuje nowe dane, które powinny należeć do zbioru danych, a drugi szkoli w celu wykrywania oszustw), a architektury dwuwieżowe współpracują, aby się uczyć. około dwóch głęboko powiązanych, ale odrębnych części zbioru danych.

Bardziej złożone kombinacje architektur są również powszechnie używane razem podczas tworzenia systemów głębokiego uczenia się. Architektury te można rozszerzać przy użyciu wyspecjalizowanych struktur neuronowych, takich jak transformatory i prostowniki, lub wykorzystywać do emulacji, wdrażania i ulepszania innych systemów uczenia maszynowego, takich jak drzewa decyzyjne.

Uczenie maszynowe a uczenie głębokie: kluczowe różnice

Głębokie uczenie się jest podzbiorem uczenia maszynowego i wiąże się z pewnymi specyficznymi ograniczeniami i zaletami. Uczenie maszynowe to termin ogólny i obejmuje szerszy zakres opcji i kompromisów w zakresie analizowania danych i wykrywania w nich wzorców. W tej tabeli podkreślono różnice. Więcej szczegółów znajdziesz poniżej.

Uczenie maszynowe (ML) Głębokie uczenie się (DL)
Elastyczność Ogólny; podzbiór sztucznej inteligencji obejmujący różne techniki uczenia się na podstawie danych, z wieloma opcjami wdrożenia. Realizowane wyłącznie z sieciami neuronowymi; wyspecjalizowany podzbiór uczenia maszynowego skupiający się na głębokich, wielowarstwowych sieciach neuronowych i dobrze do nich dostosowanych technikach.
Zaangażowanie człowieka Obejmuje pełen zakres algorytmów, od tych, które działają z danymi strukturalnymi i wymagają znacznego wstępnego przetwarzania przez człowieka, po te, które mogą działać w pełni niezależnie. Zwykle stosowane do bardzo dużych zbiorów danych. Modele działają głównie z danymi nieustrukturyzowanymi i są w mniejszym stopniu zależne od przetwarzania i sprawdzania przez człowieka.
Zakres Szerszy zakres, obejmujący tradycyjne algorytmy, takie jak regresja liniowa, drzewa decyzyjne i grupowanie. Węższe skupienie w ML, specjalizacja w obsłudze danych na dużą skalę i złożonych zadaniach.
Podstawy technologii Wykorzystuje różnorodne algorytmy, takie jak drzewa decyzyjne, maszyny wektorów nośnych i metody zespołowe. Wykorzystuje głębokie sieci neuronowe z wieloma warstwami i technikami specjalnie przeznaczonymi do pracy z sieciami neuronowymi, takimi jak uczenie się przez wzmacnianie i propagacja wsteczna.
Obszary zastosowań Wszelkie obszary zastosowań, w których można zastosować algorytmy i komputery do automatycznego wykrywania wzorców w danych. Specjalizuje się w zadaniach wymagających rozpoznawania złożonych wzorców na podstawie dużych ilości nieustrukturyzowanych danych, takich jak ogólna analiza tekstu i obrazów, rozwiązywanie problemów w świecie rzeczywistym i zadania generatywne.
Interpretowalność Można je budować w sposób łatwy do zrozumienia i zinterpretowania przez ludzi. Są badane znacznie dłużej i mają dobrze znane właściwości. Zwykle bardzo dokładny, podczas podejmowania działań, które ludziom są znacznie trudniejsze do zrozumienia i wyjaśnienia.
Przykłady Wykrywanie spamu, systemy rekomendacji, segmentacja klientów. Samochody autonomiczne, wirtualni asystenci (np. Siri), systemy rozpoznawania twarzy.

Głębokie uczenie się zależy od dużych zbiorów danych

Techniki głębokiego uczenia się często zależą od dostępu do niezwykle dużych zbiorów danych, podczas gdy systemy uczenia maszynowego mogą być przydatne, gdy dostępnych jest niewiele danych lub nie ma ich wcale. Ponadto, jeśli dostępny jest wykwalifikowany i wyspecjalizowany wkład człowieka, ML może z niego skorzystać w bardziej wyraźny sposób niż jakikolwiek inny system głębokiego uczenia się.

Ogólnie rzecz biorąc, systemy uczenia maszynowego obejmują szerszy zakres technik i charakteryzują się bardziej elastycznym zakresem implementacji. Głębokie uczenie się koncentruje się wyłącznie na technikach odpowiednich do pracy z dużymi zbiorami danych, takimi jak głębokie sieci neuronowe i wspierające je algorytmy.

ML może być łatwiejszy do optymalizacji i zrozumienia

Dzięki znacznie szerszemu zakresowi ML obejmuje wiele tradycyjnych i dobrze zbadanych podejść do przetwarzania danych, takich jak drzewa decyzyjne, grupowanie i wiele odmian regresji. Po dziesięcioleciach badań wiele z tych podejść ma dobrze znaną wbudowaną wydajność i inne kompromisy.

Oferują bardziej elastyczne wdrożenia niż systemy głębokiego uczenia się zależne od sieci neuronowych i mogą być bardziej oszczędne pod względem zasobów i kosztów. Głębokie uczenie się zwykle wymaga dużych zasobów i znajduje się w górnej części skali kosztów.

Głębokie uczenie się jest potężniejsze i nie tak ogólne

Systemy głębokiego uczenia się najlepiej sprawdzają się w zastosowaniach o węższym zakresie i skupieniu, na przykład w przypadku problemów z dużymi zbiorami dostępnych powiązanych danych, wystarczającą ilością czasu na długotrwałe szkolenie sieci neuronowej oraz gdy dokładność wykonania jest ważniejsza od możliwości śledzenia dokładnie, co system robi i dlaczego.

Systemy uczenia maszynowego można zastosować w przypadku pełnego zakresu problemów, w których maszyny mogą automatycznie znajdować i stosować wzorce w danych, w tym takich, w których dostępnych jest mniej danych, gdzie systemy są łatwe do zrozumienia dla ludzi i gdzie wysoka dokładność jest mniej istotna.

Zastosowania ML i głębokiego uczenia się

Systemy i aplikacje oparte na uczeniu maszynowym i głębokim uczeniu się są stale osadzane w coraz większej liczbie aspektów naszego życia. Poniżej znajduje się kilka dobrze znanych przykładów.

Wykrywanie spamu

Jedną z najwcześniejszych aplikacji do uczenia maszynowego na dużą skalę było wykrywanie i filtrowanie spamowych wiadomości e-mail. Problem jest idealny do stosowanego uczenia maszynowego.

Istnieje duża liczba e-maili i mają one dobrze zdefiniowaną strukturę. Oznaczenie niechcianych wiadomości e-mail jako spam jest łatwe, więc tworzenie dużych zbiorów danych wiadomości e-mail oznaczonych jako „spam” lub „szynka” nie jest trudne (szynka jest przeciwieństwem spamu). Na podstawie tych danych można łatwo zbudować systemy klasyfikacji, a następnie wykorzystać je do szybkiego filtrowania wiadomości spamowych w skali Internetu.

Wykrywanie spamu to jeden z przykładów, w których systemy głębokiego uczenia się nie są (jeszcze) tak dobrze przystosowane do rozwiązywania problemów, jak bardziej tradycyjne techniki uczenia maszynowego. Pomimo znaczących ulepszeń, czas i koszty wymagane do aktualizowania systemów głębokiego uczenia się o najnowsze osiągnięcia w zakresie spamu nie są jeszcze warte ich większej dokładności. Systemy głębokiego uczenia się można ogólnie wykorzystać do optymalizacji potoków uczenia maszynowego, a systemy szkoleniowe w zakresie uczenia maszynowego na dużą skalę mogą je integrować w tym celu.

Systemy rekomendacji

Sklepy e-commerce, usługi strumieniowego przesyłania multimediów i platformy handlowe online to tylko niektóre przykłady usług, które zależą od możliwości przedstawiania rekomendacji dotyczących tego, gdzie użytkownicy powinni wydawać pieniądze. Systemy rekomendacji to kolejny typowy przykład problemu dobrze dopasowanego do uczenia maszynowego.

Gdy użytkownicy korzystają z mediów i robią zakupy online, podstawowe systemy mogą tworzyć duże zbiory danych z wyraźnymi sygnałami (użytkownik skonsumował vs. użytkownik nie skonsumował). Do tego problemu można zastosować zarówno głębokie uczenie się, jak i bardziej tradycyjne techniki uczenia maszynowego; wielkoskalowe systemy rekomendacyjne wykorzystują sprytne kombinacje obu typów algorytmów.

Samochody poszukujące ścieżki i autonomiczne

Tradycyjne algorytmy ML bez nadzoru, oparte na dobrze znanych technikach wyszukiwania tras, takich jak algorytm Dijkstry i algorytm A*, najlepiej nadają się do znajdowania najlepszej ścieżki między dwoma punktami na mapie drogowej. Algorytmy te mogą z wyprzedzeniem badać mapy, ruch drogowy i inne dane, odkrywać wzorce, dostosowywać się w czasie rzeczywistym w oparciu o rzeczywiste warunki i działają całkiem dobrze.

Jednak jeśli chodzi o faktyczne nawigowanie samochodem między dwoma punktami, ilość i złożoność przetwarzanych informacji jest zbyt duża, aby można było z nimi pracować w przypadku jakiejkolwiek tradycyjnej techniki uczenia maszynowego. Systemy autonomiczne są zbudowane prawie wyłącznie przy użyciu technik głębokiego uczenia się.

Korzyści z uczenia maszynowego i głębokiego uczenia się

Dobrze stosowane uczenie maszynowe i wyspecjalizowane systemy głębokiego uczenia się mają charakter transformacyjny. Mogą wzmacniać ludzkich ekspertów, sprawiając, że ich wyniki będą szybsze, skuteczniejsze, tańsze i wyższej jakości lub będą połączeniem wszystkich powyższych.

Większa szybkość, skala i koszt dzięki uczeniu maszynowemu

Systemy uczenia maszynowego mogą zastąpić część lub całość pracy i procesów eksperta, redukując czas i uwagę potrzebne do wykonania zadania. Dzięki temu ich prace można zastosować na znacznie większą skalę niż dotychczas.

Na przykład zespół techników oceniających skany MRI pod kątem nieprawidłowości może być w stanie ocenić sześć skanów na godzinę, czyli około 200 tygodniowo. Gdyby zamiast tego ten sam zespół skupił się na szkoleniu zestawu algorytmów uczenia maszynowego do wykonywania najbardziej rutynowych części analiz, algorytmy mogłyby oceniać tysiące skanów MRI tygodniowo za ułamek kosztów.

Większy wpływ i jakość dzięki głębokiemu uczeniu się

Stosowane do problemów, do których dobrze nadają się systemy głębokiego uczenia się, mogą ulepszyć systemy wykorzystujące ML i zwiększyć ich ogólną jakość i wpływ.

Kontynuując powyższy przykład, systemy głębokiego uczenia się można zastosować w warunkach, w których występuje wystarczająco duża liczba skanów MRI. Jeśli liczba skanów będzie wystarczająca i po poświęceniu wystarczającej ilości czasu i zasobów na budowanie systemów głębokiego uczenia się, prawdopodobnie wykonają oni lepszą robotę niż eksperci, identyfikując wąski zestaw nieprawidłowości, do identyfikowania których zostali przeszkoleni.

Systemy te można następnie wdrożyć na dużą skalę, aby uzyskać maksymalny efekt, przetwarzając poszczególne skany MRI przy znikomych kosztach. Analizy przeprowadzane przez techników MRI i innych ekspertów mogą zwiększyć wydajność systemów głębokiego uczenia się w nietypowych lub wyjątkowych przypadkach, osiągając jeszcze wyższą łączną jakość.

Wyzwania ML i głębokiego uczenia się

Choć zastosowanie uczenia maszynowego lub głębokiego uczenia się może przynieść ogromne korzyści w wielu rodzajach pracy, włączenie takiej sztucznej inteligencji do systemu może być trudne. Oto niektóre z najczęstszych wyzwań i przeszkód, które się pojawiają.

Kompromis pomiędzy kosztem a dokładnością

Większe i droższe systemy komputerowe mogą szybciej i na większą skalę uruchamiać bardziej zaawansowane algorytmy uczenia maszynowego i głębokiego uczenia się. W rezultacie istnieje kompromis pomiędzy ilością pieniędzy wydaną na system a jego efektywnością sprzętową i zatrudnieniem bardziej utalentowanych ekspertów do jego montażu. Efektywne wykorzystanie ograniczonych zasobów w systemach uczenia maszynowego i głębokiego uczenia się wymaga dużej uwagi.

Zależność od dużych zbiorów danych

ML, ogólnie rzecz biorąc, a w szczególności głębokie uczenie się, zależy od dostępu do stale aktualizowanych dużych zbiorów danych na etapie szkolenia. Algorytmy są tak dobre, jak jakość i ilość danych, na których są trenowane. Efektywne zarządzanie dużymi zbiorami danych jest trudne, a najskuteczniejsze zastosowanie uczenia maszynowego do danego zbioru danych wymaga czasu i pomysłowości.

Kompromis między dokładnością a przejrzystością

Systemy głębokiego uczenia się można wyszkolić tak, aby były niezwykle dokładne, znacznie bardziej niż inne systemy ML zbudowane z równoważnymi parametrami. Dokładność ma swoją cenę; systemy manipulują danymi na dużą skalę i wykorzystują zaawansowane algorytmy, których człowiek nie jest w stanie zrozumieć w praktycznym terminie.

Bardziej tradycyjne algorytmy ML były badane znacznie dłużej, mają lepiej zdefiniowane cechy i można je nakłonić do działania w sposób łatwy do zrozumienia dla człowieka. Każda implementacja uczenia maszynowego i głębokiego uczenia się musi znaleźć idealny kompromis między dokładnością i przejrzystością.

Kompromis między stronniczością techniczną a wariancją

W miarę jak systemy ML zwiększają złożoność algorytmów, zasoby przeznaczone na szkolenie i ilość danych wykorzystywanych do szkolenia, mogą dowiedzieć się coraz więcej o właściwościach swoich danych szkoleniowych. Zjawisko to nazywa się stronniczością (techniczną); wyjątkowo stronnicze systemy będą bardzo dokładne, gdy zobaczą dane podobne do tych, na których zostali przeszkoleni.

Wysokie odchylenie często odbywa się kosztem zbyt małej wariancji — system nie zareaguje zbytnio na nowe dane, które bardzo różnią się od tych, które zaobserwował podczas uczenia. Idealne systemy, które charakteryzują się zarówno niskim obciążeniem, jak i niską wariancją, są trudne do zbudowania. Znalezienie właściwej równowagi między obciążeniem a wariancją dla konkretnego zastosowania jest łatwiejsze w przypadku lepiej zbadanych i bardziej ugruntowanych tradycyjnych algorytmów ML. Może to być trudne do osiągnięcia w przypadku bardziej złożonych algorytmów głębokiego uczenia się.

Wniosek

Systemy głębokiego uczenia się to wyspecjalizowany podzbiór uczenia maszynowego, który wykorzystuje głębokie, wielowarstwowe sieci neuronowe do rozwiązywania złożonych problemów z dużymi zbiorami danych. Chociaż oferują doskonałą dokładność i możliwości przetwarzania, wiążą się z kompromisami, takimi jak zmniejszona interpretowalność, poleganie na obszernych danych i ograniczona elastyczność optymalizacji.

Natomiast tradycyjne metody uczenia maszynowego są często bardziej opłacalne, łatwiejsze do wdrożenia i zapewniają bardziej przejrzyste i przewidywalne wyniki. Łatwiej jest je także dostosować do konkretnych zadań. Obydwa podejścia mają wyraźne mocne i słabe strony, a zrozumienie ich zastosowań i ograniczeń ma kluczowe znaczenie dla skutecznego wdrożenia w rzeczywistych scenariuszach.