Makine Öğrenimi: Bilmeniz Gereken Her Şey

Yayınlanan: 2024-05-23

Makine öğrenimi (ML) hızla çağımızın en önemli teknolojilerinden biri haline geldi. ChatGPT, Netflix önerileri, sürücüsüz arabalar ve e-posta spam filtreleri gibi ürünlerin temelini oluşturur. Bu yaygın teknolojiyi anlamanıza yardımcı olmak için bu kılavuz, makine öğreniminin ne olduğunu (ve ne olmadığını), nasıl çalıştığını ve etkisini ele almaktadır.

İçindekiler

Makine öğrenimi nedir?
Makine öğrenimi nasıl çalışır?
Makine öğrenimi türü
Uygulamalar
Avantajları
Dezavantajları
Makine öğreniminin geleceği
Çözüm

Makine öğrenimi nedir?

Makine öğrenimini anlamak için öncelikle yapay zekayı (AI) anlamalıyız. İkisi birbirinin yerine kullanılsa da aynı şey değildir. Yapay zeka hem bir amaç hem de bir çalışma alanıdır. Amaç, insan (ve hatta insanüstü) düzeylerinde düşünme ve akıl yürütme yeteneğine sahip bilgisayar sistemleri oluşturmaktır. Yapay zeka aynı zamanda bu hedefe ulaşmak için birçok farklı yöntemden oluşur. Makine öğrenimi bu yöntemlerden biridir ve onu yapay zekanın bir alt kümesi haline getirir.

Makine öğrenimi özellikle yapay zekanın peşinde veri ve istatistiklerin kullanılmasına odaklanır. Amaç, çok sayıda örnekle (veri) beslenerek öğrenebilen ve açıkça programlanmasına gerek olmayan akıllı sistemler yaratmaktır. Yeterli veri ve iyi bir öğrenme algoritmasıyla bilgisayar, verilerdeki kalıpları yakalar ve performansını artırır.

Bunun aksine, yapay zekaya yönelik makine öğrenimi olmayan yaklaşımlar verilere bağlı değildir ve yerleşik kodlanmış mantığa sahiptir. Örneğin, yalnızca tüm optimum hareketleri kodlayarak insanüstü performansa sahip bir tic-tac-toe yapay zeka botu oluşturabilirsiniz (vardır) 255.168 olası tic-tac-toe oyunu, bu yüzden biraz zaman alabilir, ancak yine de mümkün). Ancak bir satranç yapay zeka robotunu donanımsal olarak kodlamak imkansızdır; evrende atomlardan daha fazla olası satranç oyunu vardır. Bu gibi durumlarda ML daha iyi çalışır.

Bu noktada mantıklı bir soru şu; bir bilgisayar örnekler verdiğinizde tam olarak nasıl gelişiyor?

Makine öğrenimi nasıl çalışır?

Herhangi bir ML sisteminde üç şeye ihtiyacınız vardır: veri kümesi, ML modeli ve eğitim algoritması. Öncelikle veri kümesindeki örnekleri aktarırsınız. Model daha sonra bu örnek için doğru çıktıyı tahmin eder. Model yanlışsa, modelin gelecekte benzer örnekler için doğru olma olasılığını artırmak amacıyla eğitim algoritmasını kullanırsınız. Verileriniz bitene veya sonuçlardan memnun kalana kadar bu işlemi tekrarlarsınız. Bu işlemi tamamladıktan sonra modelinizi gelecekteki verileri tahmin etmek için kullanabilirsiniz.

Bu sürecin temel bir örneği, bir bilgisayara aşağıdaki gibi el yazısıyla yazılan rakamları tanımayı öğretmektir.

Kaynak

Binlerce veya yüzbinlerce rakamlı resim topluyorsunuz. Henüz örneğini görmediğiniz bir ML modeliyle başlarsınız. Görselleri modele aktarıyorsunuz ve ondan görselde hangi sayının olduğunu düşündüğünü tahmin etmesini istiyorsunuz. Sıfır ile dokuz arasında bir sayı, mesela bir, döndürecektir. Sonra aslında ona şunu söylüyorsunuz: "Bu sayı aslında beş, bir değil." Eğitim algoritması modeli günceller, böylece bir dahaki sefere beş ile yanıt verme olasılığı daha yüksektir. Bu işlemi (neredeyse) mevcut tüm resimler için tekrarlarsınız ve ideal olarak rakamları %90 oranında doğru bir şekilde tanıyabilen iyi performanslı bir modele sahip olursunuz. Artık bu modeli, milyonlarca rakamı bir insanın yapabileceğinden daha hızlı bir ölçekte okumak için kullanabilirsiniz. Uygulamada, Amerika Birleşik Devletleri Posta Servisi, el yazısı adreslerin %98'ini okumak için ML modellerini kullanıyor.

Bu sürecin küçük bir kısmı için bile ayrıntıları incelemek için aylar veya yıllar harcayabilirsiniz (optimizasyon algoritmalarının kaç farklı versiyonu olduğuna bakın).

Makine öğrenimi türleri

Aslında dört farklı türde makine öğrenimi yöntemi vardır: denetimli, denetimsiz, yarı denetimli ve takviyeli. Temel fark, verilerinin nasıl etiketlendiğidir (yani, doğru cevap olsun ya da olmasın).

Denetimli öğrenme

Denetimli öğrenme modellerine etiketli veriler (doğru cevaplarla birlikte) verilir. Elle yazılan rakamlar örneği bu kategoriye girer: Modele "Beş doğru cevaptır" diyebiliriz. Model, girdiler ve çıktılar arasındaki açık bağlantıları öğrenmeyi amaçlamaktadır. Bu modeller ayrı etiketler (örneğin, bir evcil hayvan resmi verildiğinde "kedi" veya "köpek" tahmininde bulunulabilir) veya sayılar (örneğin yatak sayısı, banyo, konum vb. verildiğinde bir evin tahmini fiyatı) çıktısı alabilir. .

Denetimsiz öğrenme

Denetimsiz öğrenme modellerine etiketlenmemiş veriler verilir (doğru yanıtlar olmadan). Bu modeller, verileri anlamlı bir şekilde gruplandırmak için girdi verilerindeki kalıpları tanımlar. Örneğin, doğru cevabı olmayan çok sayıda kedi ve köpek görüntüsü verildiğinde, denetimsiz ML modeli, köpek ve kedi görüntülerini birlikte gruplandırmak için görüntülerdeki benzerliklere ve farklılıklara bakacaktır. Kümeleme, birliktelik kuralları ve boyutluluğun azaltılması, denetimsiz makine öğreniminde temel yöntemlerdir.

Yarı denetimli öğrenme

Yarı denetimli öğrenme, denetimli ve denetimsiz öğrenme arasında yer alan bir makine öğrenimi yaklaşımıdır. Bu yöntem, modeli eğitmek için önemli miktarda etiketlenmemiş veri ve daha küçük bir etiketli veri kümesi sağlar. Model öncelikle etiketli veriler üzerinde eğitilir ve daha sonra etiketlenmemiş verilere, etiketli verilerle benzerliklerini karşılaştırarak etiketler atar.

Takviyeli öğrenme

Takviyeli öğrenmenin belirli bir örnek ve etiket seti yoktur. Bunun yerine modele bir ortam (örneğin, oyunlar yaygın olanlardır), bir ödül işlevi ve bir hedef verilir. Model, deneme yanılma yoluyla hedefe ulaşmayı öğrenir. Bir eylem gerçekleştirecek ve ödül işlevi, eylemin genel hedefe ulaşılmasına yardımcı olup olmadığını ona bildirecek. Daha sonra model, bu eylemin daha fazlasını veya daha azını yapacak şekilde kendini günceller. Model bunu birçok kez yaparak hedefe ulaşmayı öğrenebilir.

Takviyeli öğrenme modelinin ünlü bir örneği AlphaGo Zero'dur. Bu model Go oyunlarını kazanmak için eğitildi ve yalnızca Go tahtasının durumu verildi. Daha sonra kendisine karşı milyonlarca oyun oynadı ve zamanla hangi hareketlerin ona avantaj sağladığını, hangilerinin sağlamadığını öğrendi. 70 saatlik eğitimde Go dünya şampiyonlarının üzerinde insanüstü performansa ulaştı.

Kendi kendini denetleyen öğrenme

Aslında son zamanlarda önem kazanan beşinci tür makine öğrenimi daha var: kendi kendini denetleyen öğrenme. Kendi kendini denetleyen öğrenme modellerine etiketlenmemiş veriler verilir ancak bu verilerden etiket oluşturmayı öğrenir. Bu, ChatGPT'nin arkasındaki GPT modellerinin temelini oluşturur. GPT eğitimi sırasında model, bir girdi dizesi verilen bir sonraki kelimeyi tahmin etmeyi amaçlar. Örneğin, "Kedi matın üzerine oturdu." cümlesini ele alalım. GPT'ye "The" verilir ve bundan sonra hangi kelimenin geleceğini tahmin etmesi istenir. Tahminini yapar ("köpek" diyelim), ancak orijinal cümleye sahip olduğundan doğru cevabın ne olduğunu bilir: "kedi." Daha sonra GPT'ye "Kedi" verilir ve bir sonraki kelimeyi tahmin etmesi istenir, vb. Bunu yaparak kelimeler arasındaki istatistiksel kalıpları ve daha fazlasını öğrenebilir.

Makine öğreniminin uygulamaları

Çok fazla veriye sahip olan herhangi bir sorun veya endüstri ML'yi kullanabilir. Pek çok endüstri bunu yaparak olağanüstü sonuçlar elde etti ve sürekli olarak daha fazla kullanım senaryosu ortaya çıkıyor. Makine öğreniminin bazı yaygın kullanım durumları şunlardır:

Yazma

Makine öğrenimi modelleri Grammarly gibi üretken yapay zeka yazma ürünlerini güçlendirir. Grammarly, çok sayıda harika yazı yazma konusunda eğitim alarak sizin için bir taslak oluşturabilir, yeniden yazmanıza ve düzeltmenize yardımcı olabilir ve tümü tercih ettiğiniz ton ve tarzda olmak üzere sizinle birlikte beyin fırtınası yapabilir.

Grammarly ile daha akıllıca çalışın

Yapacak işi olan herkesin yapay zeka yazma ortağı

Konuşma tanıma

Siri, Alexa ve ChatGPT'nin sesli sürümünün tümü makine öğrenimi modellerine bağlıdır. Bu modeller, karşılık gelen doğru transkriptlerle birlikte birçok ses örneği üzerinde eğitilir. Bu örneklerle modeller konuşmayı metne dönüştürebiliyor. Makine öğrenimi olmasaydı bu sorun neredeyse çözümsüz hale gelirdi çünkü herkesin farklı konuşma ve telaffuz yolları vardır. Tüm olasılıkları sıralamak imkansız olurdu.

Öneriler

TikTok, Netflix, Instagram ve Amazon'daki yayınlarınızın arkasında ML öneri modelleri vardır. Bu modeller, size görmek istediğiniz öğeleri ve içeriği göstermek için birçok tercih örneği (örneğin, sizin gibi kişiler şu film yerine bu filmi beğendi, bu ürün yerine bu ürünü beğendi) üzerine eğitilmiştir. Zamanla modeller, özellikle size hitap eden bir yayın oluşturmak için özel tercihlerinizi de dahil edebilir.

Dolandırıcılık tespiti

Bankalar, kredi kartı dolandırıcılığını tespit etmek için ML modellerini kullanıyor. E-posta sağlayıcıları, spam e-postayı tespit etmek ve yönlendirmek için ML modellerini kullanır. Sahtekarlık ML modellerine birçok sahte veri örneği verilmiştir; bu modeller daha sonra gelecekte dolandırıcılığı tespit etmek için veriler arasındaki kalıpları öğrenir.

Kendi kendine giden arabalar

Kendi kendini süren arabalar, yolları yorumlamak ve gezinmek için makine öğrenimini kullanıyor. ML, arabaların yayaları ve yol şeritlerini tanımlamasına, diğer arabaların hareketlerini tahmin etmesine ve bir sonraki eylemlerine (örneğin hızlanma, şerit değiştirme vb.) karar vermelerine yardımcı olur. Kendi kendine giden arabalar, bu makine öğrenimi yöntemlerini kullanarak milyarlarca örnek üzerinde eğitim alarak yeterlilik kazanıyor.

Makine öğreniminin avantajları

İyi uygulandığında makine öğrenimi dönüştürücü olabilir. ML modelleri genellikle süreçleri daha ucuz, daha iyi veya her ikisini de yapabilir.

İşgücü maliyeti verimliliği

Eğitimli makine öğrenimi modelleri, bir uzmanın çalışmasını çok düşük bir maliyetle simüle edebilir. Örneğin, bir insan uzmanı emlakçı, bir evin maliyeti konusunda harika bir sezgiye sahiptir, ancak bu, yıllar süren eğitim gerektirebilir. Uzman emlakçıların (ve her türden uzmanın) işe alınması da pahalıdır. Ancak milyonlarca örnek üzerinde eğitilmiş bir ML modeli, uzman bir emlakçının performansına yaklaşabilir. Böyle bir model birkaç gün içinde eğitilebilir ve eğitildikten sonra kullanımı çok daha az maliyetli olabilir. Daha az deneyimli emlakçılar bu modelleri daha kısa sürede daha fazla iş yapmak için kullanabilirler.

Zaman verimliliği

ML modelleri, insanlarla aynı şekilde zamanla sınırlı değildir. AlphaGo Zero, üç günlük eğitimde4,9 milyon Go oyunu oynadı. Bu, onlarca yıl olmasa da bir insanın yıllarını alacaktır. Bu ölçeklenebilirlik sayesinde model, çok çeşitli Go hareketlerini ve pozisyonlarını keşfedebildi ve bu da insanüstü performansa yol açtı. Makine öğrenimi modelleri, uzmanların gözden kaçırdığı kalıpları bile yakalayabilir; AlphaGo Zero, genellikle insanlar tarafından oynanmayan hareketleri bile buldu ve kullandı. Ancak bu, uzmanların artık değerli olmadığı anlamına gelmiyor; Go uzmanları, yeni stratejiler denemek için AlphaGo gibi modelleri kullanarak çok daha iyi hale geldi.

Makine öğreniminin dezavantajları

Elbette ML modellerini kullanmanın dezavantajları da var. Yani eğitilmeleri pahalıdır ve sonuçları kolayca açıklanamaz.

Pahalı eğitim

Makine öğrenimi eğitimi pahalı olabilir. Örneğin, AlphaGo Zero'nun geliştirilmesi 25 milyon dolara, GPT-4'ün geliştirilmesi ise 100 milyon dolardan fazlaya mal oldu. ML modellerini geliştirmenin ana maliyetleri veri etiketleme, donanım giderleri ve çalışan maaşlarıdır.

Harika denetlenen makine öğrenimi modelleri, her birinin bir insan tarafından etiketlenmesi gereken milyonlarca etiketli örnek gerektirir. Tüm etiketler toplandıktan sonra modeli eğitmek için özel donanıma ihtiyaç vardır. Grafik işlem birimleri (GPU'lar) ve tensör işlem birimleri (TPU'lar), ML donanımı için standarttır ve kiralanması veya satın alınması pahalı olabilir; GPU'ların satın alma maliyeti binlerce ila on binlerce dolar arasında olabilir.

Son olarak, mükemmel makine öğrenimi modelleri geliştirmek, becerileri ve uzmanlıkları nedeniyle yüksek maaşlar talep edebilecek makine öğrenimi araştırmacılarının veya mühendislerinin işe alınmasını gerektirir.

Karar vermede sınırlı netlik

Birçok makine öğrenimi modelinin, yaptıkları sonuçları neden verdikleri açık değildir. AlphaGo Zero karar verme sürecinin ardındaki mantığı açıklayamıyor; belirli bir durumda bir hamlenin işe yarayacağını biliyor amanedeninibilmiyor. ML modelleri günlük durumlarda kullanıldığında bunun önemli sonuçları olabilir. Sağlık hizmetlerinde kullanılan makine öğrenimi modelleri yanlış veya taraflı sonuçlar verebilir ve sonuçlarının ardındaki neden belirsiz olduğundan bunu bilemeyebiliriz. Önyargı, genel olarak makine öğrenimi modelleriyle ilgili büyük bir endişe kaynağıdır ve açıklanabilirlik eksikliği, sorunun üstesinden gelmeyi zorlaştırır. Bu sorunlar özellikle derin öğrenme modelleri için geçerlidir. Derin öğrenme modelleri, girişi işlemek için çok katmanlı sinir ağlarını kullanan ML modelleridir. Daha karmaşık verileri ve soruları ele alabilirler.

Öte yandan, daha basit, daha "sığ" makine öğrenimi modelleri (karar ağaçları ve regresyon modelleri gibi) aynı dezavantajlara sahip değildir. Hala çok fazla veriye ihtiyaç duyuyorlar ancak aksi halde eğitilmeleri ucuz. Ayrıca daha açıklayıcıdırlar. Dezavantajı ise bu tür modellerin kullanım açısından sınırlı olabilmesidir; GPT gibi gelişmiş uygulamalar daha karmaşık modeller gerektirir.

Makine öğreniminin geleceği

Transformatör tabanlı ML modelleri son birkaç yıldır çok popüler. Bu, GPT'yi (GPT'deki T), Grammarly'yi ve Claude AI'yi destekleyen spesifik ML model türüdür. DALL-E ve Midjourney gibi görüntü oluşturma ürünlerini destekleyen difüzyon tabanlı ML modelleri de ilgi gördü.

Bu trend yakın zamanda değişecek gibi görünmüyor. ML şirketleri, modellerinin boyutunu artırmaya odaklanıyor; daha iyi yeteneklere sahip daha büyük modeller ve onları eğitecek daha büyük veri kümeleri. Örneğin GPT-4, GPT-3'ün sahip olduğu model parametre sayısının 10 katıydı. Kullanıcılara kişiselleştirilmiş deneyimler yaratmak için muhtemelen daha fazla endüstrinin ürünlerinde üretken yapay zeka kullandığını göreceğiz.

Robotik de ısınıyor. Araştırmacılar, insanlar gibi nesneleri hareket ettirebilen ve kullanabilen robotlar oluşturmak için ML'yi kullanıyor. Bu robotlar, çevrelerinde deneyler yapabilir ve takviyeli öğrenmeyi kullanarak hızlı bir şekilde adapte olup hedeflerine (örneğin futbol topuna nasıl vurulacağı gibi) ulaşabiliyor.

Ancak makine öğrenimi modelleri daha güçlü ve yaygın hale geldikçe, bunların toplum üzerindeki potansiyel etkileri konusunda endişeler ortaya çıkıyor. Önyargı, mahremiyet ve işten çıkarma gibi konular hararetle tartışılıyor ve etik kurallara ve sorumlu gelişim uygulamalarına duyulan ihtiyaç giderek daha fazla kabul görüyor.

Çözüm

Makine öğrenimi, yapay zekanın bir alt kümesidir ve açık hedefi, verilerden öğrenmelerine izin vererek akıllı sistemler oluşturmaktır. Denetimli, denetimsiz, yarı denetimli ve takviyeli öğrenme, ana makine öğrenimi türleridir (kendi kendini denetleyen öğrenmeyle birlikte). ML, ChatGPT, sürücüsüz arabalar ve Netflix önerileri gibi bugün piyasaya çıkan birçok yeni ürünün merkezinde yer alıyor. İnsan performansından daha ucuz veya daha iyi olabilir, ancak aynı zamanda başlangıçta pahalıdır ve daha az açıklanabilir ve yönlendirilebilirdir. ML'nin önümüzdeki birkaç yıl içinde daha da popüler hale gelmesi bekleniyor.

ML'de pek çok karmaşıklık var ve öğrenme ve alana katkıda bulunma fırsatı genişliyor. Özellikle Grammarly'nin yapay zeka, derin öğrenme ve ChatGPT hakkındaki kılavuzları bu alanın diğer önemli kısımları hakkında daha fazla bilgi edinmenize yardımcı olabilir. Bunun ötesinde, makine öğreniminin ayrıntılarına girmek (verilerin nasıl toplandığı, modellerin gerçekte nasıl göründüğü ve "öğrenmenin" arkasındaki algoritmalar gibi) onu işinize etkili bir şekilde dahil etmenize yardımcı olabilir.

ML büyümeye devam ederken ve hemen hemen her sektöre etki edeceği beklentisiyle artık ML yolculuğunuza başlamanın zamanı geldi!