Makine Öğreniminde Yetersiz Uyum Nedir?
Yayınlanan: 2024-10-16Yetersiz uyum, makine öğrenimi (ML) modellerinin geliştirilmesi sırasında karşılaşılan yaygın bir sorundur. Bir model, eğitim verilerinden etkili bir şekilde öğrenemediğinde ortaya çıkar ve ortalamanın altında performansa neden olur. Bu makalede yetersiz uyumun ne olduğunu, nasıl olduğunu ve bundan kaçınma stratejilerini inceleyeceğiz.
İçindekiler
- Yetersiz uyum nedir?
- Yetersiz uyum nasıl oluşur?
- Yetersiz uyum ve aşırı uyum
- Yetersiz uyumun yaygın nedenleri
- Yetersiz uyum nasıl tespit edilir
- Yetersiz uyumun önlenmesine yönelik teknikler
- Yetersiz uyumun pratik örnekleri
Yetersiz uyum nedir?
Yetersiz uyum, bir makine öğrenimi modelinin eğitim verilerindeki temel kalıpları yakalayamaması ve hem eğitim hem de test verilerinde düşük performansa yol açmasıdır. Bu durum modelin çok basit olduğu ve verilerin en önemli ilişkilerini temsil etme konusunda iyi bir iş çıkaramadığı anlamına gelir. Sonuç olarak model, hem eğitim sırasında görülen veriler hem de yeni, görünmeyen veriler olmak üzere tüm veriler üzerinde doğru tahminler yapmakta zorlanır.
Yetersiz uyum nasıl olur?
Yetersiz uyum, bir makine öğrenimi algoritması, eğitim verilerinin en önemli özelliklerini yakalayamayan bir model ürettiğinde ortaya çıkar; Bu şekilde başarısız olan modellerin çok basit olduğu düşünülür. Örneğin, pazarlama harcaması, müşteri demografisi ve sezonsallığa dayalı olarak satışları tahmin etmek için doğrusal regresyon kullandığınızı hayal edin. Doğrusal regresyon, bu faktörler ile satışlar arasındaki ilişkinin düz çizgilerin bir karışımı olarak gösterilebileceğini varsayar.
Pazarlama harcamaları ile satışlar arasındaki gerçek ilişki kavisli olsa da veya çoklu etkileşimler içerse de (örneğin, satışlar ilk başta hızla artıyor, sonra sabitleşiyor), doğrusal model düz bir çizgi çizerek aşırı basitleştirecektir. Bu basitleştirme, önemli nüansları gözden kaçırıyor, bu da zayıf tahminlere ve genel performansa yol açıyor.
Bu sorun, yüksek önyargının (katı varsayımlar) modelin temel kalıpları öğrenmesini engellediği ve hem eğitim hem de test verilerinde düşük performans göstermesine neden olduğu birçok makine öğrenimi modelinde yaygındır. Yetersiz uyum genellikle modelin verilerin gerçek karmaşıklığını temsil edemeyecek kadar basit olması durumunda görülür.
Yetersiz uyum ve aşırı uyum
ML'de yetersiz uyum ve aşırı uyum, bir modelin doğru tahminler yapma yeteneğini olumsuz yönde etkileyebilecek yaygın sorunlardır. İkisi arasındaki farkı anlamak, yeni verilere iyi bir şekilde genelleme yapan modeller oluşturmak için çok önemlidir.
- Yetersiz uyum,bir model çok basit olduğunda ve verilerdeki temel kalıpları yakalayamadığında ortaya çıkar. Bu durum hem eğitim verileri hem de yeni veriler için hatalı tahminlere yol açmaktadır.
- Aşırı uyum,bir model aşırı derecede karmaşık hale geldiğinde, yalnızca gerçek modellere değil aynı zamanda eğitim verilerindeki gürültüye de uyduğunda meydana gelir. Bu, modelin eğitim setinde iyi performans göstermesine ancak yeni, görünmeyen verilerde kötü performans göstermesine neden olur.
Bu kavramları daha iyi açıklamak için, stres düzeylerine dayalı olarak atletik performansı tahmin eden bir model düşünün. Grafikteki mavi noktalar eğitim setindeki veri noktalarını temsil ederken çizgiler, modelin bu veriler üzerinde eğitildikten sonraki tahminlerini gösterir.
1 Yetersiz Uyum:Bu durumda, gerçek ilişki kavisli olmasına rağmen model, performansı tahmin etmek için basit bir düz çizgi kullanır. Çizgi verilere iyi uymadığından model çok basittir ve önemli kalıpları yakalayamamakta, bu da tahminlerin zayıf olmasına neden olmaktadır. Bu, modelin verilerin en yararlı özelliklerini öğrenmede başarısız olduğu yetersiz uyumdur.
2 Optimal uyum:Burada model, veri eğrisine yeterince uygun şekilde uyar. Belirli veri noktalarına veya gürültüye aşırı duyarlı olmadan temel eğilimi yakalar. Bu, modelin oldukça iyi bir şekilde genelleştirildiği ve benzer, yeni veriler üzerinde doğru tahminler yapabildiği arzu edilen senaryodur. Bununla birlikte, çok farklı veya daha karmaşık veri kümeleriyle karşılaşıldığında genelleme yapmak hâlâ zor olabilir.
3 Aşırı Uyum:Aşırı uyum senaryosunda model, eğitim verilerindeki gürültü ve rastgele dalgalanmalar da dahil olmak üzere neredeyse her veri noktasını yakından takip eder. Model, eğitim setinde son derece iyi performans gösterse de, eğitim verilerine çok özel olduğundan yeni verileri tahmin etmede daha az etkili olacaktır. Genelleme yapmakta zorlanıyor ve görünmeyen senaryolara uygulandığında muhtemelen yanlış tahminlerde bulunacaktır.
Yetersiz uyumun yaygın nedenleri
Yetersiz uyumun birçok potansiyel nedeni vardır. En yaygın dört tanesi şunlardır:
- Model mimarisi çok basit.
- Kötü özellik seçimi
- Yetersiz eğitim verisi
- Yeterli eğitim yok
Bunları anlamak için biraz daha derine inelim.
Model mimarisi çok basit
Model mimarisi, modeli eğitmek için kullanılan algoritma ile modelin yapısının birleşimini ifade eder. Mimari çok basitse, eğitim verilerinin üst düzey özelliklerini yakalamakta sorun yaşayabilir ve bu da hatalı tahminlere yol açabilir.
Örneğin, bir model, kavisli bir modeli takip eden verileri modellemek için tek bir düz çizgi kullanmaya çalışırsa, sürekli olarak yetersiz uyum sağlayacaktır. Bunun nedeni, düz bir çizginin kavisli verilerdeki yüksek seviyeli ilişkiyi doğru şekilde temsil edememesi ve modelin mimarisini bu görev için yetersiz hale getirmesidir.
Kötü özellik seçimi
Özellik seçimi, eğitim sırasında ML modeli için doğru değişkenlerin seçilmesini içerir. Örneğin, bir makine öğrenimi algoritmasından, bir kişinin bir e-ticaret web sitesinde satın al düğmesine basıp basmayacağını tahmin ederken kişinin doğum yılına, göz rengine, yaşına veya üçüne birden bakmasını isteyebilirsiniz.
Çok fazla özellik varsa veya seçilen özellikler hedef değişkenle güçlü bir korelasyona sahip değilse, model doğru tahminler yapmak için yeterli bilgiye sahip olmayacaktır. Göz renginin dönüşümle alakası olmayabilir ve yaş, doğum yılıyla aynı bilgilerin çoğunu yakalar.
Yetersiz eğitim verisi
Çok az veri noktası olduğunda, veriler problemin en önemli özelliklerini yakalayamadığından model yetersiz kalabilir. Bu, veri eksikliğinden veya belirli veri kaynaklarının hariç tutulduğu veya yeterince temsil edilmediği ve modelin önemli kalıpları öğrenmesini engelleyen örnekleme yanlılığından kaynaklanabilir.
Yeterli eğitim yok
Bir makine öğrenimi modelinin eğitimi, tahminleri ile gerçek sonuçlar arasındaki farka göre dahili parametrelerinin (ağırlıklarının) ayarlanmasını içerir. Model ne kadar çok eğitim yinelemesinden geçerse verilere uyacak şekilde o kadar iyi ayarlanabilir. Model çok az yinelemeyle eğitilirse, verilerden öğrenme için yeterli fırsata sahip olmayabilir ve bu da yetersiz uyumla sonuçlanabilir.
Yetersiz uyum nasıl tespit edilir
Yetersiz uyumu tespit etmenin bir yolu, modelin performansını (tipik olarak kayıp veya hata) eğitim yineleme sayısına göre gösteren öğrenme eğrilerini analiz etmektir. Bir öğrenme eğrisi, modelin hem eğitim hem de doğrulama veri kümelerinde zaman içinde nasıl geliştiğini (veya gelişmediğini) gösterir.
Kayıp, belirli bir veri seti için modelin hatasının büyüklüğüdür. Eğitim kaybı bunu eğitim verileri için ve doğrulama verileri için doğrulama kaybını ölçer. Doğrulama verileri, modelin performansını test etmek için kullanılan ayrı bir veri kümesidir. Genellikle daha büyük bir veri kümesinin eğitim ve doğrulama verilerine rastgele bölünmesiyle üretilir.
Yetersiz uyum durumunda aşağıdaki temel kalıpları fark edeceksiniz:
- Yüksek eğitim kaybı:Modelin eğitim kaybı yüksek kalırsa ve sürecin başlarında sabit çizgide kalırsa bu, modelin eğitim verilerinden öğrenmediğini gösterir. Model, verilerin karmaşıklığına uyum sağlayamayacak kadar basit olduğundan bu, yetersiz uyumun açık bir işaretidir.
- Benzer eğitim ve doğrulama kaybı:Hem eğitim hem de doğrulama kaybı yüksekse ve eğitim süreci boyunca birbirine yakın kalıyorsa, model her iki veri setinde de düşük performans gösteriyor demektir. Bu, modelin doğru tahminler yapmak için verilerden yeterli bilgiyi yakalamadığını gösterir ve bu da yetersiz uyum anlamına gelir.
Aşağıda yetersiz uyum senaryosunda öğrenme eğrilerini gösteren örnek bir grafik bulunmaktadır:
Bu görsel sunumda yetersiz uyumu fark etmek kolaydır:
- İyi uyum sağlayan bir modelde, eğitim kaybı önemli ölçüde azalırken, doğrulama kaybı da benzer bir kalıp izleyerek sonunda dengelenir.
- Yetersiz donanımlı bir modelde, hem eğitim hem de doğrulama kaybı yüksek başlar ve herhangi bir önemli iyileşme olmaksızın yüksek kalır.
Bu eğilimleri gözlemleyerek modelin çok basit olup olmadığını ve karmaşıklığını artırmak için ayarlamalar yapılması gerekip gerekmediğini hızlı bir şekilde belirleyebilirsiniz.
Yetersiz uyumun önlenmesine yönelik teknikler
Yetersiz uyumla karşılaşırsanız modelin performansını artırmak için kullanabileceğiniz çeşitli stratejiler vardır:
- Daha fazla eğitim verisi:Mümkünse ek eğitim verileri edinin. Daha fazla veri, verilerin yüksek kalitede olması ve eldeki sorunla alakalı olması koşuluyla, modele kalıpları öğrenmesi için ek fırsatlar verir.
- Özellik seçimini genişletin:Modele daha alakalı özellikleri ekleyin. Hedef değişkenle güçlü bir ilişkisi olan özellikleri seçin; bu, modele daha önce kaçırılan önemli kalıpları yakalama şansını artırır.
- Mimari gücü artırın:Sinir ağlarını temel alan modellerde ağırlıkların, katmanların veya diğer hiper parametrelerin sayısını değiştirerek mimari yapıyı ayarlayabilirsiniz. Bu, modelin daha esnek olmasını ve verilerdeki üst düzey kalıpları daha kolay bulmasını sağlayabilir.
- Farklı bir model seçin:Bazen hiperparametreler ayarlandıktan sonra bile belirli bir model göreve pek uygun olmayabilir. Birden fazla model algoritmasını test etmek, daha uygun bir model bulmanıza ve performansı artırmanıza yardımcı olabilir.
Yetersiz uyumun pratik örnekleri
Yetersiz uyumun etkilerini göstermek için, modellerin verilerin karmaşıklığını yakalamakta başarısız olduğu ve hatalı tahminlere yol açtığı çeşitli alanlardaki gerçek dünya örneklerine bakalım.
Ev fiyatlarını tahmin etmek
Bir evin fiyatını doğru bir şekilde tahmin etmek için konum, büyüklük, evin türü, durumu ve yatak odası sayısı gibi birçok faktörü göz önünde bulundurmanız gerekir.
Yalnızca evin boyutu ve türü gibi çok az özellik kullanırsanız modelin kritik bilgilere erişimi olmayacaktır. Örneğin model, küçük bir stüdyonun, emlak fiyatlarının yüksek olduğu Mayfair, Londra'da bulunduğunu bilmeden, ucuz olduğunu varsayabilir. Bu da kötü tahminlere yol açıyor.
Bunu çözmek için veri bilimcileri uygun özellik seçimini sağlamalıdır. Bu, ilgisiz olanlar hariç tüm ilgili özelliklerin dahil edilmesini ve doğru eğitim verilerinin kullanılmasını içerir.
Konuşma tanıma
Ses tanıma teknolojisi günlük yaşamda giderek yaygınlaşıyor. Örneğin akıllı telefon asistanları, müşteri hizmetleri yardım hatları ve engellilere yönelik yardımcı teknolojilerin tümü konuşma tanımayı kullanıyor. Bu modelleri eğitirken konuşma örneklerinden elde edilen veriler ve bunların doğru yorumları kullanılır.
Model, konuşmayı tanımak için mikrofon tarafından yakalanan ses dalgalarını verilere dönüştürür. Bunu yalnızca sesin baskın frekansını ve ses düzeyini belirli aralıklarla sağlayarak basitleştirirsek, modelin işlemesi gereken veri miktarını azaltmış oluruz.
Ancak bu yaklaşım, konuşmayı tam olarak anlamak için gereken temel bilgileri ortadan kaldırır. Veriler, insan konuşmasının ton, perde ve aksan farklılıkları gibi karmaşıklığını yakalayamayacak kadar basit hale geliyor.
Sonuç olarak model, bırakın cümleleri tamamlamayı, temel kelime komutlarını bile tanımakta zorlanacak ve yetersiz uyum sağlayacaktır. Model yeterince karmaşık olsa bile kapsamlı veri eksikliği yetersiz uyumun ortaya çıkmasına neden olur.
Görüntü sınıflandırması
Bir görüntü sınıflandırıcı, bir görüntüyü girdi olarak almak ve onu tanımlayacak bir sözcüğün çıktısını almak üzere tasarlanmıştır. Bir görüntünün top içerip içermediğini tespit etmek için bir model oluşturduğunuzu varsayalım. Modeli, topların ve diğer nesnelerin etiketli görüntülerini kullanarak eğitirsiniz.
Eğer yanlışlıkla evrişimli sinir ağı (CNN) gibi daha uygun bir model yerine basit iki katmanlı bir sinir ağı kullanırsanız, model zorlanacaktır. İki katmanlı ağ, görüntüyü tek bir katman halinde düzleştirerek önemli mekansal bilgileri kaybeder. Ek olarak, yalnızca iki katmana sahip olan model, karmaşık özellikleri tanımlama kapasitesinden yoksundur.
Bu, modelin eğitim verileri üzerinde bile doğru tahminlerde bulunamaması nedeniyle yetersiz uyumun ortaya çıkmasına neden olur. CNN'ler bu sorunu, görüntülerin uzamsal yapısını koruyarak ve ilk katmanlarda kenarlar ve şekiller gibi önemli özellikleri ve sonraki katmanlarda daha karmaşık nesneleri algılamayı otomatik olarak öğrenen filtrelere sahip evrişimli katmanlar kullanarak çözer.