Kendi Kendine Denetimli Öğrenme: Nedir ve Nasıl Çalışır?
Yayınlanan: 2024-07-18Yapay zekada son teknoloji bir teknik olan kendi kendini denetleyen öğrenme, makinelerin veri içindeki içsel kalıpları ve yapıları keşfetmesine olanak tanır ve insanın açık talimat yerine bağlamdan ve deneyimden öğrenme yeteneğini taklit eder.
İçindekiler
- Kendi kendini denetleyen öğrenme nedir?
- Diğer makine öğrenimi türlerine kıyasla kendi kendini denetler
- Kendi kendini denetleyen öğrenme nasıl çalışır?
- Kendi kendini denetleyen öğrenme türleri
- Kendi kendini denetleyen öğrenmenin uygulamaları
- Kendi kendini denetleyen öğrenmenin avantajları
- Kendi kendini denetleyen öğrenmenin dezavantajları
Kendi kendini denetleyen öğrenme nedir?
Kendi kendini denetleyen öğrenme, modelleri ham, etiketlenmemiş verileri kullanarak kendi etiketlerini (yani açıkça eşleştirilmiş giriş ve çıkışları) oluşturacak şekilde eğiten bir tür makine öğrenimidir (ML). Önemli miktarda etiketlenmiş veri gerektiren denetimli öğrenmenin aksine, kendi kendini denetleyen öğrenme, verilerin kendisinden sahte etiketler (yapay etiketler) oluşturur. Bu teknik, modele denetimli bir öğrenme yaklaşımının hedef yönelimi ve ölçülebilirliğinin yanı sıra denetimsiz öğrenmenin büyük miktarlarda etiketlenmemiş verilerden yararlı sonuçlar çıkarma becerisini kazandırır.
Makine öğrenimi, sabit kodlanmış talimatlara dayanmak yerine insan muhakemesini taklit eden modeller oluşturmak için verileri ve istatistiksel yöntemleri kullanan bir yapay zeka (AI) alt kümesidir. Kendi kendini denetleyen öğrenme, mevcut çok miktarda etiketlenmemiş veriden yararlanır ve minimum manuel müdahaleyle model performansını iyileştirmeye yönelik güçlü bir yaklaşım haline gelir. Aslında günümüzün başlıca üretken yapay zeka metin ve görüntü modelleri, büyük ölçüde kendi kendini denetleyen öğrenme kullanılarak eğitiliyor.
Diğer makine öğrenimi türlerine kıyasla kendi kendini denetler
Kendi kendine denetimli öğrenme, hem denetimli hem de denetimsiz öğrenmenin unsurlarını birleştirir ancak yarı denetimli öğrenmeden farklıdır:
- Denetimli öğrenme: Sınıflandırma ve regresyon gibi belirli görevlere yönelik modelleri eğitmek için etiketli verileri kullanır. Etiketler, modelin doğru tahminler yapmasına olanak tanıyan açık bir rehberlik sağlar. Yaygın uygulamalar arasında spam tespiti, görüntü sınıflandırması ve hava durumu tahmini yer alır.
- Denetimsiz öğrenme: Kalıpları ve gruplamaları bulmak için etiketlenmemiş verilerle çalışır. Kümeleri ve ilişkileri tanımlar ve daha kolay işleme için veri karmaşıklığını azaltır. Örnekler arasında müşteri segmentasyonu, öneri sistemleri ve anormallik tespiti yer alır.
- Yarı denetimli öğrenme:İlk rehberlik sağlamak için az miktarda etiketli veri kullanır ve ardından modeli iyileştirmek ve geliştirmek için bir veya daha fazla etiketlenmemiş veri koleksiyonundan yararlanır. Bu yaklaşım özellikle bazı etiketli verileriniz olduğunda kullanışlıdır ancak tam olarak denetlenen öğrenme için yeterli veriyi oluşturmak çok zor veya pahalı olacaktır.
- Kendi kendine denetimli öğrenme:Kendi etiketlerini oluşturmak için ham verileri kullanır ve modelin, başlangıçta etiketlenmiş veriler olmadan verilerden öğrenmesine olanak tanır. Bu yaklaşım, doğal dil işleme (NLP) veya görüntü tanıma gibi yöntemlerle etiketlenmiş verilerin hiç mevcut olmadığı veya mevcut verilerin yalnızca küçük bir kısmı olduğu durumlarda özellikle değerlidir.
Kendi kendini denetleyen öğrenme nasıl çalışır?
Kendi kendini denetleme, verinin kendisinin doğru yanıtları sağlaması anlamına gelir. Kendi kendini denetleyen öğrenme süreci, hem denetimli hem de denetimsiz yöntemlerin özelliklerini birleştiren birkaç adımdan oluşur:
Veri toplama:Büyük miktarda ham, etiketlenmemiş veri toplayın. Bu veriler, sözde etiketlerin oluşturulması ve modelin eğitimi için temel oluşturur. Birçok veri kümesi serbestçe mevcuttur.
- Ön işleme:Kaliteyi sağlamak için verileri hazırlayın. Bu adım, kopyaların kaldırılmasını, eksik değerlerin ele alınmasını ve veri aralıklarının normalleştirilmesini içerir.
- Görev oluşturma:Modelin çözmesi için bahane görevleri olarak bilinen bulmacalar oluşturun. Bunlar, kelimelerin kaldırılması, görüntü piksellerinin silinmesi veya video karelerinin karıştırılması gibi veri parçalarının kaldırılması veya karıştırılmasıyla oluşturulur. Bu kasıtlı yolsuzluktan önce var olan her şey sahte etiket olarak biliniyor: insan etiketlemesi yerine verilerin kendisinden oluşturulan bir "doğru cevap".
- Eğitim:Oluşturulan sözde etiketleri kullanarak modeli bahane görevleri konusunda eğitin. Bu, modelin doğru cevabı üretmeye çalıştığı, cevabını sahte etiketle karşılaştırdığı, ayarladığı ve tekrar doğru cevabı üretmeye çalıştığı anlamına gelir. Bu aşama, modelin veriler içindeki ilişkileri anlamasına yardımcı olur ve sonuçta girdiler ve çıktılar arasındaki ilişkinin karmaşık bir şekilde anlaşılmasını sağlar.
- İnce ayar:Belirli görevlerdeki performansını artırmak için modeli daha küçük, etiketli bir veri kümesinden öğrenecek şekilde değiştirin. Bu adım, modelin ilk eğitim aşamasında öğrenilen temsillerden yararlanmasını sağlar. İnce ayar kesinlikle gerekli değildir ancak genellikle daha iyi sonuçlara yol açar.
- Değerlendirme:Modelin henüz görmediği veriler üzerindeki performansını değerlendirin. F1 puanı gibi göreve ilişkin standart ölçümlerin kullanıldığı bu değerlendirme, modelin yeni verilere iyi bir şekilde genelleştirilmesini sağlar.
- Dağıtım ve izleme:Eğitilen modeli gerçek dünya uygulamalarına dağıtın ve performansını sürekli izleyin. Doğruluğunu ve alaka düzeyini korumak için modeli gerektiği gibi yeni verilerle güncelleyin.
Kendi kendini denetleyen öğrenme türleri
Kendi kendine denetimli öğrenme, her biri birden fazla teknik ve yaklaşıma sahip çeşitli türleri kapsar. Burada çeşitli türleri inceleyeceğiz, benzersiz eğitim yöntemlerini vurgulayacağız ve her biri için bir veya iki temsili örnek sunacağız.
Görseller için
- Kendi kendini tahmin eden öğrenme:Kendi kendini tahmin eden öğrenme, bir modelin bilgiyi daha basit bir biçime sıkıştırmayı ve ardından orijinal verileri ondan yeniden oluşturmayı öğrendiği otomatik kodlama gibi teknikleri içerir. Görüntü işlemede bu genellikle görüntünün bazı bölümlerinin seçici olarak bozulması (örneğin bölümlerin maskelenmesi yoluyla) ve modelin orijinali yeniden oluşturacak şekilde eğitilmesi anlamına gelir. Bu, modelin farklı konumlardaki, boyutlardaki ve hatta kısmen gizlenmiş nesneleri daha iyi tanımasına yardımcı olur.
- Karşılaştırmalı öğrenme:Karşılaştırmalı öğrenmede model, benzer ve farklı görüntüleri çiftler veya gruplar halinde karşılaştırarak ayırt etmeyi öğrenir. Örneğin, SimCLR yöntemi, eğitim çiftleri oluşturmak için görüntü büyütme işlemlerini (kırpma, deforme etme ve çevirme gibi) kullanır. Pozitif çiftler aynı görüntüye farklı değişiklikler uygulanarak oluşturulurken, negatif çiftler farklı görüntülerden gelir. Model daha sonra benzer çiftlerde hangi özelliklerin ortak olduğunu ve farklı çiftlerde hangi özelliklerin farklı olduğunu öğrenir.
- Kümelemeye dayalı yöntemler:Kümelemeye dayalı yöntemler, benzer veri noktalarını bir arada gruplandırır ve bu kümeleri eğitim için sözde etiketler olarak kullanır. Örneğin DeepCluster, görüntüleri benzer özelliklere göre kümeler ve bu kümeleri modeli eğitmek için kullanır. Süreç, model iyi performans gösterene kadar kümeleme ve eğitim arasında geçiş yapar. SwAV (Görünümler Arasında Atamaları Değiştirme), modelin kenarlar, dokular ve nesne konumları gibi sabit kalan temel özellikleri öğrenmesine yardımcı olmak için aynı görüntünün birden fazla sürümünü kullanarak bunu geliştirir.
Metin için
- Kendi kendini tahmin eden öğrenme:Bu, metni bir dizi belirteç olarak anlayan büyük dil modellerinin (LLM'ler) temel eğitim mekanizmasıdır. Bunlar genellikle bir kelimeyi temsil eder, ancak bazen bir kelimenin bir kısmını veya bir kelime kümesini temsil eder.
- Maskelenmiş dil modelleri (MLM'ler):Bunlar, bazı belirteçlerin eksik olduğu ve eksik kelimeleri tahmin etmekle görevlendirilen cümleler gösterilir. MLM'ler bu boşlukları nasıl dolduracaklarını öğrenerek dil yapısı ve bağlamının kapsamlı bir temsilini geliştirir ve tahminlerde bulunurken tüm girdinin bağlamını dikkate alabilirler. Duyarlılık analizi veya adlandırılmış varlık tanıma gibi faydalı çıktılar, ince ayarlarla geliştirilir. Bunun başlıca örneği, Google'ın arama sorgularının amacını anlamak için kullandığı BERT'tir.
- Nedensel dil modelleri (CLM'ler):ChatGPT, Claude ve Gemini gibi üretken modeller, önceki belirteçlere dayanarak her seferinde bir kelimeyi tahmin ederek gördükleri metni yeniden oluşturmayı öğrenir. Eğitildikten sonra girdi metnini tahminlerinin bağlamı olarak ele alırlar ve ürettikleri her yeni jetonla tahminlerde bulunmaya devam ederler. Bu sıralı tahmin, çıktılarının bir anda görünmek yerine kendi kendine yazılmasının nedenidir.
- Karşılaştırmalı öğrenme:Bu yaklaşım, metin örnekleri çiftlerini karşılaştırarak aralarındaki farkları ve benzerlikleri vurgular. SimCSE, eğitim sırasında cümlenin gizli katmanlardaki temsilinin bazı kısımlarını rastgele yok sayan bırakma uygulayarak aynı cümlenin biraz farklı iki versiyonunu oluşturur (derin öğrenme hakkındaki yazımızda gizli katmanlar hakkında daha fazla bilgi bulabilirsiniz). Model, bu versiyonları benzer olarak tanımayı öğrenir. Bu teknik, modelin cümleleri anlama ve karşılaştırma yeteneğini geliştirerek benzer cümleleri bulma veya arama sorguları için ilgili bilgileri alma gibi uygulamalar için faydalı olmasını sağlar.
- Sonraki cümle tahmini (NSP):Adından da anlaşılacağı gibi NSP, belirli bir cümlenin bir belgedeki diğer bir cümlenin sonraki cümlesi olup olmadığını tahmin etmeyi içerir ve modellerin cümleler arasındaki ilişkileri ve metnin mantıksal akışını anlamalarına yardımcı olur. Daha büyük metin gövdelerinin anlaşılmasını geliştirmek için genellikle bir MLM ile birlikte kullanılır. Örneğin BERT NSP'de model, orijinal metinde iki cümlenin ardışık olarak görünüp görünmeyeceğini tahmin eder.
Kendi kendini denetleyen öğrenmenin uygulamaları
Kendi kendini denetleyen öğrenmenin çeşitli alanlarda geniş bir uygulama yelpazesi vardır:
- Doğal dil işleme:BERT ve GPT-3 gibi modeller, sohbet robotları, çeviri ve metin özetleme gibi uygulamalarda insan dilini anlamak ve oluşturmak için kendi kendini denetleyen öğrenmeyi kullanır.
- Bilgisayarla görme:Kendi kendini denetleyen öğrenme, ham görsel verilerden sahte etiketler oluşturarak görüntü ve video analizini geliştirir. Kullanım alanları arasında nesne algılama (kapı zili kamerasında olduğu gibi), yüz tanıma ve daha uzun videolardan otomatik olarak klip oluşturma yer alır.
- Konuşma tanıma:Kendi kendini denetleyen modeller, çok miktarda etiketlenmemiş ses verisinden öğrenerek konuşma tanıma sistemlerini geliştirir. Bu yaklaşım, manuel transkripsiyon ihtiyacını azaltır ve farklı aksan ve lehçelerde doğruluğu artırır.
- Sağlık Hizmetleri:Kendi kendini denetleyen öğrenme, minimum sayıda etiketli örnekle büyük veri kümelerinden yararlanarak tıbbi görüntü analizinin, ilaç keşfinin ve hasta izlemenin iyileştirilmesine yardımcı olur. Kapsamlı ve pahalı uzman insan etiketlemesine gerek kalmadan hastalık tespitinin ve tedavi önerilerinin doğruluğunu artırır.
- Robotik:Robotlar, çevrelerini anlamak ve karar verme süreçlerini geliştirmek için kendi kendini denetleyen öğrenmeyi kullanır. Kullanım alanları arasında otonom navigasyon, nesne manipülasyonu ve insan-robot etkileşimi yer alır.
Kendi kendini denetleyen öğrenmenin avantajları
- Uygun maliyetli:Kapsamlı etiketli verilere olan ihtiyacı azaltır, açıklama maliyetlerini ve insan çabasını azaltır.
- Ölçeklenebilirlik:Büyük veri kümelerini işleyebilir, bu da onu etiketli verilerin sınırlı olduğu ancak etiketsiz verilerin bol olduğu gerçek dünya uygulamaları için uygun hale getirir.
- Genelleme:Yeterli miktarda ham veriyle eğitildiğinde model, doğrudan ilgili verilerle eğitilmemiş olsa bile yeni görevleri gerçekleştirmek için yeterince öğrenebilir. Örneğin, bir dili temel alan bir NLP modeli, başka bir dile dayalı olarak öğrenmeyi artırmak için kullanılabilir.
- Esneklik:Belirli ihtiyaçlara uyacak birçok alt türün bulunduğu çok çeşitli görev ve alanlara uyarlanabilir.
Kendi kendini denetleyen öğrenmenin dezavantajları
- Karmaşıklık:Etkili bahane görevleri oluşturmak ve sahte etiketler oluşturmak dikkatli tasarım ve deneme gerektirir.
- Gürültü duyarlılığı:Ham verilerden oluşturulan sahte etiketler hedefle alakasız olabilir ve modele işlemesi için çok fazla gereksiz girdi vererek performansı etkileyebilir.
- Hesaplamalı kaynaklar:Özellikle büyük veri kümeleriyle kendi kendini denetleyen modellerin eğitimi, önemli düzeyde hesaplama gücü ve zaman gerektirir.