Birkaç Adımda Öğrenme Açıklaması: Yapay Zekayı Minimum Veriyle Dönüştürme
Yayınlanan: 2025-01-13Az sayıda öğrenme (FSL), geniş veri kümeleri gerektiren geleneksel yöntemlerin aksine, modellerin öğrenmesini ve yalnızca bir avuç örnekten doğru çıktılar üretmesini sağlayarak makine öğrenimini (ML) dönüştürüyor. Bu kılavuz FSL'nin nasıl çalıştığını, uygulamalarını, sıfır atışlı öğrenme (ZSL) ile karşılaştırmalarını, zorluklarını ve potansiyelini araştırıyor.
İçindekiler
- Birkaç adımda öğrenme nedir?
- Birkaç adımda öğrenme ve birkaç adımda ipucu verme: Fark nedir?
- Birkaç adımda öğrenme nasıl çalışır?
- Birkaç adımda öğrenme ve sıfır adımda öğrenme
- Birkaç adımda öğrenmeye yönelik uygulamalar
- Birkaç adımda öğrenmenin faydaları
- Birkaç adımda öğrenmenin zorlukları
Birkaç adımda öğrenme (FSL) nedir?
Birkaç adımlı öğrenme (FSL), kategori başına yalnızca birkaç etiketli örnek üzerinde eğitildikten sonra doğru çıktılar üretebilen uyarlanabilir modeller oluşturmak için tasarlanmış bir makine öğrenimi teknikleri ailesini ifade eder. Kategori başına yalnızca bir etiketli örnek mevcut olduğunda buna tek seferde öğrenme denir. Örneğin, modern akıllı telefonlar, bir kullanıcının yüzünü yalnızca birkaç fotoğrafla, hatta tek bir fotoğrafla tanımak için FSL'den yararlanıyor.
FSL özellikle değerlidir çünkü ML modellerinin, gerçek dünyada sıklıkla olduğu gibi, verilerin kıt olduğu durumlarda sorunların üstesinden gelmesine olanak tanır. FSL modelleri ayrıca genellemeyi öğrendikleri için geleneksel denetimli öğrenme modellerine göre daha geniş bir görev yelpazesini ele alabilir. Bu, kaynaklardan tasarruf sağlar çünkü bir FSL modelini yeni bir göreve uyarlamak, tamamen yeni bir modeli sıfırdan eğitmekten genellikle daha ucuz ve daha hızlıdır. FSL genellikle, yalnızca bir avuç örnekten soyutlamayı öğrenerek ML modellerine daha çok insanlar gibi "düşünmeyi" öğretmek olarak tanımlanır.
FSL genellikle bilgisayarlı görme uygulamaları için kullanılır ancak aynı zamanda robotik ve doğal dil işlemede (NLP) de kullanılır. Örneğin FSL, eski Sümer metinlerini tercüme etmek için kullanıldı; Sümer dili uzmanlarının yetersiz olduğu göz önüne alındığında bu yararlı bir görevdi. Sümer çevirmen FSL modelleri, yalnızca küçük bir dizi yüksek kaliteli çivi yazısı tablet örneğinden çeviri yapmayı öğrendi. Daha sonra bilim adamlarının analiz etmesi için büyük miktarda alışılmadık metni doğru bir şekilde tercüme ettiler.
Birkaç adımda öğrenme ve birkaç adımda ipucu verme: Fark nedir?
FSL ve birkaç adımlık ipucu, ML ve NLP'de birbiriyle ilişkili kavramlardır, ancak farklı amaçlara hizmet ederler.
Birkaç adımda öğrenme
FSL, modellere görünmeyen verileri sınıflandırmayı öğreten bir model eğitim tekniğidir. Önceki bilgilerden yararlanarak, yeni türdeki sınıflandırma görevlerine uyum sağlamak için model parametrelerini ayarlayarak çalışır. FSL, denetimli öğrenmeyle ilgilidir ancak aradaki fark, FSL modellerinin çok daha sınırlı bir veri kümesi üzerinde eğitilmiş olmasıdır.
Birkaç atışlık ipucu
Az sayıda ipucu, büyük dil modelleriyle (LLM'ler) çalışmanın bir yoludur. Modelin, bir çıktıyı tahmin etmek için bilgi istemindeki format ve duyarlılık gibi bilgileri kullandığı bir öğrenme türü olan bağlam içi öğrenmeyi kullanır. FSL ve geleneksel denetimli öğrenmeden farklı olarak, birkaç adımlık ipucu, LLM'nin parametrelerinin değiştirilmesini içermez. Birkaç adımlık yönlendirmeyi kullandığınızda, LLM'ye aradığınız yanıt türüne ilişkin birkaç örnek sunarsınız. FSL gibi, birkaç adımlık ipucu, bir modeli benzer bir görevin birkaç örneğine maruz bırakarak genelleştirmesine yardımcı olmakla ilgilidir.
Birkaç adımda öğrenme nasıl çalışır?
Birkaç adımda öğrenme iki aşamayı içerir: İlk olarak, modeller dünya hakkında bilgi edinmek için genel bir veri kümesi üzerinde önceden eğitilir. Daha sonra modellerin küçük veri örneklerinden nasıl genelleme yapılacağını öğrendiği görev uyarlamasına tabi tutulurlar.
Ön eğitim
Çoğu FSL modeli için ilk aşama, tıpkı denetimli öğrenme gibi, büyük etiketli bir veri kümesi üzerinde ön eğitimle başlar. Model, bu veri kümesi üzerinde özellik çıkarımı gerçekleştirir ve verilerdeki kalıplar ve ilişkiler hakkında bir bilgi tabanı geliştirerek örnekleri sınıflandırmayı öğrenir.
Görev uyarlaması
Ön eğitimden sonra, FSL'nin bir sonraki aşaması, modeli yeni sınıflandırma görevlerine genelleştirecek şekilde eğitmektir. Buna görev adaptasyonu denir ve birden fazla eğitim bölümünde gerçekleşir.
Her bölümde, modelin çalışılması için iki ila beş örnekten oluşan bir destek seti ve modelin sınıflandırılmaya çalışılması için görünmeyen hedeflerin bulunduğu bir sorgu seti bulunur. Bu çerçeve, N-way K-shot sınıflandırması olarak adlandırılır; buradaN, kategori sayısını (sınıflar olarak adlandırılır) veK,her kategorideki etiketli örneklerin (çekim) sayısını belirtir.
Tüm FSL modelleri göreve uyum sağlamak üzere tasarlanmıştır. FSL teknik seti içerisinde en önemli ve heyecan verici araştırma alanlarından biri meta-öğrenmedir.
Meta-öğrenme yaklaşımları
Meta-öğrenme, modelin başlangıçta çözmek için eğitildiği sınıflandırma görevine benzer veya onunla ilgili görevlere modelin maruz bırakılmasını içerir. Her yeni görevden yalnızca birkaç örnek alır ancak bunlardan, alışılmadık bir görev verildiğinde ne yapılacağına ilişkin bir meta-çerçeve geliştirerek genelleme yapmayı öğrenir.
Genel anlamda meta-öğrenmeye üç tür yaklaşım vardır:
- Optimizasyona dayalı öğrenme:Bu, modelleri parametrelerini hızlı bir şekilde iyileştirecek şekilde eğiten yaklaşımları içerir. Bazıları, bir öğrencinin belirli bir görev üzerinde eğitildiği ve ardından bir meta-öğrenicinin, bir sonraki görev için modelin parametrelerini iyileştirmek üzere öğrenci aşamasındaki kayıp fonksiyonunu kullandığı iki aşamalı bir süreç kullanır.
- Metrik düzeyde öğrenme:Çoğunlukla bilgisayarla görme görevleri için kullanılan metrik öğrenme, çıkarılan özelliklerin bir yerleştirme alanındaki haritalanması ve iki görüntünün benzer olma olasılığının çıktısını almak için haritadaki özellikler arasındaki mesafenin kullanılmasıyla çalışır.
- Modelden bağımsız meta-öğrenme (MAML):MAML'de eğitim sürecinin amacı, görevden bağımsız olarak model parametrelerini optimize etmek için gereken degrade adımlarının sayısını azaltmaktır. MAML, görevler için öğrenme süreçlerini analiz eder, sürecin nasıl çalıştığına dair kalıplar çıkarır ve kısayol işlevi gören modeller geliştirerek gördüğü her yeni görevde öğrenme sürecini hızlandırır.
Meta-öğrenme tekniklerini kullanan model mimarilerinin listesi, araştırmacılar modellerin uyarlanabilir hale gelmesine yardımcı olacak yeni yollar buldukça her geçen gün büyüyor.
Meta-öğrenme dışı yaklaşımlar
Meta öğrenmeyi kullanmayan FSL ve FSL'ye bitişik yöntemler de vardır. FSL bazen hibrit bir yaklaşım oluşturmak için bu tekniklerin yanında kullanılır:
- Transfer öğrenimi:Bu yöntem, önceden eğitilmiş bir modelin alınmasını ve sinir ağının dış katmanlarına ince ayar yapılmasını içerir. Transfer öğrenimi, modelin gerçekleştirmesini istediğiniz görevin halihazırda üzerinde eğitim almış olduğu göreve yakın olduğu senaryolarda daha kullanışlıdır.
- Veri artırma:FSL, eğitim setiniz için örnek sayısını artırmak üzere üretken rakip ağlar (GAN'lar) veya değişken otomatik kodlayıcılar kullanarak sentetik veriler oluşturmak için sınırlı verilerinizi temel olarak kullanmayı içeren veri artırma ile güçlendirilebilir.
Birkaç adımda öğrenme ve sıfır adımda öğrenme
Birkaç adımlı öğrenme (veya tek adımlı öğrenme), genellikle bir modeli eğitmek için sınırlı ancak yüksek kaliteli verilerin olduğu senaryolarda kullanılır. Peki ya hiç yüksek kaliteli veriniz yoksa? Sıfır atışlı öğrenmede (ZSL), modelinize hiçbir örnek vermezsiniz ve bunun yerine ondan yalnızca önceden edinilen bilgilere ve alışılmadık görevleri yerine getirmek için yararlanabileceği anlamsal eklemelere dayanmasını istersiniz.
ZSL, çok az veri içeren durumların ele alınması için hızlı ve esnek bir çözüm sunar. Ancak ZSL modelleri etki alanı değiştirme konusunda zorluk yaşayabilir; yani gördükleri veri türü bilgi tabanlarından çok farklıysa zorluk yaşayabilirler ve bir modelin ne kadar iyi performans gösterdiğini değerlendirmek zor olabilir.
Birkaç adımda öğrenmeye yönelik uygulamalar
FSL uygulamaları geniş kapsamlıdır ve sürekli olarak gelişmektedir, ancak nispeten az sayıda örneğin mevcut olduğu alanlarda faydalı olma konusunda muazzam bir potansiyele sahiptir. Kullanım senaryolarına yönelik son araştırma alanlarından bazıları şunlardır:
- Tıbbi teşhis:FSL, geleneksel denetimli öğrenme modellerinin yardımcı olması için yeterli etiketli verinin bulunmadığı durumlarda görüntü tabanlı tümör sınıflandırmasına yardımcı olabilir.
- Uzaktan algılama:FSL, çevresel felaketlerin etkilerini değerlendirmek için İHA görüntülerini kullanmak gibi uzaktan algılama görevlerini hızlandırabilir.
- F1 yarış arabası prototipi oluşturma:FSL modelleri, binlerce yarışta yüzlerce araba için akışkan ve aerodinamikler ve diğer veriler konusunda önceden eğitilmiştir. Daha sonra, az sayıda pahalı test çalışmasına dayanarak yeni araba prototiplerinin aerodinamiğini ve parça bozulmasını tahmin etmek için FSL'yi kullanıyorlar.
- Makine çevirisi:FSL, çok az girdi kullanan ve lehçe ve bölgesel farklılıklardaki nüansları benzeri görülmemiş bir doğrulukla yakalayabilen daha verimli makine çevirmenlerinin oluşturulmasına yardımcı oldu.
- Robotik:FSL, robotlara insan gösterilerini izleyerek nesneleri kavramayı öğrenmeyi öğretmek için kullanılıyor.
- Duyarlılık analizi:Başlangıçta otel incelemeleri üzerine eğitilmiş bir FSL modeli, restoran incelemelerini sınıflandırmak için kullanılabilir.
FSL aynı zamanda yapay genel zeka oluşturma arayışının da bir parçasıdır çünkü insanların problem çözmeye yaklaşımını daha yakından taklit eder.
Birkaç adımda öğrenmenin faydaları
FSL modellerinin temel faydaları, sınırlı verinin mevcut olduğu durumlarda sorunları çözebilmeleri ve yeni modelleri eğitmek için gereken hesaplama ve mali kaynakların azaltılmasına yardımcı olabilmeleridir.
Sınırlı verilerle genelleme
FSL modelleri bunu yapabilir çünkü görüntüleri, sesleri veya dili birçok yinelemeyle ezberlemezler. Bunun yerine benzerlikleri ve farklılıkları hızla analiz etmeyi öğrenirler. Geleneksel modeller, belirli bir kuş türünü tanımlamak veya parmak izlerini eşleştirmek gibi son derece spesifik görevlerde başarılı olsa da, başka bir görevi tamamlamasını istediğiniz anda başarısız oluyorlar.
Daha az kaynak kullanma
MAML gibi teknikler, model eğitim kaynaklarını kullanmanın çok daha verimli bir yoludur. Çok pahalı, büyük ölçekli modellerin, pahalı yeniden eğitim adımlarına gerek kalmadan, belirli kullanım durumlarına hızlı ve verimli bir şekilde uyarlanmasına olanak tanır. Makine öğrenimindeki en büyük zorluklardan biri, hem büyük, yüksek kaliteli veri kümelerinin derlenmesi hem de ne kadar zaman ve hesaplama gerektiği açısından yararlı çıktılar üretecek bir modeli eğitmek için ne kadar veriye ihtiyaç duyulduğudur. FSL, verilerin kıt olduğu veya etki alanlarının kesiştiği gerçek dünyadaki birçok sorunu çözmeyi vaat ediyor.
Birkaç adımda öğrenmenin zorlukları
Verdiği söze rağmen FSL'nin modelin etkinliğini engelleyebilecek zorlukları vardır.
Aşırı uyum
Sınırlı veri kümelerinin kullanılması, modelin eğitim kümelerindeki verilerle çok yakın hizalandığı ve genelleme yapmakta zorlandığı aşırı uyum sağlamaya neden olabilir. Bu, diğer ML yaklaşımlarına göre FSL'de daha sık ortaya çıkan, ML'de tanıdık bir sorundur. Aşırı uyum sağlayan bir FSL modeli, test verileri üzerinde iyi performans gösterecek ancak gerçek dünyadan örneklerle sunulduğunda yeni kategorileri tanımlamayacaktır. Bunu önlemek için az atışlı eğitimlerde kullanılan sınırlı örneklerde çeşitliliğin sağlanması önemlidir. Yukarıda tartışılan veri artırma, eğitim için daha fazla örnek sentezleyerek aşırı uyumu hafifletmeye çalışır.
Veri kalitesi
Hem eğitim öncesi hem de birkaç adımlık öğrenme aşamasında yüksek kaliteli veriler önemlidir. FSL modelleri gürültülü, kötü etiketlenmiş veriler tarafından daha kolay engellenir. Ayrıca, verinin bir türden çok fazla olup diğerinden çok fazla olması veya modelin analiz edemeyeceği kadar çok özelliğe sahip olması durumunda da iyi performans göstermezler; bu durumlarda aşırı karmaşık hale gelme eğilimindedirler. Araştırmacılar bazen bu sorunlarla, bir modelin neye dikkat etmesi ve neyi göz ardı etmesi gerektiğini anlamasına yardımcı olmak için verileri yumuşatmanın yolları olan düzenlileştirme tekniklerini kullanarak başa çıkabilirler.