Sinir Ağı Nedir?

Yayınlanan: 2024-06-26

Sinir ağı nedir?

Sinir ağı, daha geniş makine öğrenimi (ML) alanı içinde insan beynini simüle eden bir tür derin öğrenme modelidir. Verileri, giriş, gizli ve çıkış olmak üzere katmanlar halinde düzenlenmiş birbirine bağlı düğümler veya nöronlar aracılığıyla işler. Her düğüm basit hesaplamalar gerçekleştirerek modelin kalıpları tanıma ve tahminlerde bulunma becerisine katkıda bulunur.

Derin öğrenme sinir ağları, görüntü ve konuşma tanıma gibi karmaşık görevlerin yerine getirilmesinde özellikle etkilidir ve birçok yapay zeka uygulamasının önemli bir bileşenini oluşturur. Sinir ağı mimarileri ve eğitim tekniklerindeki son gelişmeler, yapay zeka sistemlerinin yeteneklerini önemli ölçüde artırdı.

Sinir ağları nasıl yapılandırılır?

Sinir ağı modeli, adından da anlaşılacağı üzere beynin yapı taşı olan nöronlardan ilham alır. Yetişkin insanlarda her biri yaklaşık 1000 nöronla bağlantılı olan yaklaşık 85 milyar nöron bulunur. Bir beyin hücresi diğeriyle nörotransmitter adı verilen kimyasallar göndererek konuşur. Alıcı hücre bu kimyasallardan yeterince alırsa heyecanlanır ve kendi kimyasallarını başka bir hücreye gönderir.

Bazen yapay sinir ağı (YSA) olarak adlandırılan şeyin temel birimi, hücre olmak yerine matematiksel bir fonksiyon olan birdüğümdür. Tıpkı nöronlar gibi onlar da yeterli girdi aldıkları takdirde diğer düğümlerle iletişim kurarlar.

Benzerliklerin bittiği yer burası. Sinir ağları, düzgün bir şekilde tanımlanmış katmanlarla beyinden çok daha basit bir yapıya sahiptir: giriş, gizli ve çıkış. Bu katmanların birleşiminemodel denir.İstenilen sonuçlara en yakın çıktıyı yapay olarak üretmeye çalışarak öğrenirler veyaeğitilirler. (Bir dakika içinde bununla ilgili daha fazla bilgi vereceğiz.)

Giriş ve çıkış katmanları oldukça açıklayıcıdır. Sinir ağlarının yaptığı işlemlerin çoğu gizli katmanlarda gerçekleşir. Bir düğüm önceki katmandan gelen girdiyle etkinleştirildiğinde, hesaplamalarını yapar ve çıktıyı bir sonraki katmandaki düğümlere aktarıp aktarmayacağına karar verir. Bu katmanlar, işlemleri son kullanıcı tarafından görülemediği için bu şekilde adlandırılmıştır, ancak mühendislerin gizli katmanlar olarak adlandırılan katmanlarda neler olduğunu görmesini sağlayacak teknikler vardır.

Sinir ağları birden fazla gizli katman içerdiğinde bunlara derin öğrenme ağları adı verilir. Modern derin sinir ağları genellikle farklı işlevleri yerine getiren özel alt katmanlar da dahil olmak üzere birçok katmana sahiptir. Örneğin, bazı alt katmanlar ağın, analiz edilen anlık girdinin ötesinde bağlamsal bilgileri dikkate alma yeteneğini geliştirir.

Sinir ağları nasıl çalışır?

Bebeklerin nasıl öğrendiğini düşünün. Bir şey denerler, başarısız olurlar ve tekrar farklı bir yol denerler. Döngü, davranışı mükemmelleştirene kadar tekrar tekrar devam eder. Sinir ağları da aşağı yukarı bu şekilde öğreniyor.

Eğitimlerinin en başında sinir ağları rastgele tahminler yapar. Giriş katmanındaki bir düğüm, ilk gizli katmandaki düğümlerden hangisini etkinleştireceğine rastgele karar verir ve ardından bu düğümler, bir sonraki katmandaki düğümleri rastgele etkinleştirir ve bu rastgele süreç, çıktı katmanına ulaşana kadar böyle devam eder. (GPT-4 gibi büyük dil modellerinde, her katmanda on veya yüzbinlerce düğüm bulunan yaklaşık 100 katman bulunur.)

Model, tüm rastlantısallığı göz önünde bulundurarak çıktısını karşılaştırır - ki bu muhtemelen berbattır - ve ne kadar yanlış olduğunu anlar. Daha sonra, her bir düğümün diğer düğümlerle olan bağlantısını ayarlar ve belirli bir girdiye göre etkinleştirilmeye ne kadar az ya da çok eğilimli olmaları gerektiğini değiştirir. Çıktıları istenen cevaplara yakın olana kadar bunu tekrar tekrar yapar.

Peki sinir ağları ne yapmaları gerektiğini nasıl biliyor? Makine öğrenimi (ML), denetimli ve denetimsiz öğrenme dahil olmak üzere farklı yaklaşımlara ayrılabilir. Denetimli öğrenmede model, açıklayıcı metinle eşleştirilmiş resimler gibi açık etiketler veya yanıtlar içeren veriler üzerinde eğitilir. Ancak denetimsiz öğrenme, modele etiketlenmemiş veriler sağlamayı ve modelin kalıpları ve ilişkileri bağımsız olarak tanımlamasına olanak sağlamayı içerir.

Bu eğitimin ortak bir tamamlayıcısı, modelin geri bildirime yanıt olarak geliştiği takviyeli öğrenmedir. Bu genellikle insan değerlendiriciler tarafından sağlanır (eğer bir bilgisayarın önerisine olumlu veya olumsuz yanıt verdiyseniz, pekiştirmeli öğrenmeye katkıda bulunmuşsunuz demektir). Yine de modellerin yinelemeli olarak bağımsız olarak öğrenmesinin yolları da var.

Bir sinir ağının çıktısını bir tahmin olarak düşünmek doğru ve öğreticidir. İster kredibiliteyi değerlendirirken ister bir şarkı üretirken olsun, yapay zeka modelleri neyin büyük olasılıkla doğru olduğunu tahmin ederek çalışır. ChatGPT gibi üretken yapay zeka, tahmini bir adım daha ileriye taşıyor. Sıralı olarak çalışır ve az önce yaptığı çıktının ardından ne gelmesi gerektiğine dair tahminlerde bulunur. (Bunun neden sorunlu olabileceğini daha sonra ele alacağız.)

Sinir ağları nasıl yanıtlar üretir?

Bir ağ eğitildikten sonra doğru yanıtı tahmin etmek için gördüğü bilgiyi nasıl işler? ChatGPT arayüzüne "Bana periler hakkında bir hikaye anlat" gibi bir komut yazdığınızda ChatGPT nasıl yanıt vereceğine nasıl karar veriyor?

İlk adım, sinir ağının giriş katmanının isteminizibelirteçlerolarak bilinen küçük bilgi parçalarına bölmesidir. Bir görüntü tanıma ağı için belirteçler piksel olabilir. ChatGPT gibi doğal dil işlemeyi (NLP) kullanan bir ağ için, jeton genellikle bir kelime, bir kelimenin bir parçası veya çok kısa bir ifadedir.

Ağ, jetonları girişe kaydettikten sonra, bu bilgi daha önce eğitilmiş gizli katmanlardan geçirilir. Bir katmandan diğerine geçirdiği düğümler, girdinin giderek daha büyük bölümlerini analiz eder. Bu şekilde, bir NLP ağı sonunda yalnızca bir kelimeyi veya harfi değil, bir cümlenin veya paragrafın tamamını yorumlayabilir.

Artık ağ, eğitim aldığı her şeye dayanarak bir sonraki adımın ne olacağına dair bir dizi kelime kelime tahmin olarak yaptığı yanıtını oluşturmaya başlayabilir.

"Bana periler hakkında bir hikaye anlat" komutunu düşünün. Bir yanıt oluşturmak için sinir ağı, en olası ilk kelimeyi tahmin etme istemini analiz eder. Örneğin, "The" seçeneğinin en iyi seçim olma ihtimalinin %80, "A" seçeneğinin %10 ve "Bir Kez" seçeneğinin %10 şans olduğunu belirleyebilir. Daha sonra rastgele bir sayı seçer: Sayı 1 ile 8 arasındaysa “The”yi seçer; 9 ise “A”yı seçer; ve eğer 10 ise “Bir Kez” seçeneğini seçer. Rasgele sayının "The"ye karşılık gelen 4 olduğunu varsayalım. Ağ daha sonra istemi "Bana periler hakkında bir hikaye anlat" şeklinde günceller. The” ve “The”den sonraki kelimeyi tahmin etmek için işlemi tekrarlıyor. Bu döngü, güncellenen istemi temel alan her yeni kelime tahminiyle, tam bir hikaye oluşturulana kadar devam eder.

Farklı ağlar bu tahmini farklı şekilde yapacaktır. Örneğin, bir görüntü tanıma modeli, bir köpeğin görüntüsüne hangi etiketin verileceğini tahmin etmeye çalışabilir ve doğru etiketin %70 olasılıkla "çikolata Laboratuvarı", %20 "İngiliz spaniel" ve %10 olasılığını belirleyebilir. "Golden Retriever" için. Sınıflandırma durumunda genellikle ağ, olasılığa dayalı bir tahmin yerine en olası seçeneği tercih edecektir.

Sinir ağı türleri

Burada farklı sinir ağları türlerine ve bunların nasıl çalıştıklarına dair bir genel bakış bulunmaktadır.

  • İleri beslemeli sinir ağları (FNN'ler): Bu modellerde bilgi tek yönde akar: giriş katmanından gizli katmanlara ve son olarak çıkış katmanına.Bu model türü, kredi kartı sahtekarlığını tespit etmek gibi daha basit tahmin görevleri için en iyisidir.
  • Tekrarlayan sinir ağları (RNN'ler): FNN'lerin aksine, RNN'ler bir tahmin oluştururken önceki girdileri dikkate alır.Bu, onları dil işleme görevlerine çok uygun hale getirir çünkü bir ipucuna yanıt olarak oluşturulan bir cümlenin sonu, cümlenin nasıl başladığına bağlıdır.
  • Uzun kısa süreli bellek ağları (LSTM'ler): LSTM'ler bilgiyi seçici olarak unutur ve bu da onların daha verimli çalışmasına olanak tanır.Bu, büyük miktarda metnin işlenmesi için çok önemlidir; örneğin, Google Çeviri'nin 2016 yılında sinirsel makine çevirisine yönelik yükseltmesi LSTM'lere dayanıyordu.
  • Evrişimli sinir ağları (CNN'ler): CNN'ler görüntüleri işlerken en iyi şekilde çalışır.Görüntünün tamamını taramak ve çizgiler veya şekiller gibi özellikleri aramak içinevrişimli katmanlarıkullanırlar. Bu, CNN'lerin, bir nesnenin görüntünün üst yarısında mı yoksa alt yarısında mı bulunduğunu belirlemek gibi uzamsal konumu dikkate almasına ve ayrıca konumundan bağımsız olarak bir şekli veya nesne türünü tanımlamasına olanak tanır.
  • Üretken çekişmeli ağlar (GAN'lar): GAN'lar genellikle bir açıklamaya veya mevcut bir görüntüye dayalı olarak yeni görüntüler oluşturmak için kullanılır.Bunlar, iki sinir ağı arasındaki bir rekabet olarak yapılandırılmıştır:ayrımcıbir ağı, sahte bir girdinin gerçek olduğuna inandırarak kandırmaya çalışan birjeneratörağı.
  • Transformatörler ve dikkat ağları: Yapay zeka yeteneklerindeki mevcut patlamadan transformatörler sorumludur.Bu modeller, girdilerini en önemli öğelere ve bu öğelerin metin sayfaları arasında bile birbirleriyle nasıl ilişki kurduğuna odaklanacak şekilde filtrelemelerine olanak tanıyan dikkat çekici bir spot ışığı içerir. Transformatörler aynı zamanda muazzam miktarda veri üzerinde de eğitim verebilir, dolayısıyla ChatGPT ve Gemini gibi modellerebüyük dil modelleri (LLM)adı verilir.

Sinir ağlarının uygulamaları

Listelenecek çok fazla şey var; burada doğal dile vurgu yaparak günümüzde sinir ağlarının kullanım şekillerinden bir seçki sunuyoruz.

Yazma yardımı: Transformers, bilgisayarların insanların daha iyi yazmasına nasıl yardımcı olabileceğini değiştirdi.Grammarly gibi yapay zeka yazma araçları, tonu ve netliği iyileştirmek için cümle ve paragraf düzeyinde yeniden yazma olanağı sunar. Bu model türü aynı zamanda temel dilbilgisi önerilerinin hızını ve doğruluğunu da geliştirmiştir. Grammarly'nin yapay zekayı nasıl kullandığı hakkında daha fazla bilgi edinin.

Grammarly ile daha akıllı çalışın
Yapacak işi olan herkesin yapay zeka yazma ortağı

İçerik oluşturma: ChatGPT veya DALL-E kullandıysanız üretken yapay zekayı ilk elden deneyimlediniz.Transformatörler, bilgisayarların uyku öncesi hikayelerinden hipergerçekçi mimari görselleştirmelere kadar insanlarda yankı uyandıran medya oluşturma kapasitesinde devrim yarattı.

Konuşma tanıma: Bilgisayarlar insan konuşmasını tanıma konusunda her geçen gün daha iyi hale geliyor.Daha fazla bağlamı dikkate almalarına olanak tanıyan daha yeni teknolojilerle modeller, tek başına seslerin birden fazla yorumu olsa bile, konuşmacının söylemek istediğini tanıma konusunda giderek daha doğru hale geldi.

Tıbbi teşhis ve araştırma: Sinir ağları, araştırmacıların ve sağlık hizmeti sağlayıcılarının hastalıkları anlamasına ve ele almasına yardımcı olmak için giderek daha fazla kullanılan örüntü algılama ve sınıflandırma konusunda mükemmeldir.Örneğin, COVID-19 aşılarının hızlı gelişimi için yapay zekaya kısmen teşekkür borçluyuz.

Sinir ağlarının zorlukları ve sınırlamaları

Burada sinir ağlarının gündeme getirdiği sorunların hepsine olmasa da bazılarına kısa bir bakış sunuyoruz.

Önyargı: Bir sinir ağı yalnızca kendisine söylenenlerden öğrenebilir.Cinsiyetçi veya ırkçı içeriğe maruz kalırsa, çıktısı da muhtemelen cinsiyetçi veya ırkçı olacaktır. Bu durum, cinsiyeti olmayan bir dilden, stereotiplerin açık bir cinsiyet tanımlaması olmaksızın varlığını sürdürdüğü cinsiyetli bir dile çeviri yaparken ortaya çıkabilir.

Aşırı Uyum: Uygun şekilde eğitilmeyen bir model, kendisine verilen verilerden çok fazla şey okuyabilir ve yeni girdilerle mücadele edebilir.Örneğin, çoğunlukla belirli bir etnik kökene sahip insanlar üzerinde eğitilen yüz tanıma yazılımı, diğer ırklardan gelen yüzler üzerinde başarısız olabilir. Veya bir spam filtresi, daha önce görülen kalıplara fazla odaklandığı için yeni bir tür istenmeyen postayı gözden kaçırabilir.

Halüsinasyonlar: Günümüzün üretken yapay zekasının çoğu, her zaman en üst sıradaki seçeneği seçmek yerine, ne üreteceğini seçmek için bir dereceye kadar olasılığı kullanıyor.Bu yaklaşım, daha yaratıcı olmasına ve kulağa daha doğal gelen metinler üretmesine yardımcı olur, ancak aynı zamanda tamamen yanlış beyanlarda bulunmasına da yol açabilir. (LLM'lerin bazen temel matematikte yanlış yapmasının nedeni de budur.) Ne yazık ki, daha iyi bilmediğiniz veya diğer kaynaklardan doğruluğunu kontrol etmediğiniz sürece bu halüsinasyonları tespit etmek zordur.

Yorumlanabilirlik: Bir sinir ağının tam olarak nasıl tahmin yaptığını bilmek çoğu zaman imkansızdır.Bu, modeli iyileştirmeye çalışan biri açısından sinir bozucu olsa da, insanların hayatlarını büyük ölçüde etkileyen kararlar almak için yapay zekaya giderek daha fazla güvenildiğinden, aynı zamanda önemli de olabilir. Günümüzde kullanılan bazı modeller tam olarak sinir ağlarına dayanmamaktadır çünkü yaratıcıları sürecin her aşamasını inceleyebilmek ve anlayabilmek istemektedir.

Fikri mülkiyet: Pek çok kişi Yüksek Lisans'ın yazı ve diğer sanat eserlerini izinsiz olarak bünyesine katarak telif hakkını ihlal ettiğine inanıyor.Telif hakkıyla korunan eserleri doğrudan çoğaltmama eğiliminde olsalar da, bu modellerin muhtemelen belirli sanatçılardan türetilmiş görüntüler veya ifadeler oluşturduğu, hatta istendiğinde bir sanatçının kendine özgü tarzında eserler yarattığı bilinmektedir.

Güç tüketimi: Transformatör modellerinin tüm bu eğitimi ve çalıştırılması muazzam enerji tüketir.Aslında yapay zeka birkaç yıl içinde İsveç veya Arjantin kadar enerji tüketebilir. Bu, yapay zeka geliştirmede enerji kaynaklarını ve verimliliği dikkate almanın artan önemini vurgulamaktadır.

Sinir ağlarının geleceği

Yapay zekanın geleceğini tahmin etmenin oldukça zor olduğu biliniyor. 1970 yılında, önde gelen yapay zeka araştırmacılarından biri, "üç ila sekiz yıl içinde ortalama bir insanın genel zekasına sahip bir makineye sahip olacağımızı" öngördü. (Yapay genel zekaya (AGI) hala çok yakın değiliz. En azından çoğu insan öyle düşünmüyor.)

Ancak dikkat edilmesi gereken birkaç trende işaret edebiliriz. Daha verimli modeller, güç tüketimini azaltacak ve daha güçlü sinir ağlarını doğrudan akıllı telefonlar gibi cihazlarda çalıştıracaktır. Yeni eğitim teknikleri, daha az eğitim verisi ile daha faydalı tahminlerin yapılmasına olanak sağlayabilir. Yorumlanabilirlikteki bir atılım, güveni artırabilir ve sinir ağı çıktısını iyileştirmek için yeni yollar açabilir. Son olarak, kuantum bilişimi ve sinir ağlarını birleştirmek, ancak hayal edebildiğimiz yeniliklere yol açabilir.

Çözüm

İnsan beyninin yapısı ve işlevinden ilham alan sinir ağları, modern yapay zekanın temelini oluşturur. Görüntü ve konuşma tanımadan doğal dil işlemeye kadar günümüzün pek çok yapay zeka uygulamasının temelini oluşturan örüntü tanıma ve tahmin görevlerinde mükemmel bir performans sergiliyorlar. Mimari ve eğitim tekniklerindeki gelişmelerle birlikte sinir ağları, yapay zeka yeteneklerinde önemli gelişmeler sağlamaya devam ediyor.

Potansiyellerine rağmen sinir ağları önyargı, aşırı uyum ve yüksek enerji tüketimi gibi zorluklarla karşı karşıyadır. Yapay zeka gelişmeye devam ettikçe bu sorunların ele alınması çok önemlidir. İleriye baktığımızda, model verimliliği, yorumlanabilirlik ve kuantum hesaplamayla entegrasyondaki yenilikler, sinir ağlarının olanaklarını daha da genişletmeyi ve potansiyel olarak daha da dönüştürücü uygulamalara yol açmayı vaat ediyor.