Devamlı Cümleleri Nasıl Düzeltirsiniz?
Yayınlanan: 2018-11-08Hayatınızın bir noktasında, İngilizce yazımında belirli bir hataya karşı çıkan bir öğretmeniniz olmuş olabilir: art arda cümleler.
Çalıştırmalar yaygın bir hata türüdür. Amerika Birleşik Devletleri'ndeki üniversite öğrencileri arasında art arda cümleler, anadili İngilizce olan kişiler tarafından yapılan en sık yapılan on sekizinci hata ve anadili İngilizce olmayan öğrenciler tarafından yapılan en sık yapılan sekizinci hatadır.
Bu tür hataları otomatik olarak tespit etme ve düzeltme yeteneğinin yazarlar için faydalı olacağı açıktır. Ancak daha geniş uygulamalar da var. Örneğin bir kısa mesajı dikte ettiğinizde, yeni bir mesaja başlamadan önce cümlenizin sonunda "nokta" demeniz gerekir, aksi takdirde transkripsiyonunuz uzun bir devamına dönüşür. Bir cümlenin nerede başlayıp nerede bitmesi gerektiğini otomatik olarak anlayabilen bir yapay zeka sistemi, uygun noktalama işaretini otomatik olarak ekleyerek beyninizin iletmeye çalıştığınız bilgiye konsantre olması için serbest bırakabilir.
Grammarly'nin art arda cümleler üzerine çalışması, geçen hafta Brüksel'deki EMNLP konferansında 4. Gürültülü Kullanıcı Tarafından Oluşturulan Metin Çalıştayı'nda sunduğumuz yeni bir makalenin konusunu oluşturuyor. Atölyedeki en iyi iki makale ödülünden birini kazandığını söylemekten gurur duyuyoruz! Grammarly'nin art arda cümleleri düzeltme sorununu nasıl çözdüğünü görmek için okumaya devam edin.
Devam eden cümle nedir?
Devam eden cümlenin tanımı kişiden kişiye biraz değişir. Bazı insanlar virgül eklemelerini bir tür devam eden cümle olarak görür. Başkalarına göre, devam eden bir cümle sadece çok uzun bir cümledir. Ancak uzunluk tek başına bir cümleyi gerçek anlamda devam ettirmez.
Esasen, devam eden bir cümle, uygunsuz bir şekilde bir araya getirilmiş iki veya daha fazla tam cümleden oluşur. İşte bir çalıştırma örneği:
Burada iki bağımsız madde var: Hayatı dolu dolu yaşayın ve hiçbir şeyi olduğu gibi kabul etmeyin . Geleneksel olarak, iki bağımsız cümleyi birleştirmek istediğinizde onları bir şekilde birbirine bağlamanız gerekir. Bir seçenek virgül ve bağlaç kullanmaktır:
Başka bir seçenek noktalı virgül kullanmaktır:
Üçüncü seçenek ise cümlecikleri ayrı cümlelere bölmektir:
Devamlı cümlelerin sorunu, anlaşılmalarının zor olmasıdır. Bağlaçlar, noktalı virgüller ve noktalar cümle içinde okuyucuların yazarın söylediklerini takip etmelerine yardımcı olacak yön işaretleri görevi görür. Bu yön işaretleri olmadığında, okuyucuların cümleyi anlamlandırmak için geri dönüp tekrar okumaları gerekebilir.
Devam eden işlemleri otomatik olarak düzeltmek neden zordur?
Grammarly zaten noktalama işaretlerini ve dilbilgisi hatalarını düzeltiyor. Peki bir yapay zeka sistemine art arda gelen cümleleri düzeltmeyi öğretmenin farkı nedir? Neden bu kadar zor?
Birçok noktalama işareti veya dilbilgisi hatası, cümlenin yalnızca ayrı bir bölümünü etkiler. Bu, AI sisteminizin sorunu tanımlamak ve düzeltmek için yalnızca cümlenin belirli bir bölümünü işlemesi gerektiği anlamına gelir. Ancak devam eden bir durum cümle düzeyinde bir sorundur. Yapay zekanızın çok daha uzun ve daha karmaşık bir metin dizisini işlemesini gerektirir.
Çalıştırmaları otomatik olarak düzeltmek de zordur çünkü bunu yapmanın birden fazla yolu vardır. Yukarıdaki örnekte olduğu gibi, noktalama işareti veya bağlaç ekleyebilir veya devam eden cümleyi birden fazla cümleye bölebilirsiniz. Yapay zekanızın belirli bir durumda tekrarlamayı düzeltmenin en iyi yolunu nasıl belirleyeceğini öğrenmesi gerekecektir.
Üstelik yapay zeka sistemlerini bu amaç için eğitecek çok fazla mevcut veri yok. Devamlı cümleler yaygın hatalar olmasına rağmen, eğitim verileri olarak kullanılacak yeterli sayıda etiketli devam eden cümleyi içeren mevcut bir derlem yoktu. (Bir derlem, bilgisayar algoritmalarının öğrenebileceği şekilde etiketlenmiş geniş bir metin koleksiyonudur.)
Ne yaptık?
Yapılacak ilk iş, devam eden cümlelerden oluşan bir koleksiyon oluşturmaktı. Bir dizi haber makalesinden cümle çiftleri arasındaki noktalama işaretini kaldırarak yapay olarak devam eden cümleler oluşturduk. (Sürecimizin ve aday cümleleri nasıl seçtiğimizin tam açıklaması için makalemize bakın.)
Daha sonra, devam eden durumları tespit etmek ve düzeltmek için oluşturduğumuz iki makine öğrenimi modelini eğitmek için yeni oluşturulan devam eden cümlelerimizi kullandık. Makine öğrenimi, önceden tanımlanmış bir dizi adım yerine çok sayıda örnek göstererek bir algoritmaya görevleri otomatik olarak gerçekleştirmeyi öğretmeyi içeren bir yapay zeka alanıdır.
Art arda gelen cümleleri düzeltmek: Bulduklarımız
Modeller eğitildikten sonra, bunları, mevcut bir araştırma derleminden doğal olarak oluşan küçük bir dizi devam eden cümlenin yanı sıra, yapay olarak oluşturulmuş yeni bir dizi devam eden cümle üzerinde test ettik.
Her ikisinin de bu görevde noktalama işaretlerini düzeltme ve dilbilgisi hatalarını düzeltme konusunda önde gelen modellerden daha iyi performans gösterdiğini gördük. Heyecan verici başka bir bulgu daha vardı: Yapay olarak oluşturulmuş cümleler üzerinde eğitilen modellerimiz, yapay devam eden cümleleri tespit ettikleri gibi, gerçek yazarlar tarafından yazılan art arda cümleleri de tespit edebildi.
Elbette burada yapılacak daha çok iş var. Eğitim verilerimiz "temiz" metin kullanılarak oluşturuldu; bu, metnin eklediklerimiz dışında hiçbir gramer hatası içermediği anlamına geliyor. Gerçek dünyada, devam eden cümleler, algoritmaların devam eden cümleleri tanımlamasını ve düzeltmesini zorlaştıran ek gramer problemleri içerebilir. Yine de bu, tam olarak istediğiniz gibi anlaşılacak mesajlar yazmanıza yardımcı olacak kapsamlı bir iletişim asistanı yaratma vizyonumuza doğru atılmış heyecan verici bir adımdır.
Ardışık cümleleri nasıl düzeltirsiniz, Junchao Zheng, Courtney Napoles, Joel Tetreault ve Kostiantyn Omelianchuk'un yeni makalesinde göründüğü kadar kolay değil. EMNLP 2018 ile aynı yerde düzenlenen Dördüncü Gürültülü Kullanıcı Tarafından Oluşturulan Metin Çalıştayında sunuldu. Makale, 2018 EMNLP Çalıştayı W-NUT: Gürültülü Kullanıcı Tarafından Oluşturulan Metin Üzerine Dördüncü Atölye Bildirilerinde yer almaktadır.
Grammarly'de Kaputun Altında serimizden daha fazlası:
- Yapay Zeka ile Düzensiz Yazıyı Tespit Etme
- Yapay Zeka ile Yazma Stilini Dönüştürmek