Devam eden cümleleri nasıl düzeltirsiniz?

Yayınlanan: 2018-11-08

Hayatınızın bir noktasında, İngilizce yazarken belirli bir hataya söven bir öğretmeniniz olmuş olabilir: devam eden cümleler.

Run-ons, yaygın bir hata türüdür. Amerika Birleşik Devletleri'ndeki üniversite öğrencileri arasında, devam eden cümleler, anadili İngilizce olan kişiler tarafından yapılan en sık on sekizinci hata ve anadili İngilizce olmayan öğrenciler tarafından yapılan en sık sekizinci hatadır.

Devam eden cümleler hakkında kafanız mı karıştı?
Grammarly yardımcı olabilir.
Grammarly ile yaz

Bu tür bir hatayı otomatik olarak tespit etme ve düzeltme yeteneği, yazarlar için açıkça yararlı olacaktır. Ancak daha da geniş uygulamalar var. Örneğin, bir metin mesajını dikte ettiğinizde, yeni bir cümleye başlamadan önce cümlenizin sonunda “nokta” demeniz gerekir, aksi takdirde transkripsiyonunuz uzun bir süreye dönüşür. Bir cümlenin nerede başlayıp nerede bitmesi gerektiğini otomatik olarak bulabilen bir yapay zeka sistemi, uygun noktalama işaretlerini otomatik olarak ekleyebilir ve beyninizi, iletişim kurmaya çalıştığınız bilgilere konsantre olması için serbest bırakabilir.

Grammarly'nin devam eden cümleler üzerindeki çalışması, geçen hafta Brüksel'deki EMNLP konferansında Gürültülü Kullanıcı Tarafından Oluşturulan Metin Üzerine 4. Çalıştay'da sunduğumuz yeni bir makalenin konusudur. Çalıştayda en iyi iki kağıt ödülünden birini kazandığını söylemekten gurur duyuyoruz! Grammarly'nin devam eden cümleleri düzeltme zorluğunun üstesinden nasıl geldiğini görmek için okumaya devam edin.

Devam eden cümle nedir?

Devam eden bir cümlenin tanımı kişiden kişiye biraz değişir. Bazı insanlar virgül eklerini bir tür devam eden cümle olarak görür. Diğerlerine göre, devam eden bir cümle sadece çok uzun bir cümledir. Bununla birlikte, tek başına uzunluk, bir cümleyi gerçek bir süreklilik haline getirmez.

Esasen, devam eden bir cümle, yanlış bir şekilde bir araya getirilmiş iki veya daha fazla tam cümledir. İşte bir çalıştırma örneği:

Hayatı dolu dolu yaşayın, hiçbir şeyi hafife almayın.

Burada iki bağımsız madde vardır: Hayatı dolu dolu yaşayın ve hiçbir şeyi hafife almayın . Geleneksel olarak, iki bağımsız tümceyi birleştirmek istediğinizde, onları bir şekilde birbirine bağlamanız gerekir. Seçeneklerden biri virgül ve bağlaç kullanmaktır:

Hayatı dolu dolu yaşayın ve hiçbir şeyi hafife almayın.

Başka bir seçenek noktalı virgül kullanmaktır:

Hayati dolu dolu yasa; hiçbir şeyi hafife almayın.

Üçüncü seçenek, tümceleri ayrı cümlelere bölmektir:

Hayati dolu dolu yasa. Hiçbir şeyi hafife almayın.

Devam eden cümlelerdeki sorun, anlaşılmalarının zor olmasıdır. Bağlaçlar, noktalı virgüller ve noktalar, okuyucuların yazarın söylediklerini takip etmelerine yardımcı olmak için bir cümle içinde yön işaretleri görevi görür. Bu işaret levhaları olmadığında, okuyucuların cümleyi anlamak için geriye dönüp tekrar okumaları gerekebilir.

Çalışmaları otomatik olarak düzeltmek neden zor?

Dilbilgisi zaten noktalama hatalarını ve dilbilgisi hatalarını düzeltir. Öyleyse, devam eden cümleleri düzeltmek için bir AI sistemine öğretmenin farkı nedir? Neden bu kadar zor?

Birçok noktalama veya dilbilgisi hatası, bir cümlenin yalnızca yalıtılmış bir bölümünü etkiler. Bu, sorunu belirlemek ve düzeltmek için AI sisteminizin yalnızca cümlenin belirli bir bölümünü işlemesi gerektiği anlamına gelir. Yine de devam etme, cümle düzeyinde bir sorundur. AI'nızın çok daha uzun ve daha karmaşık bir metin dizisini işlemesini gerektirir.

Çalışmaları otomatik olarak düzeltmek de zordur çünkü bunu yapmanın birden çok yolu vardır. Yukarıdaki örnekte olduğu gibi, noktalama işareti, bağlaç ekleyebilir veya devam eden cümleyi birden çok cümleye bölebilirsiniz. Yapay zekanızın, belirli bir durumda bir devam eden sorunu düzeltmenin en iyi yolunu nasıl belirleyeceğini öğrenmesi gerekecek.

Bunun da ötesinde, yapay zeka sistemlerini bu amaç için eğitmek için mevcut çok fazla veri yok. Devam eden cümleler yaygın hatalar olmasına rağmen, eğitim verisi olarak kullanmak için yeterince etiketlenmiş devam eden cümleleri içeren mevcut bir bütünce yoktu. (Bir derlem, bilgisayar algoritmalarının öğrenebileceği şekilde etiketlenmiş geniş bir metin koleksiyonudur.)

Yaptığımız

İlk iş sırası, devam eden cümleler koleksiyonu oluşturmaktı. Bir haber makaleleri külliyatından cümle çiftleri arasındaki noktalama işaretlerini kaldırarak yapay olarak devam eden cümleler oluşturduk. (Sürecimizin tam açıklaması ve aday cümleleri nasıl seçtiğimiz için makalemize bakın.)

Ardından, çalıştırmaları belirlemek ve düzeltmek için oluşturduğumuz iki makine öğrenimi modelini eğitmek için yeni oluşturduğumuz devam eden cümleleri kullandık. Makine öğrenimi, önceden tanımlanmış bir dizi katı adım yerine çok sayıda örnek göstererek görevleri otomatik olarak gerçekleştirmek için bir algoritmayı öğretmeyi içeren bir AI alanıdır.

Devam eden cümleleri düzeltme: Bulduklarımız

Modeller eğitildikten sonra, onları mevcut bir araştırma külliyatından doğal olarak oluşan küçük bir dizi devam eden cümlenin yanı sıra yapay olarak oluşturulmuş yeni bir dizi devam eden cümle üzerinde test ettik.

Her ikisinin de bu görevde noktalama düzeltmesi ve dilbilgisi hatası düzeltmesi için önde gelen modellerden daha iyi performans gösterdiğini gördük. Bir başka heyecan verici bulgu daha vardı: Yapay olarak oluşturulmuş cümleler üzerinde eğitilen modellerimiz, gerçek yazarlar tarafından yazılan devam eden cümlelerin yanı sıra yapay devam eden cümleleri de tespit edebildi.

Elbette burada yapılacak daha çok iş var. Eğitim verilerimiz “temiz” metin kullanılarak oluşturuldu, yani metin, eklediklerimiz dışında hiçbir dilbilgisi hatası içermedi. Gerçek dünyada, devam eden cümleler, algoritmaların devam edenleri tanımlamasını ve düzeltmesini zorlaştıran ek gramer sorunları içerebilir. Yine de bu, tam olarak istediğiniz gibi anlaşılacak mesajlar yazmanıza yardımcı olan kapsamlı bir iletişim asistanı yaratma vizyonumuz için heyecan verici bir adımdır.

Devam eden cümleleri nasıl düzeltirsiniz Junchao Zheng, Courtney Napoles, Joel Tetreault ve Kostiantyn Omelianchuk'un yeni bir makalesi göründüğü kadar kolay değil. EMNLP 2018 ile aynı yerde bulunan Gürültülü Kullanıcı Tarafından Oluşturulan Metin üzerine Dördüncü Çalıştay'da sunuldu. Bildiri, 2018 EMNLP Çalıştayı W-NUT: Gürültülü Kullanıcı Tarafından Oluşturulan Metin Üzerine Dördüncü Çalıştay'ın Bildirilerinde yer almaktadır.

Under the Hood at Grammarly serimizden daha fazlası:

  • Yapay Zeka ile Düzensiz Yazmayı Tespit Etme
  • Yapay Zeka ile Yazma Stilini Dönüştürmek