Bagaimana Anda Memperbaiki Kalimat Run-On?

Diterbitkan: 2018-11-08

Pada titik tertentu dalam hidup Anda, Anda mungkin pernah memiliki seorang guru yang mencela kesalahan tertentu dalam penulisan bahasa Inggris: kalimat yang tidak tepat.

Run-on adalah jenis kesalahan yang umum. Di antara mahasiswa di Amerika Serikat, kalimat run-on adalah kesalahan yang paling sering dilakukan kedelapanbelas oleh penutur asli bahasa Inggris dan kesalahan kedelapan yang paling sering dilakukan oleh mahasiswa yang bukan penutur asli bahasa Inggris.

Bingung tentang kalimat run-on?
Tata bahasa dapat membantu.

Kemampuan untuk mendeteksi dan memperbaiki kesalahan jenis ini secara otomatis jelas akan berguna bagi penulis. Namun ada penerapan yang lebih luas. Saat Anda mendiktekan pesan teks, misalnya, Anda perlu mengucapkan “titik” di akhir kalimat sebelum memulai kalimat baru, jika tidak, transkripsi Anda akan berakhir dalam jangka panjang. Sistem AI yang secara otomatis dapat menentukan di mana sebuah kalimat harus dimulai dan diakhiri, dapat secara otomatis memasukkan tanda baca yang tepat, sehingga otak Anda dapat berkonsentrasi pada informasi yang ingin Anda sampaikan.

Karya Grammarly tentang kalimat run-on adalah subjek dari makalah baru yang kami presentasikan di The 4th Workshop on Noisy User-generated Text minggu lalu di konferensi EMNLP di Brussels. Kami bangga untuk mengatakan bahwa buku ini memenangkan salah satu dari dua penghargaan makalah terbaik di lokakarya tersebut! Baca terus untuk mengetahui bagaimana Grammarly mengatasi tantangan dalam mengoreksi kalimat yang tidak tepat.

Apa yang dimaksud dengan kalimat run-on?

Definisi kalimat run-on sedikit berbeda dari orang ke orang. Beberapa orang menganggap sambungan koma sebagai jenis kalimat run-on. Bagi yang lain, kalimat run-on hanyalah kalimat yang sangat panjang. Namun, panjangnya saja tidak membuat sebuah kalimat menjadi benar-benar run-on.

Pada dasarnya, kalimat run-on hanyalah dua atau lebih kalimat lengkap yang digabungkan secara tidak tepat. Berikut ini contoh run-on:

Jalani hidup semaksimal mungkin, jangan anggap remeh.

Ada dua klausa independen di sini: Jalani hidup sepenuhnya dan jangan anggap remeh . Secara tradisional, ketika Anda ingin menggabungkan dua klausa independen, Anda perlu menghubungkannya dengan cara tertentu. Salah satu opsinya adalah menggunakan koma dan konjungsi:

Jalani hidup sepenuhnya, dan jangan anggap remeh.

Pilihan lainnya adalah menggunakan titik koma:

Jalani hidup sepenuhnya; jangan anggap remeh apa pun.

Opsi ketiga adalah memecah klausa menjadi kalimat terpisah:

Jalani hidup sepenuhnya. Jangan anggap remeh apa pun.

Masalah dengan kalimat run-on adalah sulitnya memahaminya. Konjungsi, titik koma, dan titik bertindak sebagai penunjuk arah dalam sebuah kalimat untuk membantu pembaca mengikuti apa yang penulis katakan. Jika rambu-rambu ini tidak ada, kemungkinan besar pembaca perlu menelusuri kembali dan membaca ulang untuk memahami kalimat tersebut.

Mengapa sulit untuk memperbaiki run-on secara otomatis

Grammarly sudah memperbaiki kesalahan tanda baca dan kesalahan tata bahasa. Jadi, apa bedanya dengan mengajarkan sistem AI untuk memperbaiki kalimat yang tidak tepat? Mengapa ini sangat sulit?

Banyak kesalahan tanda baca atau tata bahasa hanya mempengaruhi bagian tertentu dari sebuah kalimat. Artinya, sistem AI Anda hanya perlu memproses sebagian kalimat tertentu untuk mengidentifikasi dan memperbaiki masalahnya. Namun, run-on adalah masalah tingkat kalimat. Hal ini memerlukan AI Anda untuk memproses rangkaian teks yang jauh lebih panjang dan kompleks.

Memperbaiki run-on secara otomatis juga sulit karena ada banyak cara untuk melakukannya. Seperti pada contoh di atas, Anda dapat menambahkan tanda baca, konjungsi, atau memecah run-on menjadi beberapa kalimat. AI Anda perlu mempelajari cara mengidentifikasi cara terbaik untuk memperbaiki masalah dalam situasi tertentu.

Selain itu, tidak banyak data yang tersedia untuk melatih sistem AI untuk tujuan ini. Meskipun kalimat run-on adalah kesalahan umum, tidak ada korpus yang menyertakan kalimat run-on berlabel yang cukup untuk digunakan sebagai data pelatihan. (Korpus adalah kumpulan besar teks yang telah diberi label sedemikian rupa sehingga algoritma komputer dapat mempelajarinya.)

Apa yang kami lakukan

Urutan pertama bisnisnya adalah membuat kumpulan kalimat run-on. Kami membuat kalimat run-on secara artifisial dengan menghapus tanda baca di antara pasangan kalimat dari kumpulan artikel berita. (Lihat makalah kami untuk penjelasan lengkap tentang proses kami dan cara kami memilih kandidat kalimat.)

Kami kemudian menggunakan kalimat run-on yang baru kami buat untuk melatih dua model pembelajaran mesin yang kami buat untuk mengidentifikasi dan memperbaiki run-on. Pembelajaran mesin adalah bidang AI yang melibatkan pengajaran suatu algoritma untuk melakukan tugas secara otomatis dengan menunjukkan banyak contoh, bukan dengan memberikan serangkaian langkah yang telah ditentukan sebelumnya secara kaku.

Memperbaiki kalimat run-on: Apa yang kami temukan

Setelah model dilatih, kami mengujinya pada sekumpulan kalimat run-on baru yang dibuat secara artifisial serta sekumpulan kecil kalimat run-on yang muncul secara alami dari korpus penelitian yang sudah ada.

Kami menemukan bahwa keduanya mengungguli model terkemuka dalam pemulihan tanda baca dan koreksi kesalahan tata bahasa pada tugas ini. Ada juga temuan menarik lainnya: Model kami, yang dilatih tentang kalimat-kalimat buatan, mampu mengidentifikasi kalimat-kalimat palsu yang ditulis oleh penulis sungguhan, sama seperti mereka mengidentifikasi kalimat-kalimat palsu yang dibuat-buat.

Tentu saja masih banyak pekerjaan yang harus dilakukan di sini. Data pelatihan kami dihasilkan menggunakan teks “bersih”, artinya teks tersebut tidak mengandung kesalahan tata bahasa selain yang kami sisipkan. Di dunia nyata, kalimat run-on mungkin mengandung masalah tata bahasa tambahan yang mempersulit algoritme untuk mengidentifikasi dan memperbaiki kalimat run-on. Namun demikian, ini merupakan langkah menarik menuju visi kami untuk menciptakan asisten komunikasi komprehensif yang membantu Anda menulis pesan yang akan dipahami persis seperti yang Anda inginkan.

Bagaimana Anda memperbaiki kalimat yang tidak jelas tidak semudah kelihatannya adalah makalah baru yang ditulis oleh Junchao Zheng, Courtney Napoles, Joel Tetreault, dan Kostiantyn Omelianchuk. Hal ini dipresentasikan pada Lokakarya Keempat tentang Teks Buatan Pengguna yang Berisik yang berlokasi bersamaan dengan EMNLP 2018. Makalah ini muncul dalam Prosiding Lokakarya EMNLP 2018 W-NUT: Lokakarya Keempat tentang Teks Buatan Pengguna yang Bising.

Lebih lanjut dari seri Under the Hood di Grammarly kami:

  • Mendeteksi Tulisan Tidak Terorganisir dengan AI
  • Mengubah Gaya Menulis dengan AI