Under the Hood at Grammarly: เปลี่ยนรูปแบบการเขียนด้วย AI
เผยแพร่แล้ว: 2018-05-31เมื่อคุณต้องการสร้างความประทับใจให้กับใครบางคนที่คุณกำลังเขียนถึง สิ่งที่คุณพูดไม่ใช่สิ่งเดียวที่คุณต้องนึกถึง วิธีที่คุณพูดมักจะสำคัญพอๆ กัน การเลือกระดับความเป็นทางการที่เหมาะสมอาจเป็นเรื่องท้าทาย โดยขึ้นอยู่กับบริบท และบ่อยครั้งคุณต้องคาดเดาว่าผู้รับจะตีความน้ำเสียงของคุณอย่างไร
ลองนึกภาพคุณกำลังเขียนจดหมายปะหน้า มันจะเป็นตัวเปลี่ยนเกมได้มากแค่ไหนถ้าคุณมีเครื่องมือที่สามารถตรวจจับได้เมื่องานเขียนของคุณไม่เป็นทางการเกินไป (หรือบางครั้งก็แย่กว่านั้น เป็นทางการเกินไป)? ทันใดนั้น การตัดสินใจของคุณว่าจะพูดอย่างไรในสิ่งที่คุณพยายามจะพูดกลับมืดมนน้อยลง คุณไม่เพียงแค่อาศัยการคาดเดาว่าผู้รับจะรับรู้ข้อความของคุณอย่างไร—คุณมีอัลกอริทึมที่ดึงข้อมูลจำนวนมากที่คุณไม่ได้มี ก้าวไปอีกขั้นจะเกิดอะไรขึ้นหากเครื่องมือนี้ไม่เพียงบอกคุณได้เมื่อมีบางอย่างผิดปกติ แต่ยังเสนอวลีทางเลือกที่ผู้รับของคุณต้องการดีกว่านี้จริงๆ
กระบวนการในการทำให้คอมพิวเตอร์เปลี่ยนงานเขียนจากรูปแบบหนึ่งเป็นอีกรูปแบบหนึ่งโดยอัตโนมัติเรียกว่าการถ่ายโอนรูปแบบ และเป็นเรื่องของกระดาษหน้าถัดไปที่ฉันเขียนกับเพื่อนร่วมงานของฉันอย่าง Sudha Rao Grammarly เป็นหัวข้อที่เราสนใจเป็นพิเศษเพราะเราทราบดีว่าการสื่อสารด้วยวิธีที่ถูกต้องมีความสำคัญเพียงใด
หากคุณเคยสงสัยว่าวิศวกรวิจัยที่ Grammarly สร้างระบบที่ให้คำแนะนำในการเขียนแก่คุณได้อย่างไร อ่านต่อ
ความเป็นมาอย่างไม่เป็นทางการเกี่ยวกับความเป็นทางการ
ก่อนเจาะลึกรายละเอียดของอัลกอริธึม เรามาดูตัวอย่างภาษาที่ไม่เป็นทางการและเป็นทางการกันก่อน
ไม่เป็นทางการ: ต้องดูทั้งสองด้านของเรื่อง
ทางการ: คุณต้องดูทั้งสองด้านของเรื่อง
มีความแตกต่างที่ชัดเจนสองสามประโยคระหว่างประโยคเหล่านี้ การใช้คำแสลง ("gotta") และขาดเครื่องหมายวรรคตอนท้ายประโยคแรกอย่างไม่เป็นทางการ ประโยคประเภทนี้มีเวลาและสถานที่ เช่น การแลกเปลี่ยนข้อความระหว่างเพื่อน เป็นต้น
เมื่อเราพิจารณาวิธีที่มนุษย์เขียนประโยคที่ไม่เป็นทางการในรูปแบบที่เป็นทางการมากขึ้น เราพบว่าการเปลี่ยนแปลงที่เกิดขึ้นบ่อยที่สุดนั้นเกี่ยวข้องกับการใช้อักษรตัวพิมพ์ใหญ่ เครื่องหมายวรรคตอน และการใช้ภาษาพูด นอกจากนี้เรายังสังเกตเห็นว่าบางครั้งมนุษย์ต้องเขียนประโยคใหม่ที่รุนแรงมากขึ้นเพื่อปรับปรุงความเป็นทางการ:
ไม่เป็นทางการ: คุณจะมาประชุมเมื่อไหร่?
ทางการ: โปรดแจ้งให้เราทราบเมื่อคุณจะเข้าร่วมการประชุม
แต่เราจะสอนคอมพิวเตอร์ให้แก้ไขเหมือนข้างบนได้อย่างไร มีหลายวิธีในการแก้ไขปัญหา
แบบที่เราใช้ยอมรับว่าการสอนคอมพิวเตอร์ให้แปลระหว่างรูปแบบการเขียนนั้นคล้ายกับการสอนให้แปลภาษา วิธีการนี้เรียกว่าการแปลด้วยคอมพิวเตอร์ โดยที่คอมพิวเตอร์จะแปลจากภาษาหนึ่ง (เช่น ภาษาฝรั่งเศส) เป็นอีกภาษาหนึ่ง (ภาษาเยอรมัน) โดยอัตโนมัติ ดังนั้นเมื่อต้องจัดการกับปัญหาของการถ่ายโอนรูปแบบ คุณควรเริ่มต้นด้วยแบบจำลองการแปล หรือในกรณีของเรา ให้ใช้แบบจำลองหลายแบบ
รูปแบบการแปลคืออะไร?
หนึ่งในความก้าวหน้าล่าสุดใน AI คือการใช้การเรียนรู้เชิงลึกหรือโครงข่ายประสาทเทียม เทคนิคสำหรับการสร้างแบบจำลองการแปลด้วยเครื่อง
โมเดลการแปลด้วยเครื่องประสาท (NMT) สามารถเรียนรู้การแทนความหมายพื้นฐานของประโยคได้ ซึ่งจะช่วยให้ตัวแบบเรียนรู้รูปแบบประโยคที่ซับซ้อนเพื่อให้การแปลมีความคล่องแคล่วและความหมายตรงตามประโยคต้นฉบับ
แนวทางที่เก่ากว่าในการแปลด้วยคอมพิวเตอร์ เช่น แบบจำลองตามกฎหรือแบบวลี (PBMT) แบ่งประโยคออกเป็นหน่วยย่อยๆ เช่น คำหรือวลี และแปลแยกกัน ซึ่งอาจนำไปสู่ข้อผิดพลาดทางไวยากรณ์หรือผลลัพธ์ที่ไร้สาระในการแปล อย่างไรก็ตาม โมเดลเหล่านี้ปรับแต่งได้ง่ายกว่าและมีแนวโน้มที่จะอนุรักษ์นิยมมากกว่า ซึ่งอาจเป็นประโยชน์ ตัวอย่างเช่น เราสามารถรวมกฎที่เปลี่ยนคำสแลงเป็นคำมาตรฐานได้อย่างง่ายดาย
เราได้พิจารณาวิธีการต่างๆ ในการแปลด้วยคอมพิวเตอร์เพื่อดูว่าวิธีใดดีที่สุดในการถ่ายโอนรูปแบบ
การสร้างแบบจำลอง
NMT และ PBMT เต็มไปด้วยความท้าทาย อย่างน้อยที่สุดก็คือการค้นหาชุดข้อมูลที่ดีเพื่อใช้ฝึกโมเดลของคุณ ในกรณีนี้ เราคาดว่าเราต้องการชุดข้อมูลคู่ประโยคที่เป็นทางการและเป็นทางการหลายแสนคู่ ตามหลักการแล้ว คุณจะต้องฝึกโมเดลของคุณด้วยคู่ประโยคหลายล้านคู่ แต่เนื่องจากการถ่ายโอนรูปแบบเป็นพื้นที่ที่ค่อนข้างใหม่ในด้านการประมวลผลภาษาธรรมชาติ เราจึงไม่มีชุดข้อมูลที่มีอยู่เลยจริงๆ ดังนั้นเราจึงสร้าง
เราเริ่มต้นด้วยการรวบรวมประโยคที่ไม่เป็นทางการ เรานำประโยคของเรามาจากคำถามและคำตอบที่โพสต์ต่อสาธารณะใน Yahoo! คำตอบ เราเลือกประโยคที่ไม่เป็นทางการมากกว่าหนึ่งแสนประโยคโดยอัตโนมัติจากชุดนี้ และให้ทีมเขียนแต่ละประโยคด้วยภาษาที่เป็นทางการอีกครั้งโดยใช้เกณฑ์ที่กำหนดไว้ล่วงหน้า (ตรวจสอบกระดาษของเราสำหรับรายละเอียดเกี่ยวกับกระบวนการนี้)
เมื่อคุณมีชุดข้อมูลแล้ว คุณสามารถเริ่มฝึกโมเดลของคุณได้ การฝึกโมเดลหมายถึงการให้ประโยค "ต้นทาง" จำนวนมาก ในกรณีของเรา ประโยคที่ไม่เป็นทางการ พร้อมด้วยประโยค "เป้าหมาย" จำนวนมาก สำหรับเรา สิ่งเหล่านี้คือการเขียนใหม่อย่างเป็นทางการ อัลกอริธึมของโมเดลจะค้นหารูปแบบเพื่อหาวิธีรับจากต้นทางไปยังเป้าหมาย ยิ่งมีข้อมูลมากเท่าไรก็ยิ่งเรียนรู้ได้ดีขึ้นเท่านั้น
ในกรณีของเรา โมเดลนี้มีประโยคที่มาที่ไม่เป็นทางการจำนวนหนึ่งแสนประโยคและการเขียนซ้ำอย่างเป็นทางการเพื่อเรียนรู้ เรายังได้ทดลองด้วยวิธีต่างๆ ในการสร้างข้อมูลที่เป็นทางการเทียมเพื่อเพิ่มขนาดของชุดข้อมูลการฝึกอบรมของเรา เนื่องจากแบบจำลอง NMT และ PBMT มักต้องการข้อมูลจำนวนมากขึ้นจึงจะทำงานได้ดี
แต่คุณยังต้องการวิธีประเมินว่าแบบจำลองของคุณทำงานสำเร็จได้ดีเพียงใด ความหมายของประโยคเปลี่ยนไปหรือไม่? ประโยคใหม่ถูกต้องตามหลักไวยากรณ์หรือไม่ เป็นทางการมากขึ้นจริงหรือ? มีตัวแยกประเภท—โปรแกรมที่สามารถประเมินประโยคโดยอัตโนมัติสำหรับน้ำเสียงและรูปแบบการเขียน—และเราทดสอบบางตัวที่ใช้กันมากที่สุดในงานวิชาการ อย่างไรก็ตามไม่มีสิ่งใดที่แม่นยำมาก ดังนั้นเราจึงให้มนุษย์เปรียบเทียบผลลัพธ์ของแบบจำลองต่างๆ ที่เราทดสอบและจัดอันดับตามความเป็นทางการ ความแม่นยำ และความคล่องแคล่ว
เราแสดงให้ทีมของเราเห็นประโยคที่ไม่เป็นทางการดั้งเดิม ผลลัพธ์จากแบบจำลองต่างๆ ที่หลากหลาย และการเขียนซ้ำโดยมนุษย์ เราไม่ได้บอกพวกเขาว่าใครหรืออะไรเป็นผู้สร้างแต่ละประโยค จากนั้นพวกเขาจัดอันดับการเขียนใหม่ อนุญาตให้มีความสัมพันธ์ ตามหลักการแล้ว แบบจำลองที่ดีที่สุดควรจะผูกติดกับหรือดีกว่าที่มนุษย์เขียนใหม่เสียอีก โดยรวมแล้ว ทีมงานได้คะแนนการเขียนใหม่ 500 ประโยคที่ไม่เป็นทางการ
สิ่งที่เราพบ
ทั้งหมดบอกว่า เราได้ทดสอบโมเดลหลายสิบแบบ แต่เราจะเน้นที่โมเดลระดับบนสุด: แบบอิงตามกฎ แบบวลี (PBMT) แบบโครงข่ายประสาทเทียม (NMT) และอีกสองสามแบบที่ผสมผสานวิธีการต่างๆ เข้าด้วยกัน
การเขียนใหม่ของมนุษย์ทำคะแนนได้โดยรวมสูงสุด แต่แบบจำลอง PBMT และ NMT ไม่ได้ล้าหลังมากนัก ในความเป็นจริง มีหลายกรณีที่มนุษย์ชอบเอาท์พุตของแบบจำลองมากกว่ามนุษย์ แบบจำลองทั้งสองนี้ทำให้การเขียนใหม่ครอบคลุมมากขึ้น แต่พวกเขามักจะเปลี่ยนความหมายของประโยคเดิม
ในทางกลับกัน โมเดลตามกฎได้ทำการเปลี่ยนแปลงเล็กน้อย นี่หมายความว่าพวกเขารักษาความหมายได้ดีกว่า แต่ประโยคที่พวกเขาสร้างขึ้นนั้นเป็นทางการน้อยกว่า โมเดลทั้งหมดมีเวลาในการจัดการประโยคที่สั้นกว่าประโยคที่ยาวกว่าได้ง่ายกว่า
ต่อไปนี้คือตัวอย่างประโยคที่ไม่เป็นทางการซึ่งมีการเขียนซ้ำโดยมนุษย์และแบบจำลอง ในกรณีนี้ เป็นรูปแบบสุดท้าย (NMT พร้อมการแปล PBMT) ที่สร้างสมดุลที่ดีที่สุดระหว่างความเป็นทางการ ความหมาย และการใช้ถ้อยคำที่ฟังดูเป็นธรรมชาติ
ไม่เป็น ทางการ: ฉันแทบจะไม่เคยเห็นเขาที่โรงเรียนและโดยปกติฉันเห็นเขาในเกมบาสเกตบอลของพี่ชาย
เขียนใหม่โดยมนุษย์: ฉันแทบไม่เคยเห็นเขาที่โรงเรียนเลย ฉันมักจะเห็นเขากับพี่ชายของฉันเล่นบาสเก็ตบอล
แบบจำลองตามกฎ: ฉันแทบจะไม่เคยเห็นเขาที่โรงเรียนหรือปกติฉันเห็นเขาในเกมบาสเกตบอลของพี่ชาย
โมเดล PBMT: ฉันแทบจะไม่เห็นเขาที่โรงเรียนเหมือนกัน แต่เกมบาสเก็ตบอลของพี่ชายฉัน
นางแบบ NMT: ฉันไม่ค่อยเห็นเขาที่โรงเรียน ทั้งที่ฉันเห็นเขาที่เกมบาสเกตบอลของพี่ชายฉัน
NMT (ได้รับการฝึกอบรมเกี่ยวกับข้อมูลที่สร้างโดย PBMT เพิ่มเติม): ฉันไม่ค่อยเห็นเขาที่โรงเรียน และโดยปกติฉันเห็นเขาที่เกมบาสเกตบอลของพี่ชาย
การถ่ายโอนสไตล์เป็นพื้นที่ใหม่ที่น่าตื่นเต้นของการประมวลผลภาษาธรรมชาติ โดยมีศักยภาพในการใช้งานอย่างกว้างขวาง เครื่องมือนั้นที่ฉันตั้งสมมติฐานไว้ตอนแรก—เครื่องมือที่ช่วยให้คุณคิดออกว่าจะพูดในสิ่งที่คุณต้องการจะพูดอย่างไร ยังมีงานอีกมากที่ต้องทำ แต่เครื่องมือนั้นเป็นไปได้ และมันจะมีค่ามากสำหรับผู้หางาน ผู้เรียนภาษา และใครก็ตามที่ต้องการสร้างความประทับใจที่ดีให้กับใครบางคนผ่านการเขียน เราหวังว่าการเปิดเผยข้อมูลของเราต่อสาธารณะ เราและคนอื่นๆ ในสาขานี้จะมีวิธีการเปรียบเทียบซึ่งกันและกันและขับเคลื่อนงานวิจัยด้านนี้ต่อไป
สำหรับ Grammarly งานนี้ยังเป็นอีกก้าวหนึ่งของวิสัยทัศน์ในการสร้างผู้ช่วยด้านการสื่อสารที่ครอบคลุม ซึ่งช่วยให้เข้าใจข้อความของคุณตามที่ตั้งใจไว้
Joel Tetreault เป็นผู้อำนวยการฝ่ายวิจัยที่ Grammarly Sudha Rao เป็นนักศึกษาระดับปริญญาเอกที่มหาวิทยาลัยแมริแลนด์และเป็นนักศึกษาฝึกงานด้านการวิจัยที่ Grammarly Joel และ Sudha จะนำเสนองานวิจัยนี้ในการประชุมประจำปีครั้งที่ 16 ของ North American Chapter of the Association for Computational Linguistics: Human Language Technologies in New Orleans, 1-6 มิถุนายน 2018 เอกสารงานวิจัยประกอบเรื่อง “Dear Sir or Madam ฉันขอแนะนำชุดข้อมูล GYAFC: คอร์ปัส เกณฑ์มาตรฐาน และเมตริกสำหรับการถ่ายโอนรูปแบบที่เป็นทางการ” จะได้รับการเผยแพร่ในการดำเนินการของ NAACL