คำอธิบายการเรียนรู้แบบ Zero-Shot: อนาคตของการเรียนรู้ของเครื่องโดยไม่มีป้ายกำกับ
เผยแพร่แล้ว: 2025-01-13การเรียนรู้แบบ Zero-shot (ZSL) กำลังปฏิวัติการเรียนรู้ของเครื่อง (ML) โดยทำให้แบบจำลองสามารถจัดประเภทหรือคาดการณ์ผลลัพธ์สำหรับแนวคิดที่พวกเขาไม่เคยพบมาก่อน ถือเป็นการออกจากแนวทางแบบเดิมๆ ที่ต้องใช้ข้อมูลที่มีป้ายกำกับอย่างกว้างขวาง คู่มือนี้จะสำรวจวิธีการทำงานของ ZSL แอปพลิเคชัน การเปรียบเทียบการเรียนรู้แบบไม่กี่ช็อต (FSL) และความท้าทายและศักยภาพในอนาคต
สารบัญ
- การเรียนรู้แบบ Zero-shot คืออะไร?
- การเรียนรู้แบบ Zero-shot ทำงานอย่างไร
- การเรียนรู้แบบ Zero-shot เทียบกับการเรียนรู้แบบ Single-shot และการเรียนรู้แบบ One-shot
- การเรียนรู้แบบ Zero-shot เทียบกับ Zero-shot prompting
- การประยุกต์ใช้การเรียนรู้แบบ Zero-Shot
- ประโยชน์ของการเรียนรู้แบบ Zero-Shot
- ความท้าทายของการเรียนรู้แบบ Zero-Shot
การเรียนรู้แบบ Zero-shot (ZSL) คืออะไร?
ZSL ช่วยให้โมเดลแมชชีนเลิร์นนิงสามารถคาดการณ์เกี่ยวกับหมวดหมู่ที่มองไม่เห็น โดยไม่ต้องมีตัวอย่างการฝึกอบรมเฉพาะสำหรับหมวดหมู่เหล่านั้น ต่างจากโมเดลการเรียนรู้ภายใต้การดูแลแบบดั้งเดิมซึ่งอาศัยชุดข้อมูลที่มีป้ายกำกับซึ่งทุกประเภทจะต้องแสดงอย่างชัดเจน ZSL ใช้ประโยชน์จากข้อมูลเสริม เช่น การฝังความหมายหรือคุณลักษณะ เพื่อสรุปความรู้
ตัวอย่างเช่น โมเดลการเรียนรู้แบบมีผู้สอนที่ได้รับการฝึกเพื่อจำแนกสัตว์ต่างๆ จะต้องมีตัวอย่างที่มีป้ายกำกับว่า "สุนัข" "แมว" และ "ม้าลาย" เพื่อจดจำพวกมัน ในขณะที่โมเดล ZSL ที่ได้รับการฝึกเกี่ยวกับรูปภาพสัตว์สามารถระบุม้าลายตามคุณลักษณะเชิงพรรณนา เช่น " ลายทาง” และ “เหมือนม้า” แม้ไม่ได้เห็นตัวอย่างก่อนหน้านี้ก็ตาม สิ่งนี้ทำให้ ZSL มีประโยชน์อย่างยิ่งสำหรับงานที่เกี่ยวข้องกับชุดข้อมูลขนาดใหญ่ที่ไม่มีป้ายกำกับ หรือสถานการณ์ที่การรวบรวมข้อมูลที่มีป้ายกำกับไม่สามารถทำได้ แอปพลิเคชันครอบคลุมทั้งคอมพิวเตอร์วิทัศน์ การประมวลผลภาษาธรรมชาติ (NLP) วิทยาการหุ่นยนต์ และอื่นๆ อีกมากมาย
การเรียนรู้แบบ Zero-shot ทำงานอย่างไร
โมเดล ZSL ได้รับการฝึกอบรมล่วงหน้าครั้งแรกในชุดข้อมูลขนาดใหญ่ที่มีป้ายกำกับเพื่อสร้างฐานความรู้ แบบจำลองจะดึงข้อมูลเสริมจากข้อมูลที่ติดป้ายกำกับ รวมถึงคุณลักษณะต่างๆ เช่น สี รูปร่าง และความรู้สึก
จากนั้นจะใช้คุณลักษณะเหล่านั้นเพื่อแมปความสัมพันธ์เชิงความหมายระหว่างหมวดหมู่ (หรือคลาส) ของข้อมูลที่มองเห็นและมองไม่เห็น กระบวนการนี้เรียกว่าการถ่ายโอนความรู้ ช่วยให้โมเดล ZSL เข้าใจได้ เช่น เป็ดและห่านมีความสัมพันธ์กันเพราะทั้งคู่มีจะงอยปาก ขน และตีนเป็นพังผืด
เทคนิคที่พบบ่อยที่สุดคือ ZSL ตามแอตทริบิวต์, ZSL ตามการฝังความหมาย และ ZSL ทั่วไป ด้านล่างเราจะตรวจสอบแต่ละรายการ
การเรียนรู้แบบ Zero-shot ตามคุณสมบัติ
โมเดล ZSL ตามคุณสมบัติมักใช้สำหรับงานคอมพิวเตอร์วิทัศน์ ทำงานโดยการฝึกอบรมชุดข้อมูลรูปภาพที่กำกับโดยมนุษย์ ป้ายกำกับประกอบด้วยคุณลักษณะที่บุคคลที่ติดป้ายกำกับเห็นว่ามีประโยชน์ สำหรับแต่ละภาพ ผู้ใช้จะใช้คำอธิบายข้อความเกี่ยวกับคุณลักษณะต่างๆ เช่น สี รูปร่าง หรือคุณลักษณะอื่นๆ
ตัวอย่างเช่น ในการจัดหมวดหมู่รูปภาพ คุณลักษณะเช่น "สีเทา" "สี่ขา" และ "สุนัข" อาจอธิบายหมวดหมู่ที่แตกต่างกัน ผ่านการฝึกอบรม โมเดลจะเรียนรู้ที่จะเชื่อมโยงคุณลักษณะเหล่านี้กับหมวดหมู่เฉพาะ
เมื่อคุณแสดงตัวอย่างสิ่งใหม่ๆ ให้กับโมเดล เช่น สัตว์ประเภทหนึ่งที่ไม่เคยเห็นมาก่อน มันจะสามารถคิดได้ว่าโมเดลกำลังดูคลาสที่คล้ายกันแต่ไม่เหมือนกับคลาสที่เห็นในการฝึกหรือไม่
เมื่อโมเดลพบกับหมวดหมู่ที่มองไม่เห็น เช่น หมาป่า โมเดลสามารถอนุมานชั้นเรียนได้โดยการวิเคราะห์คุณลักษณะที่แชร์กับหมวดหมู่ที่เรียนรู้ แม้ว่าป้ายกำกับ "หมาป่า" จะไม่ได้เป็นส่วนหนึ่งของการฝึกอบรมอย่างชัดเจนก็ตาม คุณลักษณะที่มนุษย์ตีความได้เหล่านี้ปรับปรุงความสามารถในการอธิบายและช่วยให้โมเดลสามารถสรุปคลาสใหม่ได้
การเรียนรู้แบบ Zero-Shot แบบฝังความหมาย
แนวทางนี้คล้ายกับ ZSL ตามคุณลักษณะ แต่แทนที่จะให้มนุษย์สร้างป้ายกำกับคุณลักษณะสำหรับการฝึก โมเดลจะสร้างสิ่งที่เรียกว่าการฝังความหมายของข้อมูลการฝึก การฝังความหมายเหล่านี้ได้รับการเข้ารหัสเป็นเวกเตอร์ ซึ่งเป็นวิธีทางคณิตศาสตร์ในการแสดงวัตถุในโลกแห่งความเป็นจริง จากนั้นจึงแมปในพื้นที่ฝัง
พื้นที่ฝังช่วยให้โมเดลสามารถจัดระเบียบความรู้ตามบริบทโดยการจัดกลุ่มข้อมูลที่เกี่ยวข้องให้อยู่ใกล้กันมากขึ้น ตัวอย่างเช่น หมวดหมู่ "สุนัข" และ "หมาป่า" จะอยู่ใกล้กันในพื้นที่ฝังมากกว่าหมวดหมู่ "สุนัข" และ "นก" เนื่องมาจากคุณลักษณะทางความหมายที่ใช้ร่วมกัน สิ่งนี้คล้ายกับวิธีที่โมเดลภาษาขนาดใหญ่ (LLM) ใช้การฝังความหมายกับคำพ้องความหมายคลัสเตอร์เนื่องจากความหมายที่คล้ายคลึงกัน
เมื่อโมเดลได้รับหมวดหมู่ที่มองไม่เห็น (อีกวิธีหนึ่งในการพูดว่า "ข้อมูลใหม่ที่โมเดลไม่เคยพบมาก่อน") โมเดลจะฉายเวกเตอร์จากคลาสใหม่เหล่านั้นลงในพื้นที่ฝังเดียวกันและวัดระยะห่างระหว่างพวกมันกับเวกเตอร์สำหรับคลาสที่รู้อยู่แล้ว เกี่ยวกับ. สิ่งนี้ให้บริบทของโมเดลสำหรับตัวอย่างที่มองไม่เห็น และอนุญาตให้อนุมานความสัมพันธ์เชิงความหมายระหว่างคลาสที่รู้จักและคลาสที่ไม่รู้จัก
การเรียนรู้แบบ Zero-shot ทั่วไป
เทคนิคการเรียนรู้แบบ Zero-shot ส่วนใหญ่จะฝึกโมเดลกับข้อมูลประเภทหนึ่ง แล้วนำไปใช้กับปัญหาอื่นแต่เกี่ยวข้องกัน นั่นคือแนวคิดของ "ช็อตเป็นศูนย์": โมเดลจะไม่ได้เห็นตัวอย่างใดๆ ของคลาสใหม่ก่อนที่จะพบพวกมันในป่า
อย่างไรก็ตาม แอปพลิเคชันในโลกแห่งความเป็นจริงไม่ได้ขาวดำเสมอไป ชุดข้อมูลที่คุณต้องการให้โมเดล ZSL ของคุณจัดประเภทอาจมีสิ่งต่าง ๆ จากคลาสที่รู้จักควบคู่ไปกับคลาสใหม่
ปัญหาคือว่าบางครั้งโมเดล ZSL แบบดั้งเดิมอาจแสดงอคติอย่างมากในการติดป้ายกำกับคลาสใหม่ผิด เนื่องจากเป็นสิ่งที่รู้อยู่แล้วว่าคุณผสมสิ่งใหม่และคุ้นเคยเข้าด้วยกัน ดังนั้นจึงมีประโยชน์ที่จะมีโมเดล ZSL ที่สามารถสรุปกับชุดข้อมูลที่อาจมีคลาสที่เห็นแล้วในการฝึกฝนได้
ใน ZSL ทั่วไป โมเดลจะใช้ขั้นตอนเพิ่มเติมเพื่อลดอคติต่อหมวดหมู่ที่รู้จัก ก่อนที่จะทำการจำแนกประเภท ก่อนอื่นจะตัดสินใจว่าอ็อบเจ็กต์ที่เป็นปัญหานั้นเป็นของคลาสที่รู้จักหรือไม่รู้จัก
การเรียนรู้แบบ Zero-shot เทียบกับการเรียนรู้แบบ Single-shot และการเรียนรู้แบบ One-shot
เช่นเดียวกับ ZSL การเรียนรู้แบบไม่กี่ช็อต (FSL) และการเรียนรู้แบบช็อตเดียว (OSL) ช่วยให้โมเดลการเรียนรู้เชิงลึกสามารถทำงานใหม่โดยใช้ข้อมูลใหม่เพียงเล็กน้อยหรือไม่มีเลย ทั้งสามวิธีอาศัยการแมปความสัมพันธ์ระหว่างคุณลักษณะของตัวอย่างที่ทราบเพื่ออนุมานรูปแบบในตัวอย่างที่ไม่รู้จัก เป้าหมายหลักของพวกเขาคือการสร้างแบบจำลองที่มีประสิทธิภาพในสถานการณ์จริงที่มีข้อมูลไม่เพียงพอหรือไม่มีเวลาในการฝึกอบรมโมเดลใหม่สำหรับงานเฉพาะ
ความแตกต่างที่สำคัญอยู่ที่วิธีจัดการข้อมูลใหม่:
- FSLเกี่ยวข้องกับการจัดเตรียมตัวอย่างที่มีป้ายกำกับจำนวนเล็กน้อยสำหรับคลาสใหม่ที่ต้องการระบุ
- OSLเป็นกรณีที่เจาะจงมากขึ้น โดยที่โมเดลจะแสดงเพียงตัวอย่างที่มีเลเบลเพียงตัวอย่างเดียวของคลาสใหม่
ทั้ง FSL และ OSL ต้องการขั้นตอนการฝึกอบรมเพิ่มเติมเมื่อเทียบกับ ZSL ซึ่งจะเพิ่มเวลาที่ต้องใช้ในการเรียนรู้งานใหม่ อย่างไรก็ตาม การฝึกอบรมพิเศษนี้ช่วยให้พวกเขารับมือกับงานที่เบี่ยงเบนไปจากความรู้ที่ได้รับการฝึกอบรมล่วงหน้าของโมเดลอย่างมีนัยสำคัญ ทำให้พวกเขาสามารถปรับตัวในทางปฏิบัติได้มากขึ้น

แม้ว่า ZSL มักจะถูกมองว่า "ยืดหยุ่น" เนื่องจากไม่ต้องการตัวอย่างที่มีป้ายกำกับสำหรับงานใหม่ แต่ความยืดหยุ่นนี้ส่วนใหญ่เป็นไปในทางทฤษฎี ในแอปพลิเคชันในโลกแห่งความเป็นจริง วิธี ZSL อาจมีปัญหากับ:
- งานที่เกี่ยวข้องกับตัวอย่างที่เห็นและมองไม่เห็นผสมกัน (เช่น สถานการณ์ ZSL ทั่วไป)
- งานที่แตกต่างอย่างมากจากข้อมูลการฝึกของโมเดล
โมเดล ZSL ยังมีความอ่อนไหวต่อปัจจัยต่างๆ เช่น วิธีแบ่งชุดข้อมูลระหว่างการฝึกล่วงหน้าและการประเมินผล ซึ่งอาจส่งผลต่อประสิทธิภาพการทำงาน ในทางกลับกัน FSL และ OSL มอบความยืดหยุ่นในทางปฏิบัติมากขึ้นสำหรับการปรับงานโดยการรวมตัวอย่างใหม่ๆ เข้ากับกระบวนการเรียนรู้ ทำให้พวกเขาทำงานได้ดีขึ้นในสถานการณ์ที่หลากหลาย
การเรียนรู้แบบ Zero-shot เทียบกับ Zero-shot prompting
ZSL เป็นสถาปัตยกรรมแบบจำลองประเภทหนึ่งที่ออกแบบมาสำหรับงานการเรียนรู้เชิงลึกต่างๆ ในทางตรงกันข้าม การแจ้งเตือนแบบ Zero-shot หมายถึงการขอให้ LLM เช่น ChatGPT หรือ Claude สร้างเอาต์พุตโดยไม่ต้องให้ตัวอย่างที่เฉพาะเจาะจงในพร้อมท์เพื่อเป็นแนวทางในการตอบสนอง ในทั้งสองกรณี โมเดลจะดำเนินการโดยไม่มีตัวอย่างที่ชัดเจนเกี่ยวกับงานที่เกี่ยวข้อง
ในการพร้อมท์แบบ Zero-shot คุณไม่ได้ระบุตัวอย่างใดๆ ที่เกี่ยวข้องกับงานให้กับโมเดล แต่คุณอาศัยความรู้ที่ได้รับการฝึกอบรมล่วงหน้าของ LLM เพื่ออนุมานและดำเนินงานแทน
ตัวอย่างเช่น คุณสามารถป้อนข้อความบทวิจารณ์ร้านอาหารและขอให้ LLM จัดประเภทว่าเป็นเชิงบวก เป็นกลาง หรือเชิงลบ โดยไม่ต้องให้ตัวอย่างบทวิจารณ์เพื่อใช้เป็นข้อมูลอ้างอิง LLM จะใช้การฝึกอบรมล่วงหน้าเพื่อกำหนดป้ายกำกับที่เหมาะสมสำหรับการทบทวน
แม้ว่าการเรียนรู้แบบ Zero-Shot และ Zero-Shot Prompting จะแบ่งปันแนวคิดในการปฏิบัติงานโดยไม่มีตัวอย่าง แต่ก็มีความแตกต่างที่สำคัญ:
- การเรียนรู้แบบ Zero-shotเป็นสถาปัตยกรรมแบบจำลองประเภทหนึ่งที่สร้างขึ้นสำหรับงานดังกล่าว
- Zero-shot promptingเป็นเทคนิคเฉพาะสำหรับการโต้ตอบกับ LLM ไม่ใช่สถาปัตยกรรมแบบจำลอง
การประยุกต์ใช้การเรียนรู้แบบ Zero-Shot
เนื่องจากมุ่งเน้นที่การช่วยให้โมเดลการเรียนรู้เชิงลึกปรับตัวเข้ากับงานใหม่ๆ ZSL จึงมีแอปพลิเคชันในหลายด้านของ ML รวมถึงคอมพิวเตอร์วิทัศน์ NLP และวิทยาการหุ่นยนต์ ZSL สามารถใช้ในด้านการดูแลสุขภาพ การวิเคราะห์ความรู้สึก การบริการลูกค้า การแปลเอกสาร และความปลอดภัยทางไซเบอร์ ตัวอย่างเช่น:
- การวิเคราะห์ความรู้สึก:เมื่อมีข่าวด่วนเกิดขึ้น โมเดล NLP แบบ Zero-shot สามารถทำการวิเคราะห์ความรู้สึกในการวิจารณ์สาธารณะ เพื่อให้ดูปฏิกิริยาของสาธารณะได้เกือบจะแบบเรียลไทม์
- การประมวลผลเอกสารหลายภาษา:โมเดล Zero-shot ของ NLP ที่ได้รับการฝึกอบรมเพื่อดึงข้อมูลจากเอกสารภาษีเป็นภาษาอังกฤษ สามารถทำการแยกเอกสารภาษีแบบเดียวกันในภาษาสเปนได้โดยไม่ต้องมีการฝึกอบรมเพิ่มเติม
- การวินิจฉัยทางการแพทย์:มีการใช้แบบจำลอง ZSL เพื่อระบุรังสีเอกซ์ของผู้ป่วยโรคโควิด-19 โดยไม่มีตัวอย่างที่เห็น การระบุตัวตนจะขึ้นอยู่กับคำอธิบายที่เป็นข้อความซึ่งจัดทำโดยแพทย์ที่ทำงานภาคสนาม ว่ารังสีเอกซ์เชิงบวกจะมีลักษณะอย่างไร
- แชทบอทที่เหมาะสมยิ่งขึ้น:โมเดล ZSL NLP สามารถเข้าใจคำสแลงและสำนวนที่ไม่เคยพบมาก่อนในระหว่างการแชทกับผู้คน ช่วยให้พวกเขาสามารถตอบคำถามที่ไม่ได้รับการฝึกมาโดยเฉพาะเพื่อจัดการได้อย่างมีความหมายมากขึ้น
- การตรวจจับความผิดปกติ:สามารถใช้ ZSL ในระบบรักษาความปลอดภัยทางไซเบอร์เพื่อตรวจจับรูปแบบที่ผิดปกติในกิจกรรมเครือข่าย หรือติดป้ายกำกับการโจมตีด้วยการแฮ็กรูปแบบใหม่เมื่อมีภัยคุกคามใหม่ๆ เกิดขึ้น
ประโยชน์ของการเรียนรู้แบบ Zero-Shot
วิธีการเรียนรู้แบบมีผู้สอนแบบดั้งเดิมมักจะใช้ไม่ได้จริงกับแอปพลิเคชันในโลกแห่งความเป็นจริงจำนวนมาก เมื่อพิจารณาจากชุดข้อมูลขนาดใหญ่ เวลาการฝึกอบรม เงิน และทรัพยากรการคำนวณที่พวกเขาต้องการ ZSL สามารถบรรเทาความท้าทายบางประการเหล่านั้นได้ ประโยชน์ต่างๆ ได้แก่ การลดต้นทุนที่เกี่ยวข้องกับการฝึกอบรมโมเดลใหม่ และการรับมือกับสถานการณ์ที่ข้อมูลขาดแคลนหรือยังไม่มี:
การพัฒนาที่คุ้มค่า
การได้มาและการดูแลจัดการชุดข้อมูลที่มีป้ายกำกับขนาดใหญ่ที่จำเป็นสำหรับการเรียนรู้แบบมีผู้สอนนั้นมีราคาแพงและใช้เวลานาน การฝึกอบรมโมเดลบนชุดข้อมูลที่มีป้ายกำกับคุณภาพสูงอาจมีค่าใช้จ่ายหลายหมื่นดอลลาร์ นอกเหนือจากค่าใช้จ่ายของเซิร์ฟเวอร์ พื้นที่การประมวลผลบนคลาวด์ และวิศวกร
ZSL แสดงให้เห็นถึงความมุ่งมั่นในการลดต้นทุนของโครงการ ML โดยอนุญาตให้สถาบันต่างๆ นำโมเดลไปใช้ใหม่สำหรับงานใหม่โดยไม่ต้องมีการฝึกอบรมเพิ่มเติม นอกจากนี้ยังช่วยให้หน่วยงานหรือบุคคลขนาดเล็กสามารถนำโมเดลที่สร้างโดยผู้อื่นไปใช้ใหม่ได้
การแก้ปัญหาด้วยข้อมูลที่หายาก
ความยืดหยุ่นของ ZSL ทำให้เป็นเครื่องมือที่ดีสำหรับสถานการณ์ที่มีข้อมูลน้อยหรือยังมีข้อมูลเกิดขึ้นอยู่ ตัวอย่างเช่น มีประโยชน์ในการวินิจฉัยโรคใหม่ๆ เมื่อข้อมูลยังไม่แพร่หลาย หรือในสถานการณ์ภัยพิบัติที่ข้อมูลมีการพัฒนาอย่างรวดเร็ว ZSL ยังมีประโยชน์สำหรับการตรวจจับความผิดปกติเมื่อข้อมูลมีปริมาณมากเกินไปที่นักวิเคราะห์ที่เป็นมนุษย์จะประมวลผลได้
ความท้าทายของการเรียนรู้แบบ Zero-Shot
ZSL อาศัยการมีข้อมูลการฝึกอบรมคุณภาพสูงอย่างมากในระหว่างช่วงก่อนการฝึกอบรมเพื่อทำความเข้าใจความสัมพันธ์เชิงความหมายระหว่างหมวดหมู่ต่างๆ ได้ดีพอที่จะสรุปกับข้อมูลใหม่ๆ ได้ หากไม่มีข้อมูลคุณภาพสูง ZSL ก็สามารถสร้างผลลัพธ์ที่ไม่น่าเชื่อถือซึ่งบางครั้งประเมินได้ยาก
ปัญหาทั่วไปที่โมเดล ZSL เผชิญ ได้แก่ ปัญหาในการปรับให้เข้ากับงานที่ไม่เหมือนกับงานที่ได้รับการฝึกแล้ว และปัญหาเกี่ยวกับข้อมูลการฝึกที่ทำให้ต้องใช้ป้ายกำกับบางอย่างมากเกินไปเมื่อคาดการณ์คลาสที่มองไม่เห็น
การปรับโดเมน
โมเดล ZSL จะทำงานได้ดีที่สุดเมื่อถูกขอให้จัดการกับข้อมูลใหม่จากโดเมนที่ไม่แตกต่างไปจากที่ได้รับการฝึกมากนัก ตัวอย่างเช่น หากโมเดลได้รับการฝึกฝนเกี่ยวกับภาพนิ่ง ก็จะประสบปัญหาในการจัดประเภทวิดีโอ
โมเดล ZSL อาศัยการแมปข้อมูลเสริมจากข้อมูลที่ไม่รู้จักไปยังข้อมูลที่รู้จัก ดังนั้น หากแหล่งข้อมูลแตกต่างกันเกินไป โมเดลก็จะไม่มีทางสรุปความรู้ทั่วไปกับงานใหม่ได้
ปัญหาความโอหัง
ปัญหาความใหญ่ใน ZSL เกิดขึ้นเมื่อโมเดลเริ่มใช้ป้ายกำกับเพียงไม่กี่รายการเมื่อทำการคาดการณ์สำหรับหมวดหมู่ที่มองไม่เห็น มันเกิดขึ้นเมื่อหลายจุดในพื้นที่คุณลักษณะแบบฝังรวมกลุ่มเข้าด้วยกัน ก่อให้เกิด "ฮับ" ที่เอนเอียงแบบจำลองไปยังป้ายกำกับเฉพาะ
สิ่งนี้สามารถเกิดขึ้นได้เนื่องจากสัญญาณรบกวนในข้อมูลการฝึก มีตัวอย่างข้อมูลบางประเภทมากเกินไปและมีข้อมูลอื่นๆ ไม่เพียงพอ หรือเนื่องจากการฝังความหมายของโมเดลไม่ชัดเจนเพียงพอ