คำอธิบายการเรียนรู้แบบ Zero-Shot: อนาคตของการเรียนรู้ของเครื่องโดยไม่มีป้ายกำกับ

เผยแพร่แล้ว: 2025-01-13

การเรียนรู้แบบ Zero-shot (ZSL) กำลังปฏิวัติการเรียนรู้ของเครื่อง (ML) โดยทำให้แบบจำลองสามารถจัดประเภทหรือคาดการณ์ผลลัพธ์สำหรับแนวคิดที่พวกเขาไม่เคยพบมาก่อน ถือเป็นการออกจากแนวทางแบบเดิมๆ ที่ต้องใช้ข้อมูลที่มีป้ายกำกับอย่างกว้างขวาง คู่มือนี้จะสำรวจวิธีการทำงานของ ZSL แอปพลิเคชัน การเปรียบเทียบการเรียนรู้แบบไม่กี่ช็อต (FSL) และความท้าทายและศักยภาพในอนาคต

สารบัญ

การเรียนรู้แบบ Zero-shot คืออะไร?
การเรียนรู้แบบ Zero-shot ทำงานอย่างไร
การเรียนรู้แบบ Zero-shot เทียบกับการเรียนรู้แบบ Single-shot และการเรียนรู้แบบ One-shot
การเรียนรู้แบบ Zero-shot เทียบกับ Zero-shot prompting
การประยุกต์ใช้การเรียนรู้แบบ Zero-Shot
ประโยชน์ของการเรียนรู้แบบ Zero-Shot
ความท้าทายของการเรียนรู้แบบ Zero-Shot

ทำงานอย่างชาญฉลาดยิ่งขึ้นด้วย Grammarly

คู่หูการเขียน AI สำหรับใครก็ตามที่มีงานทำ

การเรียนรู้แบบ Zero-shot (ZSL) คืออะไร?

ZSL ช่วยให้โมเดลแมชชีนเลิร์นนิงสามารถคาดการณ์เกี่ยวกับหมวดหมู่ที่มองไม่เห็น โดยไม่ต้องมีตัวอย่างการฝึกอบรมเฉพาะสำหรับหมวดหมู่เหล่านั้น ต่างจากโมเดลการเรียนรู้ภายใต้การดูแลแบบดั้งเดิมซึ่งอาศัยชุดข้อมูลที่มีป้ายกำกับซึ่งทุกประเภทจะต้องแสดงอย่างชัดเจน ZSL ใช้ประโยชน์จากข้อมูลเสริม เช่น การฝังความหมายหรือคุณลักษณะ เพื่อสรุปความรู้

ตัวอย่างเช่น โมเดลการเรียนรู้แบบมีผู้สอนที่ได้รับการฝึกเพื่อจำแนกสัตว์ต่างๆ จะต้องมีตัวอย่างที่มีป้ายกำกับว่า "สุนัข" "แมว" และ "ม้าลาย" เพื่อจดจำพวกมัน ในขณะที่โมเดล ZSL ที่ได้รับการฝึกเกี่ยวกับรูปภาพสัตว์สามารถระบุม้าลายตามคุณลักษณะเชิงพรรณนา เช่น " ลายทาง” และ “เหมือนม้า” แม้ไม่ได้เห็นตัวอย่างก่อนหน้านี้ก็ตาม สิ่งนี้ทำให้ ZSL มีประโยชน์อย่างยิ่งสำหรับงานที่เกี่ยวข้องกับชุดข้อมูลขนาดใหญ่ที่ไม่มีป้ายกำกับ หรือสถานการณ์ที่การรวบรวมข้อมูลที่มีป้ายกำกับไม่สามารถทำได้ แอปพลิเคชันครอบคลุมทั้งคอมพิวเตอร์วิทัศน์ การประมวลผลภาษาธรรมชาติ (NLP) วิทยาการหุ่นยนต์ และอื่นๆ อีกมากมาย

การเรียนรู้แบบ Zero-shot ทำงานอย่างไร

โมเดล ZSL ได้รับการฝึกอบรมล่วงหน้าครั้งแรกในชุดข้อมูลขนาดใหญ่ที่มีป้ายกำกับเพื่อสร้างฐานความรู้ แบบจำลองจะดึงข้อมูลเสริมจากข้อมูลที่ติดป้ายกำกับ รวมถึงคุณลักษณะต่างๆ เช่น สี รูปร่าง และความรู้สึก

จากนั้นจะใช้คุณลักษณะเหล่านั้นเพื่อแมปความสัมพันธ์เชิงความหมายระหว่างหมวดหมู่ (หรือคลาส) ของข้อมูลที่มองเห็นและมองไม่เห็น กระบวนการนี้เรียกว่าการถ่ายโอนความรู้ ช่วยให้โมเดล ZSL เข้าใจได้ เช่น เป็ดและห่านมีความสัมพันธ์กันเพราะทั้งคู่มีจะงอยปาก ขน และตีนเป็นพังผืด

เทคนิคที่พบบ่อยที่สุดคือ ZSL ตามแอตทริบิวต์, ZSL ตามการฝังความหมาย และ ZSL ทั่วไป ด้านล่างเราจะตรวจสอบแต่ละรายการ

การเรียนรู้แบบ Zero-shot ตามคุณสมบัติ

โมเดล ZSL ตามคุณสมบัติมักใช้สำหรับงานคอมพิวเตอร์วิทัศน์ ทำงานโดยการฝึกอบรมชุดข้อมูลรูปภาพที่กำกับโดยมนุษย์ ป้ายกำกับประกอบด้วยคุณลักษณะที่บุคคลที่ติดป้ายกำกับเห็นว่ามีประโยชน์ สำหรับแต่ละภาพ ผู้ใช้จะใช้คำอธิบายข้อความเกี่ยวกับคุณลักษณะต่างๆ เช่น สี รูปร่าง หรือคุณลักษณะอื่นๆ

ตัวอย่างเช่น ในการจัดหมวดหมู่รูปภาพ คุณลักษณะเช่น "สีเทา" "สี่ขา" และ "สุนัข" อาจอธิบายหมวดหมู่ที่แตกต่างกัน ผ่านการฝึกอบรม โมเดลจะเรียนรู้ที่จะเชื่อมโยงคุณลักษณะเหล่านี้กับหมวดหมู่เฉพาะ

เมื่อคุณแสดงตัวอย่างสิ่งใหม่ๆ ให้กับโมเดล เช่น สัตว์ประเภทหนึ่งที่ไม่เคยเห็นมาก่อน มันจะสามารถคิดได้ว่าโมเดลกำลังดูคลาสที่คล้ายกันแต่ไม่เหมือนกับคลาสที่เห็นในการฝึกหรือไม่

เมื่อโมเดลพบกับหมวดหมู่ที่มองไม่เห็น เช่น หมาป่า โมเดลสามารถอนุมานชั้นเรียนได้โดยการวิเคราะห์คุณลักษณะที่แชร์กับหมวดหมู่ที่เรียนรู้ แม้ว่าป้ายกำกับ "หมาป่า" จะไม่ได้เป็นส่วนหนึ่งของการฝึกอบรมอย่างชัดเจนก็ตาม คุณลักษณะที่มนุษย์ตีความได้เหล่านี้ปรับปรุงความสามารถในการอธิบายและช่วยให้โมเดลสามารถสรุปคลาสใหม่ได้

การเรียนรู้แบบ Zero-Shot แบบฝังความหมาย

แนวทางนี้คล้ายกับ ZSL ตามคุณลักษณะ แต่แทนที่จะให้มนุษย์สร้างป้ายกำกับคุณลักษณะสำหรับการฝึก โมเดลจะสร้างสิ่งที่เรียกว่าการฝังความหมายของข้อมูลการฝึก การฝังความหมายเหล่านี้ได้รับการเข้ารหัสเป็นเวกเตอร์ ซึ่งเป็นวิธีทางคณิตศาสตร์ในการแสดงวัตถุในโลกแห่งความเป็นจริง จากนั้นจึงแมปในพื้นที่ฝัง

พื้นที่ฝังช่วยให้โมเดลสามารถจัดระเบียบความรู้ตามบริบทโดยการจัดกลุ่มข้อมูลที่เกี่ยวข้องให้อยู่ใกล้กันมากขึ้น ตัวอย่างเช่น หมวดหมู่ "สุนัข" และ "หมาป่า" จะอยู่ใกล้กันในพื้นที่ฝังมากกว่าหมวดหมู่ "สุนัข" และ "นก" เนื่องมาจากคุณลักษณะทางความหมายที่ใช้ร่วมกัน สิ่งนี้คล้ายกับวิธีที่โมเดลภาษาขนาดใหญ่ (LLM) ใช้การฝังความหมายกับคำพ้องความหมายคลัสเตอร์เนื่องจากความหมายที่คล้ายคลึงกัน

เมื่อโมเดลได้รับหมวดหมู่ที่มองไม่เห็น (อีกวิธีหนึ่งในการพูดว่า "ข้อมูลใหม่ที่โมเดลไม่เคยพบมาก่อน") โมเดลจะฉายเวกเตอร์จากคลาสใหม่เหล่านั้นลงในพื้นที่ฝังเดียวกันและวัดระยะห่างระหว่างพวกมันกับเวกเตอร์สำหรับคลาสที่รู้อยู่แล้ว เกี่ยวกับ. สิ่งนี้ให้บริบทของโมเดลสำหรับตัวอย่างที่มองไม่เห็น และอนุญาตให้อนุมานความสัมพันธ์เชิงความหมายระหว่างคลาสที่รู้จักและคลาสที่ไม่รู้จัก

การเรียนรู้แบบ Zero-shot ทั่วไป

เทคนิคการเรียนรู้แบบ Zero-shot ส่วนใหญ่จะฝึกโมเดลกับข้อมูลประเภทหนึ่ง แล้วนำไปใช้กับปัญหาอื่นแต่เกี่ยวข้องกัน นั่นคือแนวคิดของ "ช็อตเป็นศูนย์": โมเดลจะไม่ได้เห็นตัวอย่างใดๆ ของคลาสใหม่ก่อนที่จะพบพวกมันในป่า

อย่างไรก็ตาม แอปพลิเคชันในโลกแห่งความเป็นจริงไม่ได้ขาวดำเสมอไป ชุดข้อมูลที่คุณต้องการให้โมเดล ZSL ของคุณจัดประเภทอาจมีสิ่งต่าง ๆ จากคลาสที่รู้จักควบคู่ไปกับคลาสใหม่

ปัญหาคือว่าบางครั้งโมเดล ZSL แบบดั้งเดิมอาจแสดงอคติอย่างมากในการติดป้ายกำกับคลาสใหม่ผิด เนื่องจากเป็นสิ่งที่รู้อยู่แล้วว่าคุณผสมสิ่งใหม่และคุ้นเคยเข้าด้วยกัน ดังนั้นจึงมีประโยชน์ที่จะมีโมเดล ZSL ที่สามารถสรุปกับชุดข้อมูลที่อาจมีคลาสที่เห็นแล้วในการฝึกฝนได้

ใน ZSL ทั่วไป โมเดลจะใช้ขั้นตอนเพิ่มเติมเพื่อลดอคติต่อหมวดหมู่ที่รู้จัก ก่อนที่จะทำการจำแนกประเภท ก่อนอื่นจะตัดสินใจว่าอ็อบเจ็กต์ที่เป็นปัญหานั้นเป็นของคลาสที่รู้จักหรือไม่รู้จัก

การเรียนรู้แบบ Zero-shot เทียบกับการเรียนรู้แบบ Single-shot และการเรียนรู้แบบ One-shot

เช่นเดียวกับ ZSL การเรียนรู้แบบไม่กี่ช็อต (FSL) และการเรียนรู้แบบช็อตเดียว (OSL) ช่วยให้โมเดลการเรียนรู้เชิงลึกสามารถทำงานใหม่โดยใช้ข้อมูลใหม่เพียงเล็กน้อยหรือไม่มีเลย ทั้งสามวิธีอาศัยการแมปความสัมพันธ์ระหว่างคุณลักษณะของตัวอย่างที่ทราบเพื่ออนุมานรูปแบบในตัวอย่างที่ไม่รู้จัก เป้าหมายหลักของพวกเขาคือการสร้างแบบจำลองที่มีประสิทธิภาพในสถานการณ์จริงที่มีข้อมูลไม่เพียงพอหรือไม่มีเวลาในการฝึกอบรมโมเดลใหม่สำหรับงานเฉพาะ

ความแตกต่างที่สำคัญอยู่ที่วิธีจัดการข้อมูลใหม่:

FSLเกี่ยวข้องกับการจัดเตรียมตัวอย่างที่มีป้ายกำกับจำนวนเล็กน้อยสำหรับคลาสใหม่ที่ต้องการระบุ
OSLเป็นกรณีที่เจาะจงมากขึ้น โดยที่โมเดลจะแสดงเพียงตัวอย่างที่มีเลเบลเพียงตัวอย่างเดียวของคลาสใหม่

ทั้ง FSL และ OSL ต้องการขั้นตอนการฝึกอบรมเพิ่มเติมเมื่อเทียบกับ ZSL ซึ่งจะเพิ่มเวลาที่ต้องใช้ในการเรียนรู้งานใหม่ อย่างไรก็ตาม การฝึกอบรมพิเศษนี้ช่วยให้พวกเขารับมือกับงานที่เบี่ยงเบนไปจากความรู้ที่ได้รับการฝึกอบรมล่วงหน้าของโมเดลอย่างมีนัยสำคัญ ทำให้พวกเขาสามารถปรับตัวในทางปฏิบัติได้มากขึ้น

แม้ว่า ZSL มักจะถูกมองว่า "ยืดหยุ่น" เนื่องจากไม่ต้องการตัวอย่างที่มีป้ายกำกับสำหรับงานใหม่ แต่ความยืดหยุ่นนี้ส่วนใหญ่เป็นไปในทางทฤษฎี ในแอปพลิเคชันในโลกแห่งความเป็นจริง วิธี ZSL อาจมีปัญหากับ:

งานที่เกี่ยวข้องกับตัวอย่างที่เห็นและมองไม่เห็นผสมกัน (เช่น สถานการณ์ ZSL ทั่วไป)
งานที่แตกต่างอย่างมากจากข้อมูลการฝึกของโมเดล

โมเดล ZSL ยังมีความอ่อนไหวต่อปัจจัยต่างๆ เช่น วิธีแบ่งชุดข้อมูลระหว่างการฝึกล่วงหน้าและการประเมินผล ซึ่งอาจส่งผลต่อประสิทธิภาพการทำงาน ในทางกลับกัน FSL และ OSL มอบความยืดหยุ่นในทางปฏิบัติมากขึ้นสำหรับการปรับงานโดยการรวมตัวอย่างใหม่ๆ เข้ากับกระบวนการเรียนรู้ ทำให้พวกเขาทำงานได้ดีขึ้นในสถานการณ์ที่หลากหลาย

การเรียนรู้แบบ Zero-shot เทียบกับ Zero-shot prompting

ZSL เป็นสถาปัตยกรรมแบบจำลองประเภทหนึ่งที่ออกแบบมาสำหรับงานการเรียนรู้เชิงลึกต่างๆ ในทางตรงกันข้าม การแจ้งเตือนแบบ Zero-shot หมายถึงการขอให้ LLM เช่น ChatGPT หรือ Claude สร้างเอาต์พุตโดยไม่ต้องให้ตัวอย่างที่เฉพาะเจาะจงในพร้อมท์เพื่อเป็นแนวทางในการตอบสนอง ในทั้งสองกรณี โมเดลจะดำเนินการโดยไม่มีตัวอย่างที่ชัดเจนเกี่ยวกับงานที่เกี่ยวข้อง

ในการพร้อมท์แบบ Zero-shot คุณไม่ได้ระบุตัวอย่างใดๆ ที่เกี่ยวข้องกับงานให้กับโมเดล แต่คุณอาศัยความรู้ที่ได้รับการฝึกอบรมล่วงหน้าของ LLM เพื่ออนุมานและดำเนินงานแทน

ตัวอย่างเช่น คุณสามารถป้อนข้อความบทวิจารณ์ร้านอาหารและขอให้ LLM จัดประเภทว่าเป็นเชิงบวก เป็นกลาง หรือเชิงลบ โดยไม่ต้องให้ตัวอย่างบทวิจารณ์เพื่อใช้เป็นข้อมูลอ้างอิง LLM จะใช้การฝึกอบรมล่วงหน้าเพื่อกำหนดป้ายกำกับที่เหมาะสมสำหรับการทบทวน

แม้ว่าการเรียนรู้แบบ Zero-Shot และ Zero-Shot Prompting จะแบ่งปันแนวคิดในการปฏิบัติงานโดยไม่มีตัวอย่าง แต่ก็มีความแตกต่างที่สำคัญ:

การเรียนรู้แบบ Zero-shotเป็นสถาปัตยกรรมแบบจำลองประเภทหนึ่งที่สร้างขึ้นสำหรับงานดังกล่าว
Zero-shot promptingเป็นเทคนิคเฉพาะสำหรับการโต้ตอบกับ LLM ไม่ใช่สถาปัตยกรรมแบบจำลอง

การประยุกต์ใช้การเรียนรู้แบบ Zero-Shot

เนื่องจากมุ่งเน้นที่การช่วยให้โมเดลการเรียนรู้เชิงลึกปรับตัวเข้ากับงานใหม่ๆ ZSL จึงมีแอปพลิเคชันในหลายด้านของ ML รวมถึงคอมพิวเตอร์วิทัศน์ NLP และวิทยาการหุ่นยนต์ ZSL สามารถใช้ในด้านการดูแลสุขภาพ การวิเคราะห์ความรู้สึก การบริการลูกค้า การแปลเอกสาร และความปลอดภัยทางไซเบอร์ ตัวอย่างเช่น:

การวิเคราะห์ความรู้สึก:เมื่อมีข่าวด่วนเกิดขึ้น โมเดล NLP แบบ Zero-shot สามารถทำการวิเคราะห์ความรู้สึกในการวิจารณ์สาธารณะ เพื่อให้ดูปฏิกิริยาของสาธารณะได้เกือบจะแบบเรียลไทม์
การประมวลผลเอกสารหลายภาษา:โมเดล Zero-shot ของ NLP ที่ได้รับการฝึกอบรมเพื่อดึงข้อมูลจากเอกสารภาษีเป็นภาษาอังกฤษ สามารถทำการแยกเอกสารภาษีแบบเดียวกันในภาษาสเปนได้โดยไม่ต้องมีการฝึกอบรมเพิ่มเติม
การวินิจฉัยทางการแพทย์:มีการใช้แบบจำลอง ZSL เพื่อระบุรังสีเอกซ์ของผู้ป่วยโรคโควิด-19 โดยไม่มีตัวอย่างที่เห็น การระบุตัวตนจะขึ้นอยู่กับคำอธิบายที่เป็นข้อความซึ่งจัดทำโดยแพทย์ที่ทำงานภาคสนาม ว่ารังสีเอกซ์เชิงบวกจะมีลักษณะอย่างไร
แชทบอทที่เหมาะสมยิ่งขึ้น:โมเดล ZSL NLP สามารถเข้าใจคำสแลงและสำนวนที่ไม่เคยพบมาก่อนในระหว่างการแชทกับผู้คน ช่วยให้พวกเขาสามารถตอบคำถามที่ไม่ได้รับการฝึกมาโดยเฉพาะเพื่อจัดการได้อย่างมีความหมายมากขึ้น
การตรวจจับความผิดปกติ:สามารถใช้ ZSL ในระบบรักษาความปลอดภัยทางไซเบอร์เพื่อตรวจจับรูปแบบที่ผิดปกติในกิจกรรมเครือข่าย หรือติดป้ายกำกับการโจมตีด้วยการแฮ็กรูปแบบใหม่เมื่อมีภัยคุกคามใหม่ๆ เกิดขึ้น

ประโยชน์ของการเรียนรู้แบบ Zero-Shot

วิธีการเรียนรู้แบบมีผู้สอนแบบดั้งเดิมมักจะใช้ไม่ได้จริงกับแอปพลิเคชันในโลกแห่งความเป็นจริงจำนวนมาก เมื่อพิจารณาจากชุดข้อมูลขนาดใหญ่ เวลาการฝึกอบรม เงิน และทรัพยากรการคำนวณที่พวกเขาต้องการ ZSL สามารถบรรเทาความท้าทายบางประการเหล่านั้นได้ ประโยชน์ต่างๆ ได้แก่ การลดต้นทุนที่เกี่ยวข้องกับการฝึกอบรมโมเดลใหม่ และการรับมือกับสถานการณ์ที่ข้อมูลขาดแคลนหรือยังไม่มี:

การพัฒนาที่คุ้มค่า

การได้มาและการดูแลจัดการชุดข้อมูลที่มีป้ายกำกับขนาดใหญ่ที่จำเป็นสำหรับการเรียนรู้แบบมีผู้สอนนั้นมีราคาแพงและใช้เวลานาน การฝึกอบรมโมเดลบนชุดข้อมูลที่มีป้ายกำกับคุณภาพสูงอาจมีค่าใช้จ่ายหลายหมื่นดอลลาร์ นอกเหนือจากค่าใช้จ่ายของเซิร์ฟเวอร์ พื้นที่การประมวลผลบนคลาวด์ และวิศวกร

ZSL แสดงให้เห็นถึงความมุ่งมั่นในการลดต้นทุนของโครงการ ML โดยอนุญาตให้สถาบันต่างๆ นำโมเดลไปใช้ใหม่สำหรับงานใหม่โดยไม่ต้องมีการฝึกอบรมเพิ่มเติม นอกจากนี้ยังช่วยให้หน่วยงานหรือบุคคลขนาดเล็กสามารถนำโมเดลที่สร้างโดยผู้อื่นไปใช้ใหม่ได้

การแก้ปัญหาด้วยข้อมูลที่หายาก

ความยืดหยุ่นของ ZSL ทำให้เป็นเครื่องมือที่ดีสำหรับสถานการณ์ที่มีข้อมูลน้อยหรือยังมีข้อมูลเกิดขึ้นอยู่ ตัวอย่างเช่น มีประโยชน์ในการวินิจฉัยโรคใหม่ๆ เมื่อข้อมูลยังไม่แพร่หลาย หรือในสถานการณ์ภัยพิบัติที่ข้อมูลมีการพัฒนาอย่างรวดเร็ว ZSL ยังมีประโยชน์สำหรับการตรวจจับความผิดปกติเมื่อข้อมูลมีปริมาณมากเกินไปที่นักวิเคราะห์ที่เป็นมนุษย์จะประมวลผลได้

ความท้าทายของการเรียนรู้แบบ Zero-Shot

ZSL อาศัยการมีข้อมูลการฝึกอบรมคุณภาพสูงอย่างมากในระหว่างช่วงก่อนการฝึกอบรมเพื่อทำความเข้าใจความสัมพันธ์เชิงความหมายระหว่างหมวดหมู่ต่างๆ ได้ดีพอที่จะสรุปกับข้อมูลใหม่ๆ ได้ หากไม่มีข้อมูลคุณภาพสูง ZSL ก็สามารถสร้างผลลัพธ์ที่ไม่น่าเชื่อถือซึ่งบางครั้งประเมินได้ยาก

ปัญหาทั่วไปที่โมเดล ZSL เผชิญ ได้แก่ ปัญหาในการปรับให้เข้ากับงานที่ไม่เหมือนกับงานที่ได้รับการฝึกแล้ว และปัญหาเกี่ยวกับข้อมูลการฝึกที่ทำให้ต้องใช้ป้ายกำกับบางอย่างมากเกินไปเมื่อคาดการณ์คลาสที่มองไม่เห็น

การปรับโดเมน

โมเดล ZSL จะทำงานได้ดีที่สุดเมื่อถูกขอให้จัดการกับข้อมูลใหม่จากโดเมนที่ไม่แตกต่างไปจากที่ได้รับการฝึกมากนัก ตัวอย่างเช่น หากโมเดลได้รับการฝึกฝนเกี่ยวกับภาพนิ่ง ก็จะประสบปัญหาในการจัดประเภทวิดีโอ

โมเดล ZSL อาศัยการแมปข้อมูลเสริมจากข้อมูลที่ไม่รู้จักไปยังข้อมูลที่รู้จัก ดังนั้น หากแหล่งข้อมูลแตกต่างกันเกินไป โมเดลก็จะไม่มีทางสรุปความรู้ทั่วไปกับงานใหม่ได้

ปัญหาความโอหัง

ปัญหาความใหญ่ใน ZSL เกิดขึ้นเมื่อโมเดลเริ่มใช้ป้ายกำกับเพียงไม่กี่รายการเมื่อทำการคาดการณ์สำหรับหมวดหมู่ที่มองไม่เห็น มันเกิดขึ้นเมื่อหลายจุดในพื้นที่คุณลักษณะแบบฝังรวมกลุ่มเข้าด้วยกัน ก่อให้เกิด "ฮับ" ที่เอนเอียงแบบจำลองไปยังป้ายกำกับเฉพาะ

สิ่งนี้สามารถเกิดขึ้นได้เนื่องจากสัญญาณรบกวนในข้อมูลการฝึก มีตัวอย่างข้อมูลบางประเภทมากเกินไปและมีข้อมูลอื่นๆ ไม่เพียงพอ หรือเนื่องจากการฝังความหมายของโมเดลไม่ชัดเจนเพียงพอ