การเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้ดูแล: ความแตกต่าง ประโยชน์ และกรณีการใช้งาน
เผยแพร่แล้ว: 2025-01-17การเรียนรู้ของเครื่อง (ML) ขับเคลื่อนเทคโนโลยีมากมายที่เราพึ่งพาในแต่ละวัน เช่น การจดจำรูปภาพและยานพาหนะอัตโนมัติ แนวทางพื้นฐานสองแนวทาง—การเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้ดูแล—สร้างกระดูกสันหลังของระบบเหล่านี้ แม้ว่าทั้งสองอย่างจะเป็นกุญแจสำคัญในการฝึกโมเดล ML แต่ก็มีวิธีการ เป้าหมาย และการใช้งานที่แตกต่างกัน
ในคู่มือนี้ เราจะเปรียบเทียบสองแนวทางนี้ เน้นความแตกต่าง และสำรวจประโยชน์และความท้าทายของทั้งสองแนวทาง นอกจากนี้เรายังจะสำรวจการใช้งานจริงเพื่อช่วยให้คุณเข้าใจว่ารูปแบบใดเหมาะสมที่สุดสำหรับงานต่างๆ
สารบัญ
- การเรียนรู้แบบมีผู้สอนคืออะไร?
- การเรียนรู้แบบไม่มีผู้ดูแลคืออะไร?
- ภายใต้การดูแลและไม่ได้รับการดูแล: ความแตกต่างที่สำคัญ
- ประโยชน์ของการเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้สอน
- ความท้าทายของการเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้สอน
- การประยุกต์การเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้สอน
- บทสรุป
การเรียนรู้แบบมีผู้สอนคืออะไร?
การเรียนรู้แบบมีผู้สอนจะฝึกระบบ ML โดยใช้ข้อมูลที่ติดป้ายกำกับ ในบริบทนี้ “มีป้ายกำกับ” หมายความว่าตัวอย่างการฝึกอบรมแต่ละรายการจะจับคู่กับผลลัพธ์ที่ทราบ ป้ายกำกับเหล่านี้ซึ่งมักสร้างโดยผู้เชี่ยวชาญ ช่วยให้ระบบเรียนรู้ความสัมพันธ์ระหว่างอินพุตและเอาต์พุต เมื่อได้รับการฝึกอบรมแล้ว ระบบที่ได้รับการดูแลสามารถนำความสัมพันธ์ที่เรียนรู้เหล่านี้ไปใช้กับข้อมูลที่มองไม่เห็นใหม่ๆ เพื่อคาดการณ์หรือจำแนกประเภทได้
ตัวอย่างเช่น ในบริบทของรถยนต์ที่ขับเคลื่อนด้วยตนเอง ระบบการเรียนรู้ภายใต้การดูแลอาจวิเคราะห์ข้อมูลวิดีโอที่มีป้ายกำกับ คำอธิบายประกอบเหล่านี้ระบุป้ายถนน คนเดินเท้า และสิ่งกีดขวาง ทำให้ระบบสามารถจดจำและตอบสนองต่อคุณสมบัติที่คล้ายกันในสถานการณ์การขับขี่ในโลกแห่งความเป็นจริง
อัลกอริธึมการเรียนรู้แบบมีผู้สอนแบ่งออกเป็นสองประเภทหลัก:
- การจัดหมวดหมู่: อัลกอริธึมเหล่านี้จะกำหนดป้ายกำกับให้กับข้อมูลใหม่ เช่น การระบุอีเมลว่าเป็นสแปมหรือไม่ใช่สแปม
- การถดถอย: อัลกอริธึมเหล่านี้จะทำนายค่าที่ต่อเนื่อง เช่น การคาดการณ์ยอดขายในอนาคตตามประสิทธิภาพที่ผ่านมา
เมื่อชุดข้อมูลเติบโตขึ้นและทรัพยากรในการคำนวณดีขึ้น ระบบที่ได้รับการดูแลจะมีความแม่นยำและมีประสิทธิภาพมากขึ้น โดยรองรับแอปพลิเคชันต่างๆ เช่น การตรวจจับการฉ้อโกงและการวินิจฉัยทางการแพทย์
การเรียนรู้แบบไม่มีผู้ดูแลคืออะไร?
ในทางตรงกันข้าม การเรียนรู้แบบไม่มีผู้ดูแลจะวิเคราะห์ข้อมูลโดยไม่มีตัวอย่างที่มีป้ายกำกับ โดยอาศัยอัลกอริธึมทางสถิติเพื่อค้นหารูปแบบหรือความสัมพันธ์ที่ซ่อนอยู่ แบบจำลองเหล่านี้อนุมานโครงสร้างและอัปเดตสิ่งที่ค้นพบแบบไดนามิกซึ่งแตกต่างจากระบบที่ได้รับการดูแล เมื่อมีข้อมูลใหม่ แม้ว่าการเรียนรู้แบบไม่มีผู้ดูแลจะเก่งในการค้นพบรูปแบบ แต่โดยทั่วไปแล้วจะมีประสิทธิภาพน้อยกว่าสำหรับงานคาดการณ์
ตัวอย่างในทางปฏิบัติคือบริการรวบรวมข่าวสาร ระบบเหล่านี้จะจัดกลุ่มบทความที่เกี่ยวข้องและโพสต์บนโซเชียลมีเดียเกี่ยวกับเหตุการณ์ข่าวด่วนโดยไม่มีการติดป้ายกำกับจากภายนอก ด้วยการระบุสิ่งที่เหมือนกันแบบเรียลไทม์ พวกเขาจึงทำการเรียนรู้แบบไม่มีผู้ดูแลเพื่อเน้นเรื่องราวสำคัญ
ต่อไปนี้เป็นอัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลเฉพาะบางส่วน:
- การจัดกลุ่ม:สิ่งเหล่านี้ใช้เพื่อแบ่งกลุ่มผู้บริโภคและปรับกลุ่มเมื่อพฤติกรรมเปลี่ยนไป
- การเชื่อมโยง:สิ่งเหล่านี้จะตรวจจับรูปแบบในข้อมูล เช่น การระบุความผิดปกติที่อาจบ่งบอกถึงการละเมิดความปลอดภัย
- การลดขนาด: สิ่งเหล่านี้ทำให้โครงสร้างข้อมูลง่ายขึ้นในขณะที่ยังคงรักษาข้อมูลที่สำคัญ และมักใช้ในการบีบอัดและแสดงภาพชุดข้อมูลที่ซับซ้อน
การเรียนรู้แบบไม่มีผู้ดูแลเป็นส่วนสำคัญในการวิเคราะห์ข้อมูลเชิงสำรวจและการเปิดเผยข้อมูลเชิงลึกในสถานการณ์ที่ข้อมูลที่มีป้ายกำกับไม่พร้อมใช้งาน
ภายใต้การดูแลและไม่ได้รับการดูแล: ความแตกต่างที่สำคัญ
การเรียนรู้แบบมีผู้ดูแลและไม่ได้รับการดูแลมีบทบาทที่แตกต่างกันใน ML แนวทางเหล่านี้แตกต่างกันไปตามข้อกำหนดด้านข้อมูล การมีส่วนร่วมของมนุษย์ งาน และแอปพลิเคชัน ตารางด้านล่างเน้นความแตกต่างเหล่านี้ ซึ่งเราจะสำรวจเพิ่มเติม
การเรียนรู้แบบมีการดูแล | การเรียนรู้แบบไม่มีผู้ดูแล | |
ป้อนข้อมูล | ต้องมีข้อมูลที่ติดป้ายกำกับ | ต้องใช้ข้อมูลที่ไม่มีป้ายกำกับ |
วัตถุประสงค์ | คาดการณ์หรือจัดประเภทป้ายกำกับเอาต์พุตตามคุณลักษณะอินพุต | ค้นพบและอัปเดตรูปแบบ โครงสร้าง หรือการนำเสนอที่ซ่อนอยู่ในข้อมูล |
การมีส่วนร่วมของมนุษย์ | ความพยายามอย่างมากในการติดป้ายกำกับชุดข้อมูลขนาดใหญ่และคำแนะนำจากผู้เชี่ยวชาญในการเลือกคุณสมบัติ | การแทรกแซงของมนุษย์เพียงเล็กน้อยแต่มีความเฉพาะเจาะจงมาก โดยหลักแล้วสำหรับการตั้งค่าพารามิเตอร์อัลกอริทึม การเพิ่มประสิทธิภาพการใช้ทรัพยากรตามขนาด และการวิจัยอัลกอริทึม |
งานหลัก | การถดถอย การจำแนกประเภท | การจัดกลุ่ม การเชื่อมโยง การลดขนาด |
อัลกอริธึมทั่วไป | การถดถอยเชิงเส้นและโลจิสติก แผนผังการตัดสินใจ โครงข่ายประสาทเทียม | การจัดกลุ่มเคมีน การวิเคราะห์องค์ประกอบหลัก (PCA) ตัวเข้ารหัสอัตโนมัติ |
เอาท์พุต | โมเดลการคาดการณ์ที่สามารถจำแนกหรือถดถอยจุดข้อมูลใหม่ได้ | การจัดกลุ่มหรือการแสดงข้อมูล (เช่น คลัสเตอร์ ส่วนประกอบ) |
การใช้งาน | การตรวจจับสแปม การตรวจจับการฉ้อโกง การจัดหมวดหมู่รูปภาพ การคาดการณ์ราคา ฯลฯ | การแบ่งส่วนลูกค้า การวิเคราะห์ตะกร้าตลาด การตรวจจับความผิดปกติ ฯลฯ |
ความแตกต่างระหว่างระยะการฝึก
ความแตกต่างหลักระหว่างอัลกอริธึมทั้งสองประเภทคือประเภทของชุดข้อมูลที่ขึ้นอยู่กับ ประโยชน์การเรียนรู้แบบมีผู้สอนจากชุดข้อมูลที่มีป้ายกำกับจำนวนมาก ด้วยเหตุนี้ ระบบการควบคุมดูแลที่ทันสมัยที่สุดจึงอาศัยแรงงานมนุษย์ที่ไม่เฉพาะเจาะจงขนาดใหญ่เพื่อกรองข้อมูลและสร้างฉลาก ข้อมูลที่ติดป้ายกำกับมักจะใช้ทรัพยากรในการประมวลผลมากกว่า ดังนั้นระบบที่ได้รับการดูแลจึงไม่สามารถประมวลผลข้อมูลได้มากเท่าที่ระดับบนสุดของสเกล
ระบบการเรียนรู้แบบไม่มีผู้ดูแลสามารถเริ่มมีประสิทธิภาพด้วยชุดข้อมูลขนาดเล็ก และสามารถประมวลผลข้อมูลจำนวนมากขึ้นด้วยทรัพยากรเดียวกัน ข้อมูลของพวกเขาได้รับและประมวลผลได้ง่ายกว่า เนื่องจากไม่ได้ขึ้นอยู่กับแรงงานมนุษย์จำนวนมากและไม่เฉพาะเจาะจง ข้อเสียเปรียบก็คือ ระบบมักจะไม่บรรลุระดับความแม่นยำในงานทำนายที่สูงนัก และมักขึ้นอยู่กับงานเฉพาะทางจึงจะมีประสิทธิภาพ แทนที่จะใช้ในกรณีที่ความถูกต้องเป็นสิ่งสำคัญ มักใช้เพื่ออนุมานและอัปเดตรูปแบบข้อมูล ในขนาด และเมื่อข้อมูลเปลี่ยนแปลงบ่อยกว่า
ความแตกต่างเมื่อใช้งาน
แอปพลิเคชันการเรียนรู้ภายใต้การดูแลมักจะมีกลไกในตัวเพื่อรับข้อมูลที่ติดป้ายกำกับมากขึ้นในวงกว้าง ตัวอย่างเช่น ผู้ใช้อีเมลสามารถทำเครื่องหมายว่าข้อความขาเข้าเป็นสแปมได้ง่ายหรือไม่ ผู้ให้บริการอีเมลสามารถรวบรวมข้อความที่ทำเครื่องหมายไว้ในชุดการฝึกอบรม จากนั้นฝึกอบรมระบบการถดถอยโลจิสติกเพื่อการตรวจจับสแปม พวกเขาแลกกับการฝึกอบรมที่ใช้เวลานานและต้องใช้ทรัพยากรมากขึ้น เพื่อการตัดสินใจที่รวดเร็วยิ่งขึ้นเมื่อนำไปใช้งาน นอกจากระบบการถดถอยโลจิสติกแล้ว อัลกอริธึมการฝึกอบรมภายใต้การดูแลทั่วไปอื่นๆ ยังรวมถึงแผนผังการตัดสินใจและโครงข่ายประสาทเทียม ซึ่งใช้อย่างแพร่หลายเพื่อทำนายและตัดสินใจ และสำหรับการจดจำรูปแบบที่ซับซ้อน
ระบบที่ไม่ได้รับการดูแลจะแยกแยะความแตกต่างออกไปเมื่อนำไปใช้กับปัญหาที่เกี่ยวข้องกับข้อมูลที่ไม่มีโครงสร้างจำนวนมาก พวกเขาสามารถตรวจจับรูปแบบในข้อมูลได้แม้ว่าจะเป็นเพียงชั่วคราว และจะต้องตรวจพบก่อนที่การฝึกอบรมสำหรับการเรียนรู้แบบมีผู้สอนจะเสร็จสมบูรณ์ ตัวอย่างเช่น อัลกอริธึมการจัดกลุ่ม ซึ่งเป็นระบบการเรียนรู้แบบไม่มีผู้ดูแล สามารถตรวจจับและอัปเดตกลุ่มผู้บริโภคเมื่อแนวโน้มเปลี่ยนไป หากแนวโน้มเปลี่ยนไปสู่รูปแบบใหม่ที่มองไม่เห็น แนวโน้มเหล่านั้นจะยังคงเกี่ยวข้องโดยไม่ต้องหยุดทำงานเพื่อการฝึกอบรมใหม่

ตัวอย่างของการเรียนรู้แบบไม่มีผู้ดูแลคือการใช้การวิเคราะห์องค์ประกอบหลัก (PCA) ในด้านการเงิน PCA เป็นอัลกอริทึมที่สามารถนำไปใช้กับกลุ่มการลงทุนในวงกว้าง และช่วยอนุมานและอัปเดตคุณสมบัติที่เกิดขึ้นของกลุ่ม ซึ่งรวมถึงตัวชี้วัดทางการเงินที่สำคัญ เช่น แหล่งที่มาที่สำคัญที่สุดของความเสี่ยงในการลงทุน และปัจจัยที่อาจส่งผลกระทบต่อผลตอบแทน ระบบการเรียนรู้แบบไม่มีผู้ดูแลประเภททั่วไปอื่นๆ คือตัวเข้ารหัสอัตโนมัติ ซึ่งบีบอัดและลดความซับซ้อนของข้อมูล ซึ่งมักจะเป็นขั้นตอนการเตรียมการก่อนที่จะใช้อัลกอริธึม ML อื่นๆ
ประโยชน์ของการเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้สอน
ทั้งระบบที่ได้รับการดูแลและไม่ได้รับการดูแลมีประโยชน์สำหรับการประมวลผลข้อมูลในระดับและความเร็วที่เหนือกว่ามนุษย์ที่ไม่ได้รับความช่วยเหลือ อย่างไรก็ตาม พวกมันเหมาะที่สุดสำหรับการใช้งานที่แตกต่างกัน ด้านล่างนี้เราเปรียบเทียบประโยชน์หลักบางประการของพวกเขา
ระบบการดูแล
- Excel เมื่อมีข้อมูลประวัติที่สำคัญ
- ดีกว่าระบบที่ไม่ได้รับการดูแลอย่างมากสำหรับข้อมูลการฝึกอบรมที่มีโครงสร้าง คุณลักษณะ และรูปแบบที่ทราบ
- เหมาะอย่างยิ่งสำหรับการตรวจจับและการประยุกต์ใช้คุณลักษณะที่ทราบของข้อมูลในวงกว้าง
- สามารถสร้างผลลัพธ์ที่เข้าใจและสมเหตุสมผลสำหรับมนุษย์
- สามารถมีความแม่นยำสูงกว่ากับข้อมูลใหม่และข้อมูลที่มองไม่เห็น
- สามารถคาดการณ์ได้รวดเร็วกว่าและในระดับที่สูงกว่าระบบที่ไม่ได้รับการดูแล
ระบบที่ไม่ได้รับการดูแล
- เก่งเป็นพิเศษในการระบุโครงสร้างและความสัมพันธ์ในข้อมูลที่ไม่เคยพบหรือไม่รู้จักมาก่อน
- ทำงานได้ดีเมื่อข้อมูลมีโครงสร้างน้อยและคุณสมบัติของข้อมูลไม่ค่อยเป็นที่รู้จัก
- ทำงานในบางสภาวะที่ระบบภายใต้การดูแลทำงานได้ไม่ดี (เช่น ในสถานการณ์ที่ไม่มีข้อมูลหรือที่ซึ่งข้อมูลมีอยู่แต่ไม่ได้รับการประมวลผลโดยมนุษย์)
- ต้องการทรัพยากรน้อยลงและใช้เวลาในระหว่างการฝึกอบรมน้อยกว่าระบบที่ได้รับการดูแลเพื่อให้ได้ข้อมูลในปริมาณที่เท่ากัน
- สามารถฝึกอบรมและใช้งานได้เมื่อมีข้อมูลมากเกินไปที่จะประมวลผลได้ดีกับระบบที่ได้รับการดูแล
ความท้าทายของการเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้สอน
ระบบที่มีการดูแลและไม่ได้รับการดูแลต่างก็มีการแลกเปลี่ยนที่แตกต่างกัน และความท้าทายที่พวกเขาเผชิญบางครั้งก็แตกต่างกันมาก เราเน้นความแตกต่างหลักบางประการด้านล่าง
ระบบการดูแล
- ต้องการการเข้าถึงข้อมูลที่ประมวลผลโดยมนุษย์จำนวนมาก ซึ่งบางครั้งอาจเข้าถึงได้หรือได้มาง่ายเท่านั้น
- มักจะมีขั้นตอนการฝึกอบรมที่นานขึ้นและต้องใช้ทรัพยากรมากขึ้น
- อาจประสบปัญหาในการปรับตัวอย่างรวดเร็วหากลักษณะข้อมูลหลักเปลี่ยนแปลง
- เผชิญกับความท้าทายเมื่อประมวลผลข้อมูลที่ไม่มีโครงสร้างโดยธรรมชาติ เช่น วิดีโอหรือเสียง
ระบบที่ไม่ได้รับการดูแล
- จะตรวจพบรูปแบบที่ไม่สรุปได้ดีกับตัวอย่างข้อมูลใหม่บ่อยขึ้น
- อาจเป็นเรื่องยากที่จะทำให้แม่นยำเท่ากับระบบที่มีการดูแล
- พวกมันให้ผลลัพธ์ที่ยากสำหรับมนุษย์ในการตีความ และการตีความผลลัพธ์เหล่านี้อาจเป็นเรื่องส่วนตัวมากกว่า
- อาจใช้เวลาและทรัพยากรมากขึ้นต่อการคาดการณ์ที่เกิดขึ้นในโลกแห่งความเป็นจริง
การประยุกต์การเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้สอน
แอปพลิเคชันและปัญหาบางอย่างได้รับการแก้ไขได้ดีที่สุดด้วยระบบการเรียนรู้แบบมีผู้ดูแล บางส่วนจะดีที่สุดเมื่อใช้ระบบที่ไม่มีผู้ดูแล และบางส่วนจะดีที่สุดโดยใช้การผสมผสาน นี่คือสามตัวอย่างที่รู้จักกันดี
ระบบการเรียนรู้แบบผสมผสานและการเรียนรู้แบบกึ่งกำกับดูแล
สิ่งสำคัญที่ควรทราบคือแอปพลิเคชันในชีวิตจริงส่วนใหญ่ใช้โมเดลที่มีการควบคุมดูแลและไม่ได้รับการควบคุมผสมกัน ระบบการเรียนรู้มักจะถูกรวมเข้าด้วยกันโดยอิงตามสิ่งต่างๆ เช่น งบประมาณ ความพร้อมใช้งานของข้อมูล ข้อกำหนดด้านประสิทธิภาพ และความซับซ้อนทางวิศวกรรม ในบางครั้ง ชุดย่อยเฉพาะของอัลกอริธึมการเรียนรู้ที่พยายามผสมผสานประโยชน์ของทั้งสองวิธี - การเรียนรู้แบบกึ่งมีผู้สอน - อาจถูกนำมาใช้ด้วย ในตัวอย่างด้านล่าง เราเรียกระบบที่มีแนวโน้มมากที่สุดหรือระบบหลักที่มีแนวโน้มว่าจะใช้
การทำนายการจราจร (ภายใต้การดูแล)
การทำนายสภาพการจราจรเป็นงานที่ท้าทาย โชคดีที่มีข้อมูลที่มีป้ายกำกับอยู่จำนวนมาก เนื่องจากเมืองต่างๆ มีการตรวจสอบและบันทึกปริมาณการจราจรบนถนนเป็นประจำ อัลกอริธึมการถดถอยซึ่งเป็นการเรียนรู้ภายใต้การดูแลประเภทหนึ่งนั้นง่ายต่อการนำไปใช้กับข้อมูลนี้ และสามารถสร้างการคาดการณ์กระแสการรับส่งข้อมูลได้ค่อนข้างแม่นยำ การคาดการณ์สามารถช่วยประกอบการตัดสินใจเกี่ยวกับการสร้างถนน ป้ายจราจร และการวางสัญญาณไฟจราจร อัลกอริธึมที่ไม่ได้รับการดูแลจะมีประสิทธิภาพน้อยลงในระยะนี้ อย่างไรก็ตาม สามารถเรียกใช้ข้อมูลการจราจรตามที่สะสมหลังจากมีการนำการเปลี่ยนแปลงโครงสร้างถนนไปใช้ เมื่อถึงจุดนั้น สิ่งเหล่านี้จะช่วยระบุและอนุมานโดยอัตโนมัติว่าอาจเกิดปัญหาใหม่และที่ไม่เคยเห็นมาก่อนเกิดขึ้นหรือไม่
การจัดกลุ่มทางพันธุกรรม (ไม่ได้รับการดูแล)
การวิเคราะห์ข้อมูลทางพันธุกรรมอาจทำได้ช้าและยุ่งยากเนื่องจากข้อมูลมีปริมาณมากและข้อมูลส่วนใหญ่ไม่ได้รับการวิเคราะห์อย่างดี เรามักไม่รู้มากนักว่าข้อมูลทางพันธุกรรมประกอบด้วยอะไรบ้าง เช่น ตำแหน่งที่ยีนและส่วนประกอบทางพันธุกรรมอื่นๆ อาจถูกจัดเก็บไว้ในจีโนม วิธีถอดรหัสและตีความข้อมูลเหล่านี้ เป็นต้น อัลกอริธึมที่ไม่ได้รับการดูแลมีความเกี่ยวข้องอย่างยิ่งกับปัญหานี้เนื่องจากสามารถประมวลผลข้อมูลจำนวนมากได้ ของข้อมูลและอนุมานรูปแบบที่มีอยู่โดยอัตโนมัติ นอกจากนี้ยังสามารถช่วยรวบรวมข้อมูลทางพันธุกรรมที่มีลักษณะคล้ายกันออกเป็นกลุ่มที่แยกจากกัน เมื่อข้อมูลทางพันธุกรรมถูกจัดกลุ่มตามความคล้ายคลึงกัน กลุ่มต่างๆ ก็สามารถประมวลผลและทดสอบได้อย่างง่ายดายเพื่อระบุหน้าที่ทางชีววิทยา (ถ้ามี) ของข้อมูลเหล่านั้น
LLM และการเรียนรู้แบบเสริมกำลัง (ผสม)
โมเดลภาษาขนาดใหญ่ (LLM) เป็นตัวอย่างของแอปพลิเคชันที่รวมระบบการเรียนรู้แบบไม่มีผู้ดูแลและแบบมีผู้ดูแลเข้าด้วยกัน ระบบเริ่มต้น LLM มักจะเป็นตัวอย่างของระบบที่ไม่ได้รับการดูแล ในการผลิต LLM ข้อมูลขนาดใหญ่จะถูกวิเคราะห์ (เช่น ข้อความภาษาอังกฤษทั้งหมดที่มีบนอินเทอร์เน็ต) โดยระบบที่ไม่ได้รับการดูแล ระบบอนุมานรูปแบบต่างๆ จากข้อมูลและพัฒนากฎพื้นฐานสำหรับการสนทนาภาษาอังกฤษ
อย่างไรก็ตาม การอนุมานที่ LLM ทำขึ้นไม่ได้ช่วยให้การสนทนาดูเหมือนเป็นมนุษย์ทั่วไป พวกเขายังไม่ช่วยคำนึงถึงการตั้งค่าส่วนบุคคลในการสื่อสาร ระบบที่ได้รับการดูแล โดยเฉพาะระบบการเสริมกำลังที่ใช้ผลตอบรับที่มีคำอธิบายประกอบจากผู้ใช้ (เรียกว่าการเรียนรู้การเสริมกำลังจากผลตอบรับของมนุษย์ หรือเรียกสั้นๆ ว่า RLHF) เป็นวิธีหนึ่งในการแก้ปัญหานี้ RLHF สามารถนำไปใช้กับ LLM ที่ผ่านการฝึกอบรมมาแล้ว เพื่อช่วยให้สามารถพูดคุยกับมนุษย์โดยทั่วไปได้ดี นอกจากนี้ยังสามารถเรียนรู้ความชอบส่วนบุคคลและพูดในแบบที่บุคคลใดบุคคลหนึ่งชอบได้
บทสรุป
โดยสรุป การเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้ดูแลถือเป็นส่วนย่อยพื้นฐานของ ML สองส่วน โดยแต่ละส่วนมีจุดแข็งที่เป็นเอกลักษณ์ การเรียนรู้แบบมีผู้สอนเป็นเลิศในสถานการณ์ที่มีข้อมูลติดป้ายกำกับมากมาย มีทรัพยากรเพียงพอสำหรับการฝึกอบรมล่วงหน้า และความจำเป็นในการตัดสินใจที่รวดเร็วและปรับขนาดได้ ในทางกลับกัน การเรียนรู้แบบไม่มีผู้ดูแลจะส่องสว่างเมื่อเปิดเผยโครงสร้างและความสัมพันธ์ที่ซ่อนอยู่ในข้อมูล โดยเฉพาะอย่างยิ่งเมื่อข้อมูลที่ติดป้ายกำกับหรือทรัพยากรการฝึกอบรมมีจำกัด และการตัดสินใจสามารถรองรับเวลาและความซับซ้อนได้มากขึ้น ด้วยการทำความเข้าใจข้อดี ความท้าทาย และกรณีการใช้งานของทั้งสองแนวทาง คุณจะสามารถตัดสินใจโดยมีข้อมูลรอบด้านว่าจะใช้วิธีเหล่านั้นอย่างมีประสิทธิภาพเมื่อใดและอย่างไร