การเรียนรู้แบบมีผู้สอน: คืออะไรและทำงานอย่างไร

เผยแพร่แล้ว: 2024-07-03

ตั้งแต่การจดจำรูปภาพไปจนถึงการกรองสแปม ค้นพบว่าการเรียนรู้ภายใต้การดูแลขับเคลื่อนแอปพลิเคชัน AI จำนวนมากที่เราพบทุกวันได้อย่างไรในคู่มือข้อมูลนี้

สารบัญ

  • การเรียนรู้แบบมีผู้สอนคืออะไร?
  • การเรียนรู้แบบมีผู้ดูแลและแบบไม่มีผู้ดูแล
  • การเรียนรู้แบบมีผู้สอนทำงานอย่างไร
  • ประเภทของการเรียนรู้แบบมีผู้สอน
  • การประยุกต์การเรียนรู้แบบมีผู้สอน
  • ข้อดีของการเรียนรู้แบบมีผู้สอน
  • ข้อเสียของการเรียนรู้แบบมีผู้สอน

การเรียนรู้แบบมีผู้สอนคืออะไร?

การเรียนรู้แบบมีผู้สอนคือการเรียนรู้ของเครื่อง (ML) ประเภทหนึ่งที่ฝึกโมเดลโดยใช้ข้อมูลที่มีป้ายกำกับพร้อมคำตอบที่ถูกต้อง คำว่าภายใต้การดูแลหมายความว่าฉลากเหล่านี้ให้คำแนะนำที่ชัดเจนเกี่ยวกับความสัมพันธ์ระหว่างอินพุตและเอาต์พุต กระบวนการนี้ช่วยให้แบบจำลองสามารถคาดการณ์ข้อมูลใหม่ที่มองไม่เห็นได้อย่างแม่นยำ

การเรียนรู้ของเครื่องเป็นส่วนย่อยของปัญญาประดิษฐ์ (AI) ที่ใช้ข้อมูลและวิธีการทางสถิติเพื่อสร้างแบบจำลองที่เลียนแบบการใช้เหตุผลของมนุษย์แทนที่จะอาศัยคำสั่งแบบฮาร์ดโค้ด การเรียนรู้แบบมีผู้สอนใช้แนวทางที่ขับเคลื่อนด้วยข้อมูลซึ่งมีคำแนะนำเพื่อระบุรูปแบบและความสัมพันธ์ในชุดข้อมูลที่มีป้ายกำกับ โดยคาดการณ์จากการประเมินเพื่อคาดการณ์ผลลัพธ์สำหรับข้อมูลใหม่ๆ ที่มองไม่เห็น เรียนรู้โดยการเปรียบเทียบการคาดการณ์กับป้ายกำกับที่รู้จัก และปรับแบบจำลองเพื่อลดข้อผิดพลาดให้เหลือน้อยที่สุด

ทำงานอย่างชาญฉลาดยิ่งขึ้นด้วย Grammarly
คู่หูการเขียน AI สำหรับใครก็ตามที่มีงานทำ

การเรียนรู้แบบมีผู้ดูแลและแบบไม่มีผู้ดูแล

ตรงกันข้ามกับการเรียนรู้แบบมีผู้สอนซึ่งใช้ข้อมูลที่มีป้ายกำกับ การเรียนรู้แบบไม่มีผู้สอนจะค้นหารูปแบบในข้อมูลที่ไม่มีป้ายกำกับ

หากไม่มี "การกำกับดูแล" ที่ได้รับจากคำตอบที่ถูกต้องอย่างชัดเจนในข้อมูลการฝึกอบรม การเรียนรู้แบบไม่มีผู้ดูแลจะถือว่าทุกสิ่งที่เห็นเป็นข้อมูลเพื่อวิเคราะห์รูปแบบและการจัดกลุ่ม สามประเภทหลักคือ:

  • การจัดกลุ่ม: เทคนิคนี้จะจัดกลุ่มจุดข้อมูลที่อยู่ติดกันมากที่สุดมีประโยชน์สำหรับการแบ่งส่วนลูกค้าหรือการเรียงลำดับเอกสาร
  • การเชื่อมโยง: การพิจารณาว่าสิ่งต่างๆ มีแนวโน้มที่จะเกิดขึ้นร่วมกันเมื่อใด โดยเฉพาะอย่างยิ่งในการค้นหารายการที่ซื้อบ่อยร่วมกันหรือแนะนำสิ่งที่จะสตรีมต่อไป
  • การลดขนาด: การลดขนาดชุดข้อมูลเพื่อให้ง่ายต่อการประมวลผลโดยยังคงรักษารายละเอียดทั้งหมดหรือส่วนใหญ่ไว้

ในทางกลับกัน การเรียนรู้แบบมีผู้สอนจะเหมาะสมเมื่อคุณต้องการให้แบบจำลองตัดสินใจ การใช้งานที่สำคัญได้แก่:

  • การตัดสินใจใช่หรือไม่ใช่: การทำเครื่องหมายข้อมูลเป็นคลาสเดียวหรือคลาสอื่นมักใช้สำหรับการกรอง เช่น การตรวจจับสแปมหรือการฉ้อโกง
  • การจัดหมวดหมู่: การค้นหาว่าบางสิ่งอยู่ในคลาสใด เช่น การระบุวัตถุภายในรูปภาพ หรือการจดจำคำพูด
  • การถดถอย: การทำนายค่าต่อเนื่องโดยอิงจากข้อมูลในอดีต เช่น การพยากรณ์ราคาบ้านหรือสภาพอากาศ

ML ประเภทอื่นๆ อยู่ระหว่างสองสิ่งนี้: แบบมีผู้ดูแล แบบเสริม และการเรียนรู้แบบมีผู้ดูแลด้วยตนเอง

การเรียนรู้แบบมีผู้สอนทำงานอย่างไร

การเรียนรู้แบบมีผู้สอนเกี่ยวข้องกับกระบวนการที่มีโครงสร้างในการเลือกและจัดรูปแบบข้อมูล การรันโมเดล และการทดสอบประสิทธิภาพของโมเดล

ต่อไปนี้เป็นภาพรวมโดยย่อของกระบวนการเรียนรู้แบบมีผู้สอน:

1 การติดฉลาก: ข้อมูลที่มีป้ายกำกับเป็นสิ่งจำเป็นสำหรับการเรียนรู้การเชื่อมโยงที่ถูกต้องระหว่างอินพุตและเอาต์พุตตัวอย่างเช่น หากคุณกำลังสร้างแบบจำลองเพื่อวิเคราะห์ความรู้สึกในการรีวิวผลิตภัณฑ์ ให้เริ่มโดยให้ผู้ประเมินที่เป็นมนุษย์อ่านบทวิจารณ์และทำเครื่องหมายว่าเป็นเชิงบวก ลบ หรือเป็นกลาง

2 การรวบรวมและทำความสะอาดข้อมูล: ตรวจสอบให้แน่ใจว่าข้อมูลการฝึกอบรมของคุณครอบคลุมและเป็นตัวแทนทำความสะอาดข้อมูลโดยลบข้อมูลที่ซ้ำกัน แก้ไขข้อผิดพลาด และจัดการค่าที่หายไปเพื่อเตรียมพร้อมสำหรับการวิเคราะห์

3 การเลือกและการดึงข้อมูลคุณลักษณะ: ระบุและเลือกคุณลักษณะที่มีอิทธิพลมากที่สุด ทำให้แบบจำลองมีประสิทธิภาพและประสิทธิผลมากขึ้นขั้นตอนนี้อาจเกี่ยวข้องกับการสร้างคุณลักษณะใหม่จากคุณลักษณะที่มีอยู่เพื่อให้จับรูปแบบที่สำคัญในข้อมูลได้ดียิ่งขึ้น เช่น การแปลงวันเกิดเป็นอายุ

4 การแยกข้อมูล: แบ่งชุดข้อมูลออกเป็นชุดการฝึกอบรมและการทดสอบใช้ชุดการฝึกเพื่อฝึกโมเดล และใช้ชุดการทดสอบเพื่อดูว่าสามารถสรุปข้อมูลใหม่ที่มองไม่เห็นได้ดีเพียงใด

5 การเลือกอัลกอริธึม: เลือกอัลกอริธึมการเรียนรู้แบบมีผู้สอนโดยพิจารณาจากลักษณะงานและข้อมูลคุณยังสามารถเรียกใช้และเปรียบเทียบอัลกอริธึมหลายตัวเพื่อค้นหาอัลกอริธึมที่ดีที่สุดได้

6 การฝึกโมเดล: ฝึกโมเดลโดยใช้ข้อมูลเพื่อปรับปรุงความแม่นยำในการคาดการณ์ในระหว่างระยะนี้ แบบจำลองจะเรียนรู้ความสัมพันธ์ระหว่างอินพุตและเอาต์พุตโดยการลดข้อผิดพลาดซ้ำ ๆ ระหว่างการคาดการณ์และป้ายกำกับจริงที่ให้ไว้ในข้อมูลการฝึก ขึ้นอยู่กับความซับซ้อนของอัลกอริทึมและขนาดของชุดข้อมูล การดำเนินการนี้อาจใช้เวลาไม่กี่วินาทีหรือหลายวัน

7 การประเมินแบบจำลอง: การประเมินประสิทธิภาพของแบบจำลองทำให้มั่นใจได้ว่าแบบจำลองจะสร้างการคาดการณ์ข้อมูลใหม่ที่เชื่อถือได้และแม่นยำนี่เป็นข้อแตกต่างที่สำคัญจากการเรียนรู้แบบไม่มีผู้ดูแล เนื่องจากคุณทราบผลลัพธ์ที่คาดหวัง คุณจึงสามารถประเมินได้ว่าแบบจำลองทำงานได้ดีเพียงใด

8 การปรับแต่งโมเดล: ปรับและฝึกพารามิเตอร์ของโมเดลใหม่เพื่อปรับแต่งประสิทธิภาพอย่างละเอียดกระบวนการทำซ้ำนี้เรียกว่าการปรับไฮเปอร์พารามิเตอร์ โดยมีจุดมุ่งหมายเพื่อเพิ่มประสิทธิภาพโมเดลและป้องกันปัญหา เช่น การปรับมากเกินไป ควรทำซ้ำขั้นตอนนี้หลังจากการปรับเปลี่ยนแต่ละครั้ง

9 การปรับใช้และการตรวจสอบ: ปรับใช้โมเดลที่ได้รับการฝึกอบรมเพื่อคาดการณ์ข้อมูลใหม่ในสภาพแวดล้อมจริงตัวอย่างเช่น ปรับใช้โมเดลการตรวจจับสแปมที่ได้รับการฝึกอบรมเพื่อกรองอีเมล ตรวจสอบประสิทธิภาพ และปรับเปลี่ยนตามความจำเป็น

10 การปรับแต่งอย่างละเอียดเมื่อเวลาผ่านไป: เมื่อคุณรวบรวมข้อมูลในโลกแห่งความเป็นจริงมากขึ้น ให้ฝึกฝนแบบจำลองต่อไปให้มีความแม่นยำและเกี่ยวข้องมากขึ้น

ประเภทของการเรียนรู้แบบมีผู้สอน

การเรียนรู้แบบมีผู้สอนมีสองประเภทหลัก: การจำแนกและการถดถอย แต่ละประเภทมีประเภทย่อยและกรณีการใช้งานเฉพาะของตัวเอง มาสำรวจรายละเอียดเพิ่มเติมกันดีกว่า:

การจัดหมวดหมู่

การจำแนกประเภทเกี่ยวข้องกับการคาดเดาว่าอินพุตอยู่ในหมวดหมู่หรือคลาสใด ประเภทย่อยและแนวคิดต่างๆ ถูกนำมาใช้เพื่อจัดการกับปัญหาการจำแนกประเภทที่แตกต่างกัน ต่อไปนี้เป็นประเภทยอดนิยมบางส่วน:

  • การจำแนกประเภทไบนารี: โมเดลทำนายหนึ่งในสองคลาสที่เป็นไปได้สิ่งนี้มีประโยชน์เมื่อผลลัพธ์เป็นแบบไบนารี่ ซึ่งหมายความว่ามีเพียงสองสถานะหรือหมวดหมู่ที่เป็นไปได้เท่านั้น วิธีการนี้ใช้ในการตัดสินใจที่ต้องการความแตกต่างที่ชัดเจน
  • การจำแนกประเภทหลายคลาส: เช่นเดียวกับไบนารี่ แต่มีมากกว่าสองตัวเลือกซึ่งมีคำตอบที่ถูกต้องเพียงคำตอบเดียว วิธีการนี้ใช้เมื่อมีหลายประเภทที่สามารถป้อนข้อมูลเข้าได้
  • การจำแนกประเภทหลายป้ายกำกับ: แต่ละอินพุตสามารถอยู่ในหลายคลาสพร้อมกันได้ ต่างจากการจัดประเภทไบนารีหรือหลายคลาส โดยที่แต่ละอินพุตถูกกำหนดให้กับคลาสเดียว การจัดหมวดหมู่แบบหลายป้ายกำกับทำให้สามารถกำหนดป้ายกำกับหลายรายการให้กับอินพุตเดียวได้ นี่เป็นการวิเคราะห์ที่ซับซ้อนมากขึ้น เนื่องจากแทนที่จะเลือกเพียงคลาสใดก็ตามที่อินพุตมีแนวโน้มว่าจะอยู่ในกลุ่มนั้นมากที่สุด คุณต้องตัดสินใจเกี่ยวกับเกณฑ์ความน่าจะเป็นที่จะรวมไว้
  • การถดถอยโลจิสติก: การประยุกต์ใช้การถดถอย (ดูด้านล่าง) กับการจำแนกประเภทไบนารี วิธีการนี้สามารถบอกคุณถึงความมั่นใจในการทำนายมากกว่าที่จะบอกอะไรง่ายๆ

มีหลายวิธีในการวัดคุณภาพของแบบจำลองการจำแนกประเภท ได้แก่:

  • ความแม่นยำ: มีการคาดการณ์ทั้งหมดกี่ข้อที่ถูก?
  • ความแม่นยำ: จำนวนบวกที่เป็นบวกจริงมีกี่รายการ?
  • ทบทวน: ผลบวกจริงจำนวนเท่าใดที่ทำเครื่องหมายว่าเป็นบวก
  • คะแนน F1: จากระดับ 0% ถึง 100% โมเดลมีความสมดุลของความแม่นยำและการเรียกคืนได้ดีเพียงใด

การถดถอย

การถดถอยเกี่ยวข้องกับการทำนายค่าที่ต่อเนื่องตามคุณลักษณะอินพุต โดยส่งออกตัวเลขที่สามารถเรียกว่าการทำนายได้ แบบจำลองการถดถอยประเภทต่างๆ ใช้เพื่อบันทึกความสัมพันธ์ระหว่างคุณลักษณะอินพุตเหล่านี้และเอาต์พุตแบบต่อเนื่อง ต่อไปนี้เป็นประเภทยอดนิยมบางส่วน:

  • การถดถอยเชิงเส้น: สร้างแบบจำลองความสัมพันธ์ระหว่างคุณลักษณะอินพุตและเอาต์พุตเป็นเส้นตรงโมเดลจะถือว่าความสัมพันธ์เชิงเส้นระหว่างตัวแปรตาม (เอาต์พุต) และตัวแปรอิสระ (อินพุต) เป้าหมายคือการค้นหาเส้นที่เหมาะสมที่สุดผ่านจุดข้อมูลที่จะลดความแตกต่างระหว่างค่าที่คาดการณ์ไว้และค่าจริงให้เหลือน้อยที่สุด
  • การถดถอยพหุนาม: ซับซ้อนกว่าการถดถอยเชิงเส้น เนื่องจากใช้พหุนาม เช่น กำลังสองและกำลังสามเพื่อจับความสัมพันธ์ที่ซับซ้อนมากขึ้นระหว่างตัวแปรอินพุตและเอาต์พุต โมเดลสามารถใส่ข้อมูลที่ไม่เป็นเชิงเส้นได้โดยใช้เงื่อนไขที่มีลำดับสูงกว่าเหล่านี้
  • การถดถอยแบบริดจ์และแบบบ่วงบาศ: แก้ไขปัญหาของการติดตั้งมากเกินไป ซึ่งเป็นแนวโน้มของแบบจำลองที่จะอ่านข้อมูลที่ได้รับการฝึกมากเกินไปโดยเสียค่าใช้จ่ายในการสรุป การถดถอยแบบสันจะช่วยลดความไวของแบบจำลองต่อรายละเอียดเล็กๆ ในขณะที่การถดถอยแบบบ่วงบาศจะขจัดคุณลักษณะที่สำคัญน้อยกว่าจากการพิจารณา

การวัดคุณภาพการถดถอยส่วนใหญ่เกี่ยวข้องกับการคาดการณ์ที่อยู่ห่างจากค่าจริงมากน้อยเพียงใด คำถามที่พวกเขาตอบคือ:

  • ค่าเฉลี่ยความคลาดเคลื่อนสัมบูรณ์: โดยเฉลี่ยแล้ว การคาดคะเนจากค่าจริงอยู่ไกลแค่ไหน
  • ข้อผิดพลาดกำลังสองเฉลี่ย: ข้อผิดพลาดจะเพิ่มขึ้นเท่าใดเมื่อข้อผิดพลาดที่ใหญ่กว่ามีความสำคัญมากกว่า
  • ข้อผิดพลาดรูตค่าเฉลี่ยกำลังสอง : ข้อผิดพลาดขนาดใหญ่ทำให้การคาดการณ์เบี่ยงเบนไปจากค่าจริงเท่าใด
  • R-squared: การถดถอยเหมาะสมกับข้อมูลเพียงใด

การประยุกต์การเรียนรู้แบบมีผู้สอน

การเรียนรู้แบบมีผู้สอนมีการใช้งานที่หลากหลายในอุตสาหกรรมต่างๆ นี่คือตัวอย่างทั่วไปบางส่วน:

  • การตรวจจับสแปม: บริการอีเมลใช้การจัดหมวดหมู่แบบไบนารีเพื่อตัดสินใจว่าอีเมลควรเข้าสู่กล่องจดหมายของคุณหรือถูกส่งไปยังสแปมพวกเขาปรับปรุงอย่างต่อเนื่องเพื่อตอบสนองต่อผู้ที่ทำเครื่องหมายอีเมลในโฟลเดอร์สแปมว่าไม่ใช่สแปม และในทางกลับกัน
  • การจดจำรูปภาพ: โมเดลได้รับการฝึกฝนเกี่ยวกับรูปภาพที่มีป้ายกำกับเพื่อจดจำและจัดหมวดหมู่วัตถุตัวอย่าง ได้แก่ คุณสมบัติ Face ID ของ Apple ซึ่งจะปลดล็อคแท็บเล็ตหรืออุปกรณ์มือถือของคุณ การรู้จำอักขระด้วยแสง (OCR) สำหรับการเปลี่ยนคำที่พิมพ์เป็นข้อความดิจิทัล และการตรวจจับวัตถุสำหรับรถยนต์ที่ขับเคลื่อนด้วยตนเอง
  • การวินิจฉัยทางการแพทย์: แบบจำลองภายใต้การดูแลสามารถทำนายโรคและแนะนำการวินิจฉัยที่เป็นไปได้โดยใช้ข้อมูลผู้ป่วยและบันทึกทางการแพทย์ตัวอย่างเช่น สามารถฝึกอบรมแบบจำลองเพื่อจดจำเนื้องอกมะเร็งในเครื่อง MRI หรือพัฒนาแผนการจัดการโรคเบาหวาน
  • การตรวจจับการฉ้อโกง: สถาบันการเงินใช้การเรียนรู้ภายใต้การดูแลเพื่อระบุธุรกรรมที่ฉ้อโกงโดยการวิเคราะห์รูปแบบในข้อมูลธุรกรรมที่มีป้ายกำกับ
  • การวิเคราะห์ความรู้สึก: ไม่ว่าจะวัดปฏิกิริยาหรืออารมณ์เชิงบวกหรือเชิงลบ เช่น ความสุขหรือความรังเกียจ ชุดข้อมูลที่ติดแท็กด้วยตนเองจะแจ้งแบบจำลองเพื่อตีความข้อมูลนำเข้า เช่น โพสต์บนโซเชียลมีเดีย บทวิจารณ์ผลิตภัณฑ์ หรือผลการสำรวจ
  • การบำรุงรักษาเชิงคาดการณ์: จากข้อมูลประสิทธิภาพในอดีตและปัจจัยด้านสิ่งแวดล้อม แบบจำลองสามารถคาดการณ์ได้ว่าเครื่องจักรมีแนวโน้มที่จะล้มเหลวเมื่อใด เพื่อให้สามารถซ่อมแซมหรือเปลี่ยนใหม่ก่อนที่จะดำเนินการ

ข้อดีของการเรียนรู้แบบมีผู้สอน

  • แม่นยำและคาดเดาได้สมมติว่าพวกเขาได้รับข้อมูลที่ดี โมเดลการเรียนรู้ภายใต้การดูแลมีแนวโน้มที่จะแม่นยำมากกว่าวิธีการเรียนรู้ของเครื่องอื่นๆ โดยทั่วไปแล้วโมเดลที่เรียบง่ายกว่าจะมีการกำหนดไว้ ซึ่งหมายความว่าอินพุตที่กำหนดจะสร้างเอาต์พุตเดียวกันเสมอ
  • วัตถุประสงค์ที่ชัดเจน ต้องขอบคุณการควบคุมดูแล คุณจึงรู้ว่าโมเดลของคุณพยายามทำอะไรให้สำเร็จ นี่เป็นความแตกต่างที่ชัดเจนกับการเรียนรู้แบบไม่มีผู้ดูแลและการเรียนรู้ด้วยตนเอง
  • ง่ายต่อการประเมิน มีมาตรการคุณภาพหลายประการสำหรับการตัดสินความถูกต้องของทั้งแบบจำลองการจำแนกประเภทและแบบจำลองการถดถอย
  • ตีความได้ โมเดลภายใต้การดูแลใช้เทคนิคต่างๆ เช่น การถดถอยและแผนผังการตัดสินใจ ซึ่งค่อนข้างตรงไปตรงมาเพื่อให้นักวิทยาศาสตร์ข้อมูลเข้าใจได้ การตีความได้ช่วยเพิ่มความมั่นใจของผู้มีอำนาจตัดสินใจ โดยเฉพาะอย่างยิ่งในสภาพแวดล้อมที่มีผลกระทบสูงและอุตสาหกรรมที่ได้รับการควบคุม

ข้อเสียของการเรียนรู้แบบมีผู้สอน

  • ต้องมีข้อมูลที่ติดป้ายกำกับข้อมูลของคุณต้องมีอินพุตและป้ายกำกับที่ชัดเจน นี่ถือเป็นความท้าทายสำหรับการฝึกอบรมการจัดหมวดหมู่ โดยมีคนหลายพันคน (หรือหลายล้านคน) ที่ได้รับการว่าจ้างให้ทำคำอธิบายประกอบข้อมูลด้วยตนเอง
  • ข้อผิดพลาดและการตัดสินที่ไม่สอดคล้องกันในข้อมูลการฝึกอบรม ด้วยการติดฉลากโดยมนุษย์ทำให้เกิดความเข้าใจผิดของมนุษย์ เช่น ข้อผิดพลาด การพิมพ์ผิด และความคิดเห็นที่แตกต่างกัน อย่างหลังถือเป็นแง่มุมที่ท้าทายอย่างยิ่งในการวิเคราะห์ความรู้สึก โดยทั่วไปแล้วข้อมูลการฝึกอบรมด้านความรู้สึกคุณภาพสูงต้องใช้คนหลายคนในการประเมินจุดข้อมูลที่กำหนด โดยจะบันทึกผลลัพธ์เฉพาะในกรณีที่มีข้อตกลงเท่านั้น
  • ฟิตเกิน. บ่อยครั้งที่แบบจำลองจะมาพร้อมกับการคำนวณที่ทำงานได้ดีกับข้อมูลการฝึกแต่ยังไม่ค่อยเห็นข้อมูลที่ยังไม่เคยเห็น ผู้ฝึกสอนที่ระมัดระวังจะมองหาอุปกรณ์ที่มากเกินไปและใช้เทคนิคเพื่อลดผลกระทบ
  • จำกัดเฉพาะรูปแบบที่ทราบ หากแบบจำลองการทำนายราคาหุ้นของคุณอิงตามข้อมูลจากตลาดกระทิงเท่านั้น มันจะไม่ถูกต้องนักเมื่อถึงตลาดหมี ดังนั้น ให้มีความละเอียดอ่อนต่อข้อจำกัดของข้อมูลที่คุณแสดงแบบจำลองของคุณ และพิจารณาว่าจะค้นหาข้อมูลการฝึกที่จะเปิดเผยต่อสถานการณ์อื่น ๆ หรือเพียงเพิกเฉยต่อผลลัพธ์ของมัน