การเรียนรู้ด้วยตนเอง: คืออะไรและทำงานอย่างไร

เผยแพร่แล้ว: 2024-07-18

การเรียนรู้แบบมีผู้ดูแลด้วยตนเอง ซึ่งเป็นเทคนิคล้ำสมัยในด้านปัญญาประดิษฐ์ ช่วยให้เครื่องจักรค้นพบรูปแบบและโครงสร้างภายในภายในข้อมูล โดยเลียนแบบความสามารถของมนุษย์ในการเรียนรู้จากบริบทและประสบการณ์ แทนที่จะเป็นคำสั่งที่ชัดเจน

สารบัญ

  • การเรียนรู้ด้วยตนเองคืออะไร?
  • การควบคุมตนเองเมื่อเทียบกับการเรียนรู้ของเครื่องประเภทอื่นๆ
  • การเรียนรู้แบบมีการดูแลตนเองทำงานอย่างไร
  • ประเภทของการเรียนรู้ด้วยตนเอง
  • การประยุกต์การเรียนรู้ด้วยตนเอง
  • ข้อดีของการเรียนรู้ด้วยตนเอง
  • ข้อเสียของการเรียนรู้ด้วยตนเอง

การเรียนรู้ด้วยตนเองคืออะไร?

การเรียนรู้แบบมีผู้ดูแลด้วยตนเองคือการเรียนรู้ของเครื่อง (ML) ประเภทหนึ่งที่ฝึกฝนโมเดลเพื่อสร้างป้ายกำกับของตนเอง ซึ่งก็คือการจับคู่อินพุตและเอาต์พุตอย่างชัดเจน โดยใช้ข้อมูลดิบและไม่มีป้ายกำกับ ต่างจากการเรียนรู้แบบมีผู้สอนซึ่งต้องใช้ข้อมูลที่มีป้ายกำกับจำนวนมาก การเรียนรู้แบบมีผู้สอนด้วยตนเองจะสร้างฉลากหลอก (ฉลากปลอม) จากข้อมูลนั้นเอง เทคนิคนี้ช่วยให้โมเดลวางแนวเป้าหมายและวัดผลได้ของแนวทางการเรียนรู้แบบมีผู้สอน บวกกับความสามารถของการเรียนรู้แบบไม่มีผู้ดูแลในการสรุปที่เป็นประโยชน์จากข้อมูลจำนวนมหาศาลที่ไม่มีป้ายกำกับ

การเรียนรู้ของเครื่องเป็นส่วนย่อยของปัญญาประดิษฐ์ (AI) ที่ใช้ข้อมูลและวิธีการทางสถิติเพื่อสร้างแบบจำลองที่เลียนแบบการใช้เหตุผลของมนุษย์แทนที่จะอาศัยคำสั่งแบบฮาร์ดโค้ด การเรียนรู้แบบมีผู้ดูแลด้วยตนเองใช้ประโยชน์จากข้อมูลที่ไม่มีป้ายกำกับจำนวนมหาศาลที่มีอยู่ ทำให้เป็นวิธีที่มีประสิทธิภาพในการปรับปรุงประสิทธิภาพของโมเดลโดยมีการแทรกแซงด้วยตนเองน้อยที่สุด ในความเป็นจริง โมเดลข้อความและรูปภาพ AI ทั่วไปในปัจจุบันส่วนใหญ่ได้รับการฝึกฝนโดยใช้การเรียนรู้แบบมีผู้ดูแลด้วยตนเอง

ทำงานอย่างชาญฉลาดยิ่งขึ้นด้วย Grammarly
คู่หูการเขียน AI สำหรับใครก็ตามที่มีงานทำ

การควบคุมตนเองเมื่อเทียบกับการเรียนรู้ของเครื่องประเภทอื่นๆ

การเรียนรู้แบบมีผู้สอนด้วยตนเองผสมผสานองค์ประกอบของการเรียนรู้ทั้งแบบมีผู้สอนและแบบไม่มีผู้สอน แต่แตกต่างจากการเรียนรู้แบบกึ่งมีผู้สอน:

  • การเรียนรู้แบบมีผู้สอน: ใช้ข้อมูลที่ติดป้ายกำกับเพื่อฝึกโมเดลสำหรับงานเฉพาะ เช่น การจำแนกประเภทและการถดถอย ป้ายกำกับให้คำแนะนำที่ชัดเจน ช่วยให้โมเดลคาดการณ์ได้อย่างแม่นยำ การใช้งานทั่วไป ได้แก่ การตรวจจับสแปม การจัดหมวดหมู่รูปภาพ และการพยากรณ์อากาศ
  • การเรียนรู้แบบไม่มีผู้ดูแล: ทำงานร่วมกับข้อมูลที่ไม่มีป้ายกำกับเพื่อค้นหารูปแบบและการจัดกลุ่ม โดยระบุคลัสเตอร์และการเชื่อมโยงและลดความซับซ้อนของข้อมูลเพื่อการประมวลผลที่ง่ายขึ้น ตัวอย่าง ได้แก่ การแบ่งส่วนลูกค้า ระบบการแนะนำ และการตรวจจับความผิดปกติ
  • การเรียนรู้แบบกึ่งมีผู้ดูแล:ใช้ข้อมูลที่มีป้ายกำกับจำนวนเล็กน้อยเพื่อให้คำแนะนำเบื้องต้น จากนั้นใช้ประโยชน์จากคอลเล็กชันข้อมูลที่ไม่มีป้ายกำกับที่มีขนาดใหญ่กว่าหนึ่งชุดขึ้นไปเพื่อปรับแต่งและปรับปรุงโมเดล แนวทางนี้มีประโยชน์อย่างยิ่งเมื่อคุณมีข้อมูลที่ติดป้ายกำกับ แต่จะยากเกินไปหรือมีราคาแพงเกินไปที่จะสร้างให้เพียงพอสำหรับการเรียนรู้แบบมีผู้ดูแลเต็มรูปแบบ
  • การเรียนรู้แบบมีผู้ดูแลด้วยตนเอง:ใช้ข้อมูลดิบเพื่อสร้างป้ายกำกับของตัวเอง ทำให้โมเดลสามารถเรียนรู้จากข้อมูลโดยไม่ต้องมีข้อมูลที่มีป้ายกำกับเริ่มต้น วิธีการนี้มีประโยชน์อย่างยิ่งเมื่อไม่มีข้อมูลที่มีป้ายกำกับเลยหรือเป็นเพียงส่วนเล็กๆ ของข้อมูลที่มีอยู่ เช่น ด้วยการประมวลผลภาษาธรรมชาติ (NLP) หรือการจดจำรูปภาพ

การเรียนรู้แบบมีการดูแลตนเองทำงานอย่างไร

การกำกับดูแลตนเองหมายความว่าข้อมูลนั้นให้คำตอบที่ถูกต้อง กระบวนการเรียนรู้แบบมีผู้สอนด้วยตนเองเกี่ยวข้องกับหลายขั้นตอน ซึ่งรวมแง่มุมต่างๆ ของวิธีการทั้งแบบมีผู้สอนและแบบไม่มีผู้ดูแล:

การรวบรวมข้อมูล:รวบรวมข้อมูลดิบที่ไม่มีป้ายกำกับจำนวนมาก ข้อมูลนี้เป็นพื้นฐานสำหรับการสร้างป้ายกำกับเทียมและการฝึกโมเดล ชุดข้อมูลจำนวนมากมีให้ใช้อย่างอิสระ

  1. การประมวลผลล่วงหน้า:เตรียมข้อมูลเพื่อให้มั่นใจในคุณภาพ ขั้นตอนนี้รวมถึงการลบรายการที่ซ้ำกัน การจัดการค่าที่หายไป และการปรับช่วงข้อมูลให้เป็นมาตรฐาน
  2. การสร้างงาน:สร้างปริศนาสำหรับโมเดลเพื่อแก้ หรือที่เรียกว่างานข้ออ้าง สิ่งเหล่านี้สร้างขึ้นโดยการลบหรือสับเปลี่ยนข้อมูลบางส่วน เช่น การลบคำ การลบพิกเซลของภาพ หรือการสับเปลี่ยนเฟรมวิดีโอ สิ่งใดก็ตามที่มีอยู่ก่อนการคอร์รัปชั่นโดยเจตนานี้เรียกว่า pseudo-label: "คำตอบที่ถูกต้อง" ที่สร้างขึ้นจากข้อมูลเองมากกว่าจากการติดฉลากโดยมนุษย์
  3. การฝึกอบรม:ฝึกอบรมโมเดลในงานข้ออ้างโดยใช้ป้ายกำกับที่สร้างขึ้น ซึ่งหมายความว่าโมเดลพยายามสร้างคำตอบที่ถูกต้อง เปรียบเทียบคำตอบกับป้ายกำกับหลอก ปรับ และลองอีกครั้งเพื่อสร้างคำตอบที่ถูกต้อง ระยะนี้ช่วยให้แบบจำลองเข้าใจความสัมพันธ์ภายในข้อมูล และในที่สุดจะสร้างความเข้าใจที่ซับซ้อนเกี่ยวกับความสัมพันธ์ระหว่างอินพุตและเอาต์พุต
  4. การปรับแต่งอย่างละเอียด:สลับโมเดลเพื่อเรียนรู้จากชุดข้อมูลที่เล็กลงและมีป้ายกำกับ เพื่อปรับปรุงประสิทธิภาพในงานเฉพาะ ขั้นตอนนี้ทำให้แน่ใจได้ว่าแบบจำลองจะใช้ประโยชน์จากการนำเสนอที่เรียนรู้ในระหว่างขั้นตอนการฝึกอบรมเบื้องต้น การปรับแต่งแบบละเอียดไม่จำเป็นอย่างเคร่งครัด แต่โดยทั่วไปแล้วจะนำไปสู่ผลลัพธ์ที่ดีกว่า
  5. การประเมิน:ประเมินประสิทธิภาพของแบบจำลองจากข้อมูลที่ยังไม่เคยเห็น การใช้หน่วยวัดมาตรฐานที่เกี่ยวข้องกับงาน เช่น คะแนน F1 การประเมินนี้ช่วยให้แน่ใจว่าแบบจำลองสามารถสรุปข้อมูลใหม่ได้ดี
  6. การปรับใช้และการตรวจสอบ:ปรับใช้โมเดลที่ได้รับการฝึกอบรมในแอปพลิเคชันในโลกแห่งความเป็นจริง และตรวจสอบประสิทธิภาพอย่างต่อเนื่อง อัปเดตโมเดลด้วยข้อมูลใหม่ตามความจำเป็นเพื่อรักษาความถูกต้องและความเกี่ยวข้อง

ประเภทของการเรียนรู้ด้วยตนเอง

การเรียนรู้ด้วยตนเองมีหลายประเภท แต่ละประเภทมีเทคนิคและแนวทางที่หลากหลาย ที่นี่ เราจะสำรวจหลายประเภท โดยเน้นวิธีการฝึกอบรมที่เป็นเอกลักษณ์และยกตัวอย่างที่เป็นตัวแทนหนึ่งหรือสองตัวอย่างสำหรับแต่ละประเภท

สำหรับรูปภาพ

  • การเรียนรู้แบบคาดการณ์ด้วยตนเอง:การเรียนรู้แบบคาดการณ์ด้วยตนเองเกี่ยวข้องกับเทคนิคต่างๆ เช่น การเข้ารหัสอัตโนมัติ โดยที่แบบจำลองจะเรียนรู้ที่จะบีบอัดข้อมูลให้อยู่ในรูปแบบที่ง่ายกว่า จากนั้นจึงสร้างข้อมูลต้นฉบับขึ้นมาใหม่ ในการประมวลผลภาพ สิ่งนี้มักหมายถึงการเลือกสร้างความเสียหายให้กับส่วนของภาพ (เช่น โดยการมาสก์ส่วนต่างๆ) และการฝึกแบบจำลองเพื่อสร้างต้นฉบับขึ้นมาใหม่ ซึ่งจะช่วยให้โมเดลจดจำวัตถุในตำแหน่ง ขนาดต่างๆ ได้ดีขึ้น และแม้ว่าจะถูกซ่อนไว้บางส่วนก็ตาม
  • การเรียนรู้แบบตรงกันข้าม:ในการเรียนรู้แบบเปรียบเทียบ โมเดลจะเรียนรู้ที่จะแยกแยะระหว่างภาพที่เหมือนและต่างกันโดยการเปรียบเทียบเป็นคู่หรือเป็นกลุ่ม ตัวอย่างเช่น วิธี SimCLR ใช้การเพิ่มรูปภาพ (เช่น การครอบตัด การบิดเบือน และการพลิก) เพื่อสร้างคู่การฝึก คู่ค่าบวกเกิดจากการใช้การเปลี่ยนแปลงที่แตกต่างกันกับรูปภาพเดียวกัน ในขณะที่คู่ค่าลบมาจากรูปภาพต่างกัน จากนั้นแบบจำลองจะเรียนรู้ว่าคุณลักษณะใดบ้างที่เหมือนกันในคู่ที่คล้ายกันและแตกต่างกันในคู่ที่ไม่เหมือนกัน
  • วิธีการแบบคลัสเตอร์:วิธีการแบบคลัสเตอร์จะจัดกลุ่มจุดข้อมูลที่คล้ายกันเข้าด้วยกัน และใช้คลัสเตอร์เหล่านี้เป็นป้ายกำกับหลอกสำหรับการฝึกอบรม ตัวอย่างเช่น DeepCluster จัดกลุ่มอิมเมจตามคุณสมบัติที่คล้ายกัน และใช้คลัสเตอร์เหล่านี้เพื่อฝึกโมเดล กระบวนการนี้จะสลับกันระหว่างการจัดกลุ่มและการฝึกอบรมจนกว่าโมเดลจะทำงานได้ดี SwaAV (การสลับการกำหนดระหว่างมุมมอง) ปรับปรุงสิ่งนี้โดยใช้รูปภาพเดียวกันหลายเวอร์ชัน เพื่อช่วยให้โมเดลเรียนรู้คุณสมบัติที่สำคัญที่คงที่ เช่น ขอบ พื้นผิว และตำแหน่งของวัตถุ

สำหรับข้อความ

  • การเรียนรู้แบบคาดการณ์ด้วยตนเอง:นี่คือกลไกการฝึกอบรมหลักของโมเดลภาษาขนาดใหญ่ (LLM) ซึ่งเข้าใจข้อความเป็นชุดของโทเค็น โดยทั่วไปแล้วจะเป็นตัวแทนของคำเดียว แต่บางครั้งก็เป็นส่วนหนึ่งของคำหรือกลุ่มคำ
    • โมเดลภาษามาสก์ (MLM):ประโยคเหล่านี้แสดงโดยมีโทเค็นบางส่วนหายไปและมอบหมายให้ทำนายคำที่หายไป ด้วยการเรียนรู้วิธีกรอกข้อมูลในช่องว่างเหล่านี้ MLM จึงสามารถพัฒนาการนำเสนอโครงสร้างและบริบทของภาษาอย่างละเอียด และพวกเขาสามารถพิจารณาบริบทของข้อมูลที่ป้อนทั้งหมดเมื่อทำการคาดการณ์ ผลลัพธ์ที่เป็นประโยชน์ เช่น การวิเคราะห์ความรู้สึกหรือการรับรู้เอนทิตีที่มีชื่อ ได้รับการพัฒนาผ่านการปรับแต่งอย่างละเอียด ตัวอย่างที่สำคัญคือ BERT ซึ่ง Google ใช้เพื่อทำความเข้าใจจุดประสงค์ของข้อความค้นหา
    • โมเดลภาษาเชิงสาเหตุ (CLM):โมเดลกำเนิด เช่น ChatGPT, Claude และ Gemini เรียนรู้ที่จะสร้างข้อความที่พวกเขาได้เห็นขึ้นมาใหม่โดยการทำนายคำทีละคำ โดยอิงจากโทเค็นก่อนหน้า เมื่อผ่านการฝึกอบรมแล้ว พวกเขาจะถือว่าข้อความที่ป้อนเป็นบริบทสำหรับการคาดการณ์ และทำการคาดการณ์ต่อไปด้วยโทเค็นใหม่ทุกอันที่พวกเขาสร้างขึ้น การทำนายตามลำดับนี้เป็นสาเหตุว่าทำไมผลลัพธ์ของพวกเขาจึงดูเหมือนจะพิมพ์ออกมาเองแทนที่จะปรากฏขึ้นทั้งหมดในคราวเดียว
  • การเรียนรู้ที่ตรงกันข้าม:วิธีการนี้จะเปรียบเทียบคู่ของตัวอย่างข้อความ โดยเน้นความแตกต่างและความคล้ายคลึงระหว่างกัน SimCSE สร้างประโยคเดียวกันสองเวอร์ชันที่แตกต่างกันเล็กน้อยโดยใช้ dropout ซึ่งจะสุ่มละเว้นบางส่วนของการนำเสนอประโยคในเลเยอร์ที่ซ่อนอยู่ระหว่างการฝึก (ดูเพิ่มเติมเกี่ยวกับเลเยอร์ที่ซ่อนอยู่ในโพสต์ของเราเกี่ยวกับการเรียนรู้เชิงลึก) โมเดลเรียนรู้ที่จะจดจำเวอร์ชันเหล่านี้ว่าคล้ายกัน เทคนิคนี้ปรับปรุงความสามารถของโมเดลในการทำความเข้าใจและเปรียบเทียบประโยค ทำให้มีประโยชน์สำหรับแอปพลิเคชัน เช่น การค้นหาประโยคที่คล้ายกันหรือการดึงข้อมูลที่เกี่ยวข้องสำหรับคำค้นหา
  • การทำนายประโยคถัดไป (NSP):ตามชื่อที่แนะนำ NSP เกี่ยวข้องกับการคาดเดาว่าประโยคที่กำหนดเป็นประโยคที่ตามมาของประโยคอื่นในเอกสารหรือไม่ ช่วยให้แบบจำลองเข้าใจความสัมพันธ์ระหว่างประโยคและการไหลของข้อความเชิงตรรกะ โดยทั่วไปจะใช้ควบคู่ไปกับ MLM เพื่อเพิ่มความเข้าใจในเนื้อหาที่ใหญ่ขึ้น ตัวอย่างเช่น ใน BERT NSP แบบจำลองจะคาดการณ์ว่าสองประโยคจะปรากฏติดต่อกันในข้อความต้นฉบับหรือไม่

การประยุกต์การเรียนรู้ด้วยตนเอง

การเรียนรู้ด้วยตนเองมีการใช้งานที่หลากหลายในโดเมนต่างๆ:

  • การประมวลผลภาษาธรรมชาติ:โมเดลอย่าง BERT และ GPT-3 ใช้การเรียนรู้แบบมีผู้ดูแลเพื่อทำความเข้าใจและสร้างภาษามนุษย์ในแอปพลิเคชันต่างๆ เช่น แชทบอท การแปล และการสรุปข้อความ
  • คอมพิวเตอร์วิทัศน์:การเรียนรู้ด้วยตนเองช่วยปรับปรุงการวิเคราะห์ภาพและวิดีโอโดยการสร้างฉลากหลอกจากข้อมูลภาพดิบ การใช้งานต่างๆ ได้แก่ การตรวจจับวัตถุ (เช่น กล้องกริ่งประตู) การจดจำใบหน้า และการสร้างคลิปจากวิดีโอขนาดยาวโดยอัตโนมัติ
  • การรู้จำเสียง:โมเดลที่มีการดูแลตนเองจะปรับปรุงระบบการรู้จำเสียงโดยการเรียนรู้จากข้อมูลเสียงที่ไม่มีป้ายกำกับจำนวนมหาศาล วิธีการนี้ช่วยลดความจำเป็นในการถอดเสียงด้วยตนเอง และปรับปรุงความแม่นยำของสำเนียงและภาษาถิ่นต่างๆ
  • การดูแลสุขภาพ:การเรียนรู้แบบมีผู้ดูแลด้วยตนเองช่วยปรับปรุงการวิเคราะห์ภาพทางการแพทย์ การค้นพบยา และการติดตามผู้ป่วยโดยใช้ประโยชน์จากชุดข้อมูลขนาดใหญ่พร้อมตัวอย่างที่มีป้ายกำกับน้อยที่สุด เพิ่มความแม่นยำในการตรวจหาโรคและคำแนะนำในการรักษาโรค โดยไม่ต้องมีการติดฉลากโดยผู้เชี่ยวชาญที่มีราคาแพงและกว้างขวาง
  • วิทยาการหุ่นยนต์:หุ่นยนต์ใช้การเรียนรู้แบบมีการดูแลตนเองเพื่อทำความเข้าใจสภาพแวดล้อมและปรับปรุงกระบวนการตัดสินใจ การใช้งานต่างๆ ได้แก่ การนำทางอัตโนมัติ การจัดการวัตถุ และการโต้ตอบระหว่างมนุษย์กับหุ่นยนต์

ข้อดีของการเรียนรู้ด้วยตนเอง

  • คุ้มค่า:ลดความต้องการข้อมูลที่มีป้ายกำกับจำนวนมาก ลดต้นทุนคำอธิบายประกอบและแรงงานคน
  • ความสามารถในการปรับขนาด:สามารถรองรับชุดข้อมูลขนาดใหญ่ได้ ทำให้เหมาะสำหรับการใช้งานในโลกแห่งความเป็นจริง ซึ่งข้อมูลที่ติดป้ายกำกับนั้นมีจำกัด แต่มีข้อมูลที่ไม่มีป้ายกำกับอยู่มากมาย
  • ลักษณะทั่วไป:เมื่อได้รับการฝึกอบรมเกี่ยวกับข้อมูลดิบที่เพียงพอ โมเดลจะสามารถเรียนรู้ได้เพียงพอที่จะดำเนินงานใหม่ แม้ว่าจะไม่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลที่เกี่ยวข้องโดยตรงก็ตาม ตัวอย่างเช่น โมเดล NLP ที่อิงจากภาษาหนึ่งสามารถใช้เพื่อเสริมการเรียนรู้จากภาษาอื่นได้
  • ความยืดหยุ่น:สามารถปรับให้เข้ากับงานและโดเมนที่หลากหลาย โดยมีประเภทย่อยหลายประเภทให้เหมาะกับความต้องการเฉพาะ

ข้อเสียของการเรียนรู้ด้วยตนเอง

  • ความซับซ้อน:การสร้างงานข้ออ้างที่มีประสิทธิภาพและการสร้างฉลากหลอกจำเป็นต้องมีการออกแบบและการทดลองอย่างรอบคอบ
  • ความไวต่อสัญญาณรบกวน:ป้ายหลอกที่สร้างขึ้นจากข้อมูลดิบอาจไม่เกี่ยวข้องกับเป้าหมาย ซึ่งอาจส่งผลกระทบต่อประสิทธิภาพการทำงานโดยการให้อินพุตที่ไม่จำเป็นมากเกินไปในการประมวลผลแก่โมเดล
  • ทรัพยากรการคำนวณ:การฝึกอบรมแบบจำลองที่มีการควบคุมดูแลด้วยตนเอง โดยเฉพาะอย่างยิ่งกับชุดข้อมูลขนาดใหญ่ ต้องใช้พลังและเวลาในการคำนวณจำนวนมาก