التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف: الاختلافات والفوائد وحالات الاستخدام

نشرت: 2025-01-17

يعمل التعلم الآلي (ML) على تشغيل العديد من التقنيات التي نعتمد عليها يوميًا، مثل التعرف على الصور والمركبات ذاتية القيادة. هناك نهجان أساسيان - التعلم الخاضع للإشراف وغير الخاضع للإشراف - يشكلان العمود الفقري لهذه الأنظمة. في حين أن كلاهما أساسي لتدريب نماذج تعلم الآلة، إلا أنهما يختلفان في منهجيتهما وأهدافهما وتطبيقاتهما.

في هذا الدليل، سنقوم بمقارنة هذين النهجين، وتسليط الضوء على الاختلافات بينهما، واستكشاف فوائدهما والتحديات التي تواجههما. سنستكشف أيضًا التطبيقات العملية لمساعدتك في فهم ما هو الأنسب لمختلف المهام.

جدول المحتويات

  • ما هو التعلم الخاضع للإشراف؟
  • ما هو التعلم غير الخاضع للرقابة؟
  • خاضع للإشراف مقابل غير خاضع للإشراف: الاختلافات الرئيسية
  • فوائد التعلم الخاضع للإشراف وغير الخاضع للإشراف
  • تحديات التعلم الخاضع للإشراف وغير الخاضع للإشراف
  • تطبيقات التعلم الخاضع للإشراف وغير الخاضع للإشراف
  • خاتمة

ما هو التعلم الخاضع للإشراف؟

يقوم التعلم الخاضع للإشراف بتدريب أنظمة تعلم الآلة باستخدام البيانات المصنفة. في هذا السياق، تعني كلمة "مُصنف" أن كل مثال تدريبي مقترن بمخرجات معروفة. تساعد هذه التسميات، التي غالبًا ما ينشئها الخبراء، النظام على تعلم العلاقات بين المدخلات والمخرجات. بمجرد تدريبها، يمكن للأنظمة الخاضعة للإشراف تطبيق هذه العلاقات المكتسبة على البيانات الجديدة غير المرئية لإجراء تنبؤات أو تصنيفات.

على سبيل المثال، في سياق السيارات ذاتية القيادة، قد يقوم نظام التعلم الخاضع للإشراف بتحليل بيانات الفيديو المصنفة. تحدد هذه التعليقات التوضيحية لافتات الشوارع والمشاة والعقبات، مما يمكّن النظام من التعرف على الميزات المماثلة في سيناريوهات القيادة الواقعية والاستجابة لها.

تنقسم خوارزميات التعلم الخاضعة للإشراف إلى فئتين أساسيتين:

  • التصنيف: تقوم هذه الخوارزميات بتعيين تصنيفات للبيانات الجديدة، مثل تحديد رسائل البريد الإلكتروني كبريد عشوائي أو غير بريد عشوائي.
  • الانحدار: تتنبأ هذه الخوارزميات بالقيم المستمرة، مثل التنبؤ بالمبيعات المستقبلية بناءً على الأداء السابق.

مع نمو مجموعات البيانات وتحسن الموارد الحسابية، تصبح الأنظمة الخاضعة للإشراف أكثر دقة وفعالية، وتدعم التطبيقات مثل اكتشاف الاحتيال والتشخيص الطبي.

تعرف على المزيد حول التعلم الخاضع للإشراف →

ما هو التعلم غير الخاضع للرقابة؟

وعلى النقيض من ذلك، يقوم التعلم غير الخاضع للرقابة بتحليل البيانات دون أمثلة مصنفة، ويعتمد على الخوارزميات الإحصائية للكشف عن الأنماط أو العلاقات المخفية. وعلى عكس الأنظمة الخاضعة للإشراف، تستنتج هذه النماذج البنية وتحدث نتائجها ديناميكيًا عند توفر معلومات جديدة. في حين أن التعلم غير الخاضع للرقابة يتفوق في اكتشاف الأنماط، إلا أنه عادة ما يكون أقل فعالية في المهام التنبؤية.

والمثال العملي هو خدمات تجميع الأخبار. تقوم هذه الأنظمة بتجميع المقالات ذات الصلة ومنشورات وسائل التواصل الاجتماعي حول حدث إخباري عاجل دون تصنيف خارجي. ومن خلال تحديد القواسم المشتركة في الوقت الفعلي، يقومون بالتعلم غير الخاضع للرقابة لتسليط الضوء على القصص الرئيسية.

فيما يلي بعض خوارزميات التعلم المتخصصة غير الخاضعة للرقابة:

  • التجميع:يتم استخدامها لتقسيم المستهلكين إلى شرائح وضبط الشرائح مع تغير السلوكيات.
  • الارتباط:يكتشف الأنماط في البيانات، مثل تحديد الحالات الشاذة التي يمكن أن تشير إلى انتهاكات أمنية.
  • تقليل الأبعاد: تعمل هذه العناصر على تبسيط هياكل البيانات مع الحفاظ على المعلومات المهمة وغالبًا ما تستخدم في ضغط مجموعات البيانات المعقدة وتصورها.

يعد التعلم غير الخاضع للرقابة جزءًا لا يتجزأ من تحليل البيانات الاستكشافية وكشف الرؤى في السيناريوهات التي لا تتوفر فيها البيانات المصنفة.

تعرف على المزيد حول التعلم غير الخاضع للرقابة →

خاضع للإشراف مقابل غير خاضع للرقابة: الاختلافات الرئيسية

يخدم التعلم الخاضع للإشراف وغير الخاضع للإشراف أدوارًا متميزة في تعلم الآلة. تختلف هذه الأساليب في متطلبات البيانات والمشاركة البشرية والمهام والتطبيقات. ويسلط الجدول أدناه الضوء على هذه الاختلافات، والتي سنستكشفها بشكل أكبر.

التعلم تحت الإشراف التعلم غير الخاضع للرقابة
إدخال البيانات يتطلب البيانات المسمى يتطلب بيانات غير مسماة
موضوعي توقع تسميات الإخراج أو تصنيفها بناءً على ميزات الإدخال اكتشاف وتحديث الأنماط أو الهياكل أو التمثيلات المخفية في البيانات
المشاركة البشرية جهد يدوي كبير لتصنيف مجموعات البيانات الكبيرة وإرشادات الخبراء لاختيار الميزات الحد الأدنى من التدخل البشري ولكن متخصص للغاية. في المقام الأول لإعداد معلمات الخوارزمية، وتحسين استخدام الموارد على نطاق واسع، وأبحاث الخوارزمية.
المهام الأساسية الانحدار والتصنيف التجميع، الارتباط، تقليل الأبعاد
الخوارزميات المشتركة الانحدار الخطي واللوجستي، أشجار القرار، الشبكات العصبية K يعني التجميع، وتحليل المكونات الرئيسية (PCA)، وأجهزة التشفير التلقائي
الإخراج النماذج التنبؤية التي يمكنها تصنيف نقاط البيانات الجديدة أو التراجع عنها مجموعات أو تمثيلات البيانات (على سبيل المثال، المجموعات والمكونات)
التطبيقات اكتشاف البريد العشوائي، واكتشاف الاحتيال، وتصنيف الصور، والتنبؤ بالأسعار، وما إلى ذلك. تجزئة العملاء، وتحليل سلة السوق، والكشف عن الشذوذ، وما إلى ذلك.

الاختلافات خلال مرحلة التدريب

الفرق الأساسي بين نوعي الخوارزميات هو نوع مجموعات البيانات التي يعتمدون عليها. يستفيد التعلم الخاضع للإشراف من مجموعات كبيرة من البيانات المصنفة. وبالتالي، تعتمد الأنظمة الخاضعة للإشراف الأكثر تقدمًا على عمالة بشرية واسعة النطاق وغير متخصصة لغربلة البيانات وإنشاء التصنيفات. عادةً ما تتطلب معالجة البيانات المصنفة المزيد من الموارد، لذلك لا تستطيع الأنظمة الخاضعة للإشراف معالجة أكبر قدر ممكن من البيانات في الطرف العلوي من المقياس.

يمكن لأنظمة التعلم غير الخاضعة للرقابة أن تصبح فعالة مع مجموعات بيانات أصغر ويمكنها معالجة كميات أكبر بكثير من البيانات بنفس الموارد. ومن الأسهل الحصول على بياناتهم ومعالجتها لأنها لا تعتمد على العمالة البشرية غير المتخصصة على نطاق واسع. وكمقابلة، لا تحقق الأنظمة عادةً درجة عالية من الدقة في مهام التنبؤ، وغالبًا ما تعتمد على العمل المتخصص لتصبح فعالة. بدلاً من استخدامها عندما تكون الدقة أمرًا بالغ الأهمية، يتم استخدامها بشكل متكرر لاستنتاج وتحديث الأنماط في البيانات، وعلى نطاق واسع، ومع تغير البيانات.

الاختلافات عند النشر

عادةً ما تحتوي تطبيقات التعلم الخاضع للإشراف على آلية مدمجة للحصول على المزيد من البيانات المصنفة على نطاق واسع. على سبيل المثال، من السهل على مستخدمي البريد الإلكتروني تحديد ما إذا كانت الرسائل الواردة هي رسائل غير مرغوب فيها أم لا. يمكن لموفر البريد الإلكتروني تجميع الرسائل المميزة في مجموعة تدريب ثم تدريب أنظمة الانحدار اللوجستي لاكتشاف البريد العشوائي. إنهم يستبدلون التدريب الأطول والأكثر كثافة في استخدام الموارد من أجل اتخاذ قرارات أسرع عند نشرهم. إلى جانب أنظمة الانحدار اللوجستي، تتضمن خوارزميات التدريب الشائعة الأخرى أشجار القرار والشبكات العصبية، والتي تُستخدم في كل مكان للتنبؤ واتخاذ القرارات وللتعرف على الأنماط المعقدة.

تميز الأنظمة غير الخاضعة للرقابة نفسها عند تطبيقها على المشكلات التي تتضمن كميات كبيرة من البيانات غير المنظمة. يمكنهم اكتشاف الأنماط في البيانات، حتى عندما تكون عابرة، ويجب اكتشافها قبل اكتمال التدريب على التعلم الخاضع للإشراف. على سبيل المثال، يمكن لخوارزميات التجميع، وهي نوع من أنظمة التعلم غير الخاضعة للرقابة، اكتشاف شرائح المستهلكين وتحديثها مع تغير الاتجاهات. إذا تحولت الاتجاهات إلى أنماط جديدة وغير مرئية، فإنها تظل ذات صلة دون الحاجة إلى التوقف عن العمل لإعادة التدريب.

مثال على التعلم غير الخاضع للرقابة هو استخدام تحليل المكونات الرئيسية (PCA) في التمويل. PCA هي خوارزمية يمكن تطبيقها على مجموعات من الاستثمارات على نطاق واسع وتساعد في استنتاج وتحديث الخصائص الناشئة للمجموعة. وتشمل هذه المؤشرات المالية الهامة، مثل أهم مصادر مخاطر الاستثمار والعوامل التي من المحتمل أن تؤثر على العوائد. الأنواع الشائعة الأخرى من أنظمة التعلم غير الخاضعة للرقابة هي أجهزة التشفير التلقائي، التي تقوم بضغط البيانات وتبسيطها، غالبًا كخطوة تحضيرية قبل تطبيق خوارزميات تعلم الآلة الأخرى.

اعمل بشكل أكثر ذكاءً مع Grammarly
شريك الكتابة بالذكاء الاصطناعي لأي شخص لديه عمل للقيام به

فوائد التعلم الخاضع للإشراف وغير الخاضع للإشراف

تعد كل من الأنظمة الخاضعة للإشراف وغير الخاضعة للإشراف مفيدة لمعالجة البيانات على نطاق وسرعة تفوق تلك الخاصة بالبشر بدون مساعدة. ومع ذلك، فهي الأنسب لمختلف التطبيقات. أدناه، نقارن بعض فوائدها الرئيسية.

الأنظمة الخاضعة للرقابة

  • Excel عندما تكون هناك بيانات تاريخية مهمة متاحة
  • هي أفضل بكثير من الأنظمة غير الخاضعة للرقابة لتدريب البيانات ذات البنية والخصائص والأنماط المعروفة
  • مثالية لاكتشاف وتطبيق الخصائص المعروفة للبيانات على نطاق واسع
  • يمكن أن يؤدي إلى نتائج مفهومة وبديهية للبشر
  • يمكن أن يكون لها دقة أعلى في البيانات الجديدة وغير المرئية
  • يمكنه إجراء تنبؤات بسرعة أكبر وعلى نطاق أعلى من الأنظمة غير الخاضعة للرقابة

أنظمة غير خاضعة للرقابة

  • جيدون بشكل خاص في تحديد الهياكل والعلاقات غير المرئية أو غير المعروفة في البيانات
  • قم بعمل جيد عندما تكون البيانات أقل تنظيماً وتكون خصائصها أقل شهرة
  • العمل في بعض الظروف التي لا تعمل فيها الأنظمة الخاضعة للإشراف بشكل جيد (على سبيل المثال، في المواقف التي لا تتوفر فيها البيانات أو حيث تكون متاحة ولكن لم تتم معالجتها بواسطة البشر)
  • تتطلب موارد أقل ووقتًا أقل أثناء التدريب مقارنة بالأنظمة الخاضعة للإشراف لكميات مكافئة من البيانات
  • يمكن تدريبه واستخدامه عندما يكون هناك الكثير من البيانات التي لا يمكن معالجتها بشكل جيد باستخدام الأنظمة الخاضعة للإشراف

تحديات التعلم الخاضع للإشراف وغير الخاضع للإشراف

تقوم كل من الأنظمة الخاضعة للإشراف وغير الخاضعة للإشراف بمقايضات مختلفة، وتكون التحديات التي تواجهها مختلفة تمامًا في بعض الأحيان. نسلط الضوء على بعض الاختلافات الرئيسية أدناه.

الأنظمة الخاضعة للرقابة

  • تتطلب الوصول إلى كميات كبيرة من البيانات التي تتم معالجتها بواسطة الإنسان، والتي لا تكون متاحة أو يسهل الحصول عليها إلا في بعض الأحيان
  • غالبًا ما تكون هناك مراحل تدريب أطول وأكثر كثافة في استخدام الموارد
  • قد يواجه صعوبة في التكيف بسرعة إذا تغيرت خصائص البيانات الأساسية
  • واجه التحديات عند معالجة البيانات غير المنظمة بطبيعتها، مثل الفيديو أو الصوت

أنظمة غير خاضعة للرقابة

  • سيتم اكتشاف الأنماط التي لا يتم تعميمها بشكل جيد على أمثلة البيانات الجديدة بشكل متكرر
  • قد يكون من الصعب جعلها دقيقة مثل الأنظمة الخاضعة للإشراف
  • إنها تنتج نتائج يصعب على البشر تفسيرها، ويمكن أن تكون تفسيرات هذه النتائج أكثر ذاتية.
  • يمكن أن يستغرق المزيد من الوقت والموارد لكل تنبؤ يتم إجراؤه في العالم الحقيقي

تطبيقات التعلم الخاضع للإشراف وغير الخاضع للإشراف

من الأفضل معالجة بعض التطبيقات والمشكلات من خلال أنظمة التعلم الخاضعة للإشراف، وبعضها أفضل من خلال الأنظمة غير الخاضعة للإشراف، وبعضها الآخر يكون أفضل باستخدام مزيج. فيما يلي ثلاثة أمثلة معروفة.

أنظمة التعلم المختلط والتعلم شبه الخاضع للإشراف

من المهم ملاحظة أن معظم تطبيقات الحياة الواقعية تستخدم مزيجًا من النماذج الخاضعة للإشراف وغير الخاضعة للإشراف. غالبًا ما يتم دمج أنظمة التعلم بناءً على أشياء مثل الميزانية، وتوافر البيانات، ومتطلبات الأداء، والتعقيد الهندسي. في بعض الأحيان، يمكن أيضًا استخدام مجموعة فرعية متخصصة من خوارزميات التعلم التي تحاول مزج فوائد كلا النهجين - التعلم شبه الخاضع للإشراف. في الأمثلة أدناه، نذكر النظام الأكثر احتمالاً أو الأساسي الذي من المحتمل استخدامه.

التنبؤ بحركة المرور (خاضع للإشراف)

التنبؤ بحركة المرور مهمة صعبة. ولحسن الحظ، يتوفر الكثير من البيانات المصنفة نظرًا لأن المدن تقوم بانتظام بمراجعة وتسجيل حجم حركة المرور على الطرق. من السهل تطبيق خوارزميات الانحدار، وهي نوع من التعلم الخاضع للإشراف، على هذه البيانات ويمكن أن تنتج تنبؤات دقيقة تمامًا لتدفقات حركة المرور. يمكن أن تساعد تنبؤاتهم في اتخاذ القرارات المتعلقة ببناء الطرق وإشارات المرور ووضع إشارات المرور. تكون الخوارزميات غير الخاضعة للرقابة أقل فعالية في هذه المرحلة. ومع ذلك، يمكن تشغيلها بناءً على بيانات حركة المرور التي تتراكم بعد تنفيذ التغيير في بنية الطريق. وعند هذه النقطة، فإنها تساعد تلقائيًا في تحديد واستنتاج ما إذا كانت هناك أية مشكلات جديدة وغير مرئية سابقًا قد تحدث.

التجمع الجيني (غير خاضع للرقابة)

يمكن أن يكون تحليل البيانات الجينية بطيئًا ومرهقًا نظرًا لأن أحجام البيانات كبيرة ولم يتم تحليل معظم البيانات بشكل جيد. نحن في كثير من الأحيان لا نعرف الكثير عما تحتويه البيانات الجينية، حيث يمكن تخزين الجينات والمكونات الجينية الأخرى في الجينوم، وكيفية فك تشفيرها وتفسيرها، وما إلى ذلك. وترتبط الخوارزميات غير الخاضعة للرقابة بهذه المشكلة بشكل خاص لأنها يمكن أن تعالج كميات كبيرة من البيانات واستنتاج الأنماط التي تحتوي عليها تلقائيًا. يمكنهم أيضًا المساعدة في جمع معلومات وراثية متشابهة المظهر في مجموعات منفصلة. بمجرد تجميع البيانات الجينية على أساس التشابه، يمكن معالجة المجموعات واختبارها بسهولة لتحديد الوظيفة البيولوجية (إن وجدت) التي تخدمها.

LLMs والتعلم المعزز (مختلط)

تعد نماذج اللغات الكبيرة (LLMs) مثالاً على التطبيق الذي يجمع بين أنظمة التعلم غير الخاضعة للإشراف وتلك الخاضعة للإشراف. عادة ما يكون النظام الأولي، LLM، مثالاً على نظام غير خاضع للرقابة. لإنتاج ماجستير في القانون، يتم تحليل بيانات واسعة النطاق (على سبيل المثال، كل نصوص اللغة الإنجليزية المتاحة على الإنترنت) من خلال نظام غير خاضع للرقابة. ويستنتج النظام العديد من الأنماط من البيانات ويطور القواعد الأساسية للمحادثة باللغة الإنجليزية.

ومع ذلك، فإن الاستنتاجات التي يقدمها برنامج LLM لا تقوم بعمل جيد في مساعدته على أن يبدو وكأنه إنسان نموذجي في المحادثة. كما أنها لا تساعد في مراعاة التفضيلات الفردية للتواصل. يعد النظام الخاضع للإشراف - على وجه التحديد، نظام التعزيز الذي يستخدم التعليقات التوضيحية من المستخدمين (يُسمى التعلم المعزز من التعليقات البشرية، أو RLHF باختصار) - إحدى الطرق لحل هذه المشكلة. يمكن تطبيق RLHF على LLM مدرب بالفعل لمساعدته على التحدث بشكل جيد مع البشر بشكل عام. ويمكنه أيضًا معرفة التفضيلات الفردية والتحدث بالطرق التي يفضلها شخص معين.

خاتمة

باختصار، يعد التعلم الخاضع للإشراف وغير الخاضع للإشراف مجموعتين فرعيتين أساسيتين من تعلم الآلة، ولكل منهما نقاط قوة فريدة. يتفوق التعلم الخاضع للإشراف في السيناريوهات التي تحتوي على بيانات مصنفة وفيرة، وموارد كافية للتدريب المسبق، والحاجة إلى اتخاذ قرارات سريعة وقابلة للتطوير. من ناحية أخرى، يتألق التعلم غير الخاضع للرقابة عند الكشف عن الهياكل والعلاقات المخفية في البيانات، خاصة عندما تكون البيانات المصنفة أو موارد التدريب محدودة ويمكن أن تستوعب عملية صنع القرار المزيد من الوقت والتعقيد. ومن خلال فهم المزايا والتحديات وحالات الاستخدام لكلا النهجين، يمكنك اتخاذ قرارات مستنيرة حول متى وكيف يتم تطبيقهما بفعالية.