التعلم الخاضع للإشراف الذاتي: ما هو وكيف يعمل
نشرت: 2024-07-18إن التعلم الخاضع للإشراف الذاتي، وهو أسلوب متطور في الذكاء الاصطناعي، يعمل على تمكين الآلات من اكتشاف الأنماط والهياكل الجوهرية داخل البيانات، ومحاكاة القدرة البشرية على التعلم من السياق والخبرة بدلا من التعليمات الصريحة.
جدول المحتويات
- ما هو التعلم الخاضع للإشراف الذاتي؟
- الإشراف الذاتي مقارنة بأنواع التعلم الآلي الأخرى
- كيف يعمل التعلم الخاضع للإشراف الذاتي
- أنواع التعلم الخاضع للإشراف الذاتي
- تطبيقات التعلم الخاضع للإشراف الذاتي
- مزايا التعلم الخاضع للإشراف الذاتي
- عيوب التعلم الخاضع للإشراف الذاتي
ما هو التعلم الخاضع للإشراف الذاتي؟
التعلم الخاضع للإشراف الذاتي هو نوع من التعلم الآلي (ML) الذي يدرب النماذج على إنشاء تسمياتها الخاصة - أي المدخلات والمخرجات المقترنة بشكل صريح - باستخدام البيانات الأولية غير المسماة. على عكس التعلم الخاضع للإشراف، والذي يتطلب كمية كبيرة من البيانات المصنفة، يقوم التعلم الخاضع للإشراف الذاتي بإنشاء تسميات زائفة (تسميات مصطنعة) من البيانات نفسها. تمنح هذه التقنية النموذج التوجه نحو الهدف وقابلية القياس لنهج التعلم الخاضع للإشراف، بالإضافة إلى قدرة التعلم غير الخاضع للإشراف على استخلاص استنتاجات مفيدة من كميات هائلة من البيانات غير المسماة.
التعلم الآلي هو مجموعة فرعية من الذكاء الاصطناعي (AI) الذي يستخدم البيانات والأساليب الإحصائية لبناء نماذج تحاكي المنطق البشري بدلاً من الاعتماد على التعليمات المشفرة. يستفيد التعلم الخاضع للإشراف الذاتي من الكميات الهائلة من البيانات غير المسماة المتاحة، مما يجعله أسلوبًا قويًا لتحسين أداء النموذج بأقل قدر من التدخل اليدوي. في الواقع، يتم تدريب نماذج النصوص والصور التوليدية الرئيسية للذكاء الاصطناعي اليوم إلى حد كبير باستخدام التعلم الخاضع للإشراف الذاتي.
الإشراف الذاتي مقارنة بأنواع التعلم الآلي الأخرى
يجمع التعلم الخاضع للإشراف الذاتي بين عناصر التعلم الخاضع للإشراف وغير الخاضع للإشراف ولكنه يختلف عن التعلم شبه الخاضع للإشراف:
- التعلم الخاضع للإشراف: يستخدم البيانات المصنفة لتدريب النماذج على مهام محددة مثل التصنيف والانحدار. توفر التسميات إرشادات واضحة، مما يسمح للنموذج بإجراء تنبؤات دقيقة. تشمل التطبيقات الشائعة اكتشاف البريد العشوائي وتصنيف الصور والتنبؤ بالطقس.
- التعلم غير الخاضع للرقابة: يعمل مع البيانات غير المسماة للعثور على الأنماط والتجمعات. فهو يحدد المجموعات والارتباطات ويقلل من تعقيد البيانات لتسهيل المعالجة. تشمل الأمثلة تقسيم العملاء وأنظمة التوصية والكشف عن الحالات الشاذة.
- التعلم شبه الخاضع للإشراف:يستخدم كمية متواضعة من البيانات المصنفة لتوفير التوجيه الأولي ثم يستفيد من مجموعة أكبر أو أكثر من البيانات غير المسماة لتحسين النموذج وتحسينه. يعد هذا الأسلوب مفيدًا بشكل خاص عندما يكون لديك بعض البيانات المصنفة، ولكن سيكون من الصعب جدًا أو مكلفًا إنشاء ما يكفي للتعلم الخاضع للإشراف الكامل.
- التعلم الخاضع للإشراف الذاتي:يستخدم البيانات الأولية لإنشاء تسمياته الخاصة، مما يسمح للنموذج بالتعلم من البيانات دون أي بيانات أولية مصنفة. يعد هذا النهج ذا قيمة خاصة عندما لا تكون البيانات المصنفة متاحة على الإطلاق أو تكون جزءًا صغيرًا فقط من البيانات المتاحة، مثل معالجة اللغة الطبيعية (NLP) أو التعرف على الصور.
كيف يعمل التعلم الخاضع للإشراف الذاتي
ويعني الإشراف الذاتي أن البيانات نفسها توفر الإجابات الصحيحة. تتضمن عملية التعلم الخاضع للإشراف الذاتي عدة خطوات، تجمع بين جوانب الأساليب الخاضعة للإشراف وغير الخاضعة للإشراف:
جمع البيانات:جمع كمية كبيرة من البيانات الأولية غير المسماة. تشكل هذه البيانات الأساس لإنشاء تسميات زائفة وتدريب النموذج. العديد من مجموعات البيانات متاحة بحرية.
- المعالجة المسبقة:تحضير البيانات لضمان الجودة. تتضمن هذه الخطوة إزالة التكرارات ومعالجة القيم المفقودة وتطبيع نطاقات البيانات.
- إنشاء المهام:قم بإنشاء ألغاز ليقوم النموذج بحلها، والمعروفة باسم مهام الذريعة. يتم إنشاؤها عن طريق إزالة أجزاء من البيانات أو خلطها، مثل إزالة الكلمات، أو حذف وحدات بكسل الصورة، أو خلط إطارات الفيديو. كل ما كان موجودًا قبل هذا الفساد المتعمد يُعرف باسم التسمية الزائفة: "الإجابة الصحيحة" التي يتم إنشاؤها من البيانات نفسها وليس من التصنيف البشري.
- التدريب:تدريب النموذج على مهام الذريعة باستخدام التسميات الزائفة التي تم إنشاؤها. وهذا يعني أن النموذج يحاول توليد الإجابة الصحيحة، ويقارن إجابته بالعلامة الزائفة، ويضبطها، ويحاول مرة أخرى إنشاء الإجابة الصحيحة. تساعد هذه المرحلة النموذج على فهم العلاقات داخل البيانات وتخلق في النهاية فهمًا معقدًا للعلاقة بين المدخلات والمخرجات.
- الضبط الدقيق:قم بتبديل النموذج للتعلم من مجموعة بيانات أصغر حجمًا ومُصنفة لتحسين أدائه في مهام محددة. تضمن هذه الخطوة أن يستفيد النموذج من التمثيلات التي تم تعلمها خلال مرحلة التدريب الأولية. الضبط الدقيق ليس ضروريًا تمامًا، ولكنه يؤدي عادةً إلى نتائج أفضل.
- التقييم:تقييم أداء النموذج بناءً على البيانات التي لم يراها بعد. باستخدام المقاييس القياسية ذات الصلة بالمهمة، مثل درجة F1، يضمن هذا التقييم أن النموذج يعمم بشكل جيد على البيانات الجديدة.
- النشر والمراقبة:نشر النموذج المُدرب في تطبيقات العالم الحقيقي ومراقبة أدائه بشكل مستمر. قم بتحديث النموذج ببيانات جديدة حسب الحاجة للحفاظ على دقته وأهميته.
أنواع التعلم الخاضع للإشراف الذاتي
يشمل التعلم الخاضع للإشراف الذاتي أنواعًا مختلفة، ولكل منها تقنيات وأساليب متعددة. سنستكشف هنا عدة أنواع، مع تسليط الضوء على أساليب التدريب الفريدة الخاصة بهم وتقديم مثال أو مثالين تمثيليين لكل منها.
للصور
- التعلم التنبؤي الذاتي:يتضمن التعلم التنبؤي الذاتي تقنيات مثل التشفير التلقائي، حيث يتعلم النموذج ضغط المعلومات في نموذج أبسط ثم إعادة إنشاء البيانات الأصلية منها. في معالجة الصور، يعني هذا غالبًا إتلاف أجزاء من الصورة بشكل انتقائي (على سبيل المثال، عن طريق إخفاء الأقسام) وتدريب النموذج على إعادة بناء النسخة الأصلية. يساعد هذا النموذج على التعرف بشكل أفضل على الكائنات في المواضع والأحجام المختلفة، وحتى عندما تكون مخفية جزئيًا.
- التعلم التقابلي:في التعلم التقابلي، يتعلم النموذج التمييز بين الصور المتشابهة والمختلفة من خلال مقارنتها في أزواج أو مجموعات. على سبيل المثال، تستخدم طريقة SimCLR تكبيرات الصورة (مثل الاقتصاص والتشويه والقلب) لإنشاء أزواج تدريب. يتم إنشاء الأزواج الموجبة من خلال تطبيق تغييرات مختلفة على نفس الصورة، بينما تأتي الأزواج السالبة من صور مختلفة. يتعلم النموذج بعد ذلك ما هي الميزات الشائعة في الأزواج المتشابهة والمختلفة في الأزواج غير المتشابهة.
- الأساليب القائمة على المجموعات:تقوم الأساليب القائمة على المجموعات بتجميع نقاط البيانات المتشابهة معًا واستخدام هذه المجموعات كتسميات زائفة للتدريب. على سبيل المثال، يقوم DeepCluster بتجميع الصور حسب ميزات مماثلة ويستخدم هذه المجموعات لتدريب النموذج. تتناوب العملية بين التجميع والتدريب حتى يعمل النموذج بشكل جيد. يعمل SwAV (Swapping Assignments Between Views) على تحسين ذلك باستخدام إصدارات متعددة من نفس الصورة لمساعدة النموذج على تعلم الميزات الأساسية التي تظل ثابتة، مثل الحواف والأنسجة ومواضع الكائنات.
للنص
- التعلم التنبؤي الذاتي:هذه هي آلية التدريب الأساسية لنماذج اللغات الكبيرة (LLMs)، التي تفهم النص كسلسلة من الرموز المميزة. تمثل هذه عادةً كلمة واحدة ولكن في بعض الأحيان تمثل جزءًا من كلمة أو مجموعة من الكلمات.
- نماذج اللغة المقنعة (MLMs):تظهر هذه الجمل مع فقدان بعض الرموز المميزة ومهمتها التنبؤ بالكلمات المفقودة. من خلال تعلم كيفية ملء هذه الفراغات، يقوم أصحاب الامتيازات والرهون البحرية بتطوير تمثيل شامل لبنية اللغة وسياقها، ويمكنهم النظر في سياق المدخلات بأكملها عند إجراء التنبؤات. يتم تطوير المخرجات المفيدة، مثل تحليل المشاعر أو التعرف على الكيانات المسماة، من خلال الضبط الدقيق. وخير مثال على ذلك هو BERT، الذي يستخدمه Google لفهم القصد من استعلامات البحث.
- نماذج اللغة السببية (CLMs):تتعلم النماذج التوليدية مثل ChatGPT وClaude وGemini إعادة إنشاء النص الذي شاهدوه من خلال التنبؤ بكلمة واحدة في كل مرة، بناءً على الرموز المميزة السابقة. بمجرد تدريبهم، يتعاملون مع النص المُدخل باعتباره سياقًا لتوقعاتهم ويستمرون في عمل التنبؤات مع كل رمز مميز جديد يقومون بإنشائه. هذا التنبؤ المتسلسل هو السبب وراء ظهور مخرجاتهم وكأنها تكتب نفسها بدلاً من الظهور مرة واحدة.
- التعلم المقارن:يقوم هذا الأسلوب بمقارنة أزواج من العينات النصية، مع التركيز على الاختلافات والتشابهات بينها. يقوم SimCSE بإنشاء نسختين مختلفتين قليلاً من نفس الجملة عن طريق تطبيق التسرب، والذي يتجاهل بشكل عشوائي أجزاء من تمثيل الجملة في الطبقات المخفية أثناء التدريب (اطلع على المزيد حول الطبقات المخفية في منشورنا حول التعلم العميق). يتعلم النموذج التعرف على هذه الإصدارات على أنها متشابهة. تعمل هذه التقنية على تحسين قدرة النموذج على فهم الجمل ومقارنتها، مما يجعلها مفيدة لتطبيقات مثل العثور على جمل مماثلة أو استرداد المعلومات ذات الصلة لاستعلامات البحث.
- التنبؤ بالجمل التالية (NSP):كما يوحي الاسم، يتضمن NSP التنبؤ بما إذا كانت جملة معينة هي الجملة اللاحقة لجملة أخرى في المستند، مما يساعد النماذج على فهم العلاقات بين الجمل والتدفق المنطقي للنص. يتم استخدامه بشكل شائع جنبًا إلى جنب مع الامتيازات والرهون البحرية لتعزيز فهمه للنصوص الأكبر حجمًا. على سبيل المثال، في BERT NSP، يتنبأ النموذج بما إذا كانت جملتان تظهران على التوالي في النص الأصلي.
تطبيقات التعلم الخاضع للإشراف الذاتي
يحتوي التعلم الخاضع للإشراف الذاتي على مجموعة واسعة من التطبيقات في مجالات مختلفة:
- معالجة اللغة الطبيعية:تستخدم نماذج مثل BERT وGPT-3 التعلم الخاضع للإشراف الذاتي لفهم اللغة البشرية وتوليدها في تطبيقات مثل برامج الدردشة الآلية والترجمة وتلخيص النص.
- الرؤية الحاسوبية:يعمل التعلم الخاضع للإشراف الذاتي على تحسين تحليل الصور والفيديو عن طريق إنشاء تسميات زائفة من البيانات المرئية الأولية. تشمل الاستخدامات اكتشاف الأشياء (مثل كاميرا جرس الباب)، والتعرف على الوجه، وإنشاء مقاطع تلقائيًا من مقاطع الفيديو الطويلة.
- التعرف على الكلام:تعمل النماذج ذاتية الإشراف على تحسين أنظمة التعرف على الكلام من خلال التعلم من كميات هائلة من البيانات الصوتية غير المسماة. يقلل هذا الأسلوب من الحاجة إلى النسخ اليدوي ويحسن الدقة عبر اللهجات واللهجات المختلفة.
- الرعاية الصحية:يساعد التعلم الخاضع للإشراف الذاتي على تحسين تحليل الصور الطبية واكتشاف الأدوية ومراقبة المرضى من خلال الاستفادة من مجموعات البيانات الكبيرة مع الحد الأدنى من الأمثلة المصنفة. إنه يعزز دقة اكتشاف الأمراض وتوصيات العلاج دون الحاجة إلى وضع علامات بشرية واسعة النطاق ومكلفة.
- الروبوتات:تستخدم الروبوتات التعلم الخاضع للإشراف الذاتي لفهم بيئتها وتحسين عمليات صنع القرار. تشمل الاستخدامات التنقل المستقل ومعالجة الكائنات والتفاعل بين الإنسان والروبوت.
مزايا التعلم الخاضع للإشراف الذاتي
- فعالة من حيث التكلفة:تقلل الحاجة إلى بيانات مصنفة واسعة النطاق، مما يقلل تكاليف التعليقات التوضيحية والجهد البشري.
- قابلية التوسع:يمكن التعامل مع مجموعات البيانات الكبيرة، مما يجعلها مناسبة لتطبيقات العالم الحقيقي حيث تكون البيانات المصنفة محدودة ولكن البيانات غير المسماة وفيرة.
- التعميم:عند التدريب على ما يكفي من البيانات الأولية، يمكن للنموذج أن يتعلم ما يكفي لأداء مهام جديدة حتى لو لم يتم تدريبه على البيانات ذات الصلة المباشرة. على سبيل المثال، يمكن استخدام نموذج البرمجة اللغوية العصبية المعتمد على لغة واحدة لزيادة تعلم ذلك النموذج المعتمد على لغة أخرى.
- المرونة:قابلة للتكيف مع مجموعة واسعة من المهام والمجالات، مع توفر العديد من الأنواع الفرعية لتناسب احتياجات معينة.
عيوب التعلم الخاضع للإشراف الذاتي
- التعقيد:يتطلب إنشاء مهام ذريعة فعالة وإنشاء تسميات زائفة تصميمًا وتجريبًا دقيقًا.
- حساسية الضوضاء:قد تكون الملصقات الزائفة التي يتم إنشاؤها من البيانات الأولية غير ذات صلة بالهدف، مما قد يؤثر على الأداء من خلال إعطاء النموذج الكثير من المدخلات غير الضرورية للمعالجة.
- الموارد الحسابية:يتطلب تدريب النماذج ذاتية الإشراف، خاصة مع مجموعات البيانات الكبيرة، قوة حسابية كبيرة ووقتًا كبيرًا.