شرح التعلم السريع: تحويل الذكاء الاصطناعي باستخدام الحد الأدنى من البيانات
نشرت: 2025-01-13يعمل التعلم القليل (FSL) على إحداث تحول في التعلم الآلي (ML) من خلال تمكين النماذج من التعلم وإنشاء مخرجات دقيقة من عدد قليل من الأمثلة، على عكس الأساليب التقليدية التي تتطلب مجموعات بيانات ضخمة. يستكشف هذا الدليل كيفية عمل FSL وتطبيقاته ومقارناته مع التعلم الصفري (ZSL) وتحدياته وإمكاناته.
جدول المحتويات
- ما هو التعلم بالقليل من اللقطات؟
- التعلم باستخدام لقطات قليلة مقابل التحفيز باستخدام لقطات قليلة: ما الفرق؟
- كيف يعمل التعلم بالقليل من اللقطات
- التعلم بالقليل من اللقطة مقابل التعلم بدون اللقطة
- تطبيقات للتعلم قليل النار
- فوائد التعلم بالقليل من اللقطات
- تحديات التعلم بالرصاصات القليلة
ما هو التعلم القليل اللقطات (FSL)؟
يشير التعلم القليل (FSL) إلى مجموعة من تقنيات تعلم الآلة المصممة لإنشاء نماذج قابلة للتكيف قادرة على توليد مخرجات دقيقة بعد تدريبها على عدد قليل من الأمثلة المصنفة لكل فئة. عندما يتوفر مثال واحد فقط لكل فئة، يطلق عليه التعلم مرة واحدة. على سبيل المثال، تستفيد الهواتف الذكية الحديثة من FSL للتعرف على وجه المستخدم من خلال بضع صور فقط - أو حتى صورة واحدة.
تعتبر FSL ذات قيمة خاصة لأنها تسمح لنماذج التعلم الآلي بمعالجة المشكلات التي تكون فيها البيانات نادرة، كما هو الحال غالبًا في العالم الحقيقي. يمكن لنماذج FSL أيضًا التعامل مع نطاق أوسع من المهام مقارنة بنماذج التعلم الخاضعة للإشراف التقليدية لأنها تتعلم التعميم. يؤدي هذا إلى توفير الموارد لأنه غالبًا ما يكون تكييف نموذج FSL مع مهمة جديدة أرخص وأسرع من تدريب نموذج جديد تمامًا من الصفر. غالبًا ما يوصف FSL بأنه تعليم نماذج التعلم الآلي على "التفكير" مثل البشر من خلال تعلم التجريد من عدد قليل من الأمثلة فقط.
غالبًا ما يتم استخدام FSL لتطبيقات رؤية الكمبيوتر، ولكنه يتم نشره أيضًا في الروبوتات ومعالجة اللغات الطبيعية (NLP). على سبيل المثال، تم استخدام لغة FSL لترجمة النصوص السومرية القديمة، وهي مهمة مفيدة نظرا لقلة خبراء اللغة السومرية. لقد تعلمت نماذج المترجم السومري FSL كيفية الترجمة من مجموعة صغيرة فقط من العينات عالية الجودة من الألواح المسمارية. ثم قاموا بعد ذلك بترجمة كميات كبيرة من النصوص غير المألوفة بدقة ليقوم العلماء بتحليلها.
التعلم باستخدام لقطات قليلة مقابل التحفيز باستخدام لقطات قليلة: ما الفرق؟
تعد FSL والطلبات القليلة من المفاهيم ذات صلة في تعلم الآلة والبرمجة اللغوية العصبية، ولكنها تخدم أغراضًا مختلفة.
تعلم قليل بالرصاص
FSL هي تقنية للتدريب على النماذج تعلم النماذج كيفية تصنيف البيانات غير المرئية. وهو يعمل عن طريق تعديل معلمات النموذج للتكيف مع أنواع جديدة من مهام التصنيف، بالاعتماد على المعرفة السابقة. يرتبط FSL بالتعلم الخاضع للإشراف، ولكن الفرق هو أن نماذج FSL يتم تدريبها على مجموعة بيانات محدودة للغاية.
مطالبة قليلة بالرصاص
تُعد المطالبة بالطلقات القليلة طريقة للعمل مع نماذج اللغات الكبيرة (LLMs). ويستخدم التعلم في السياق - وهو نوع من التعلم يستخدم فيه النموذج معلومات من الموجه، مثل التنسيق والمشاعر، للتنبؤ بالمخرجات. على عكس FSL والتعلم التقليدي الخاضع للإشراف، لا يتضمن التحفيز قليل اللقطات تغيير معلمات LLM. عندما تستخدم المطالبة بعدد قليل من الطلقات، فإنك تزود LLM بعدة أمثلة على نوع الاستجابة التي تبحث عنها. كما هو الحال مع FSL، فإن التحفيز قليل اللقطات يدور حول مساعدة النموذج على التعميم من خلال تعريضه لبعض الأمثلة لمهمة مماثلة.
كيف يعمل التعلم بالقليل من اللقطات
يتضمن التعلم البسيط مرحلتين: أولاً، يتم تدريب النماذج مسبقًا على مجموعة بيانات عامة للتعرف على العالم. ثم يخضعون لتكييف المهام، حيث تتعلم النماذج كيفية التعميم من عينات البيانات الصغيرة.
التدريب المسبق
تبدأ المرحلة الأولى لمعظم نماذج FSL بالتدريب المسبق على مجموعة بيانات كبيرة مصنفة، تمامًا مثل التعلم الخاضع للإشراف. يقوم النموذج باستخراج الميزات من مجموعة البيانات هذه ويتعلم تصنيف الأمثلة من خلال تطوير قاعدة معرفية حول الأنماط والعلاقات في البيانات.
التكيف مع المهام
بعد التدريب المسبق، فإن المرحلة التالية من FSL هي تدريب النموذج لتعميم مهام التصنيف الجديدة. وهذا ما يسمى التكيف مع المهام ويحدث على مدار حلقات تدريبية متعددة.
في كل حلقة، توجد مجموعة دعم مكونة من مثالين إلى خمسة أمثلة للنموذج المراد دراسته ومجموعة استعلام بأهداف غير مرئية ليحاول النموذج تصنيفها. يسمى هذا الإطار تصنيف N-way K-shot، حيث يشيرNإلى عدد الفئات (تسمى الفئات)، ويشيرKإلى عدد الأمثلة المصنفة (اللقطات) لكل فئة.
تم تصميم جميع نماذج FSL لتحقيق التكيف مع المهام. ضمن مجموعة تقنيات FSL، يعتبر التعلم التلوي أحد أهم مجالات البحث وأكثرها إثارة.
مناهج التعلم الفوقي
يتضمن التعلم التلوي تعريض النموذج لمهام مشابهة أو مرتبطة بمهمة التصنيف التي تم تدريب النموذج في البداية على حلها. إنه يحصل على بضعة أمثلة فقط لكل مهمة جديدة، ولكن من هذه الأمثلة، يتعلم التعميم من خلال تطوير إطار تعريفي لما يجب فعله عند تكليفه بأي مهمة غير مألوفة.
بشكل عام، هناك ثلاثة أنواع من الأساليب للتعلم التلوي:
- التعلم القائم على التحسين:يتضمن ذلك الأساليب التي تدرب النماذج على تحسين معاييرها بسرعة. يستخدم البعض منهم عملية من مرحلتين حيث يتم تدريب المتعلم على مهمة محددة ثم يستخدم المتعلم الفوقي وظيفة الخسارة من مرحلة المتعلم لتحسين معلمات النموذج للمهمة التالية.
- التعلم على المستوى المتري:يستخدم في الغالب لمهام رؤية الكمبيوتر، ويعمل التعلم المتري عن طريق تعيين الميزات المستخرجة في مساحة التضمين واستخدام المسافة بين الميزات على الخريطة لإخراج احتمال تشابه صورتين.
- التعلم التلوي الحيادي النموذجي (MAML):في MAML، الهدف من عملية التدريب هو تقليل عدد خطوات التدرج المطلوبة لتحسين معلمات النموذج، بغض النظر عن المهمة. يقوم MAML بتحليل عمليات التعلم للمهام، ويستنتج أنماطًا في كيفية عمل العملية، ويطور نماذج تعمل كاختصارات، مما يؤدي إلى تسريع عملية التعلم مع كل مهمة جديدة تراها.
تتزايد قائمة بنيات النماذج التي تستخدم تقنيات التعلم التلوي طوال الوقت حيث يبتكر الباحثون طرقًا جديدة لمساعدة النماذج على أن تصبح قابلة للتكيف.
أساليب التعلم غير الفوقية
هناك أيضًا طرق FSL و FSL المجاورة التي لا تستخدم التعلم التلوي. يتم أحيانًا نشر FSL جنبًا إلى جنب مع هذه التقنيات لإنشاء نهج مختلط:
- نقل التعلم:تتضمن هذه الطريقة أخذ نموذج تم تدريبه مسبقًا وضبط الطبقات الخارجية للشبكة العصبية. يعتبر نقل التعلم أكثر فائدة في السيناريوهات التي تكون فيها المهمة التي تريد أن يؤديها النموذج قريبة من المهمة التي تم تدريبه عليها بالفعل.
- زيادة البيانات:يمكن تعزيز FSL من خلال زيادة البيانات، والتي تتضمن استخدام بياناتك المحدودة كقاعدة لإنشاء بيانات تركيبية باستخدام شبكات الخصومة التوليدية (GANs) أو أجهزة التشفير التلقائي المتغيرة لزيادة عدد العينات لمجموعة التدريب الخاصة بك.
التعلم بالقليل من اللقطة مقابل التعلم بدون اللقطة
غالبًا ما يتم استخدام التعلم بلقطة قليلة (أو التعلم بلقطة واحدة) في السيناريوهات التي تكون فيها البيانات محدودة ولكن عالية الجودة لتدريب النموذج. ولكن ماذا لو لم يكن لديك بيانات عالية الجودة على الإطلاق؟ في التعلم الصفري (ZSL)، فإنك لا تعطي نموذجك أي أمثلة وبدلاً من ذلك تطلب منه الاعتماد فقط على المعرفة السابقة والتضمينات الدلالية التي يمكنه الاعتماد عليها للتعامل مع المهام غير المألوفة.
تقدم ZSL حلاً سريعًا ومرنًا للتعامل مع المواقف ذات البيانات القليلة جدًا. ومع ذلك، قد تواجه نماذج ZSL صعوبة في تغيير النطاق - مما يعني أنها قد تواجه صعوبة إذا كان نوع البيانات التي تراها مختلفًا جدًا عن قاعدة معارفها - وقد يكون من الصعب تقييم مدى جودة أداء النموذج.
تطبيقات للتعلم قليل النار
إن تطبيقات FSL واسعة النطاق وتتطور باستمرار، ولكن لديها إمكانات هائلة لتكون مفيدة في المجالات التي يتوفر فيها عدد قليل نسبيًا من الأمثلة. تتضمن بعض مجالات البحث الحديثة لحالات الاستخدام ما يلي:
- التشخيص الطبي:يمكن أن يساعد FSL في تصنيف الأورام بناءً على الصور حيث لا توجد بيانات مصنفة كافية لتكون نماذج التعلم التقليدية الخاضعة للإشراف مفيدة.
- الاستشعار عن بعد:يمكن لـ FSL تسريع مهام الاستشعار عن بعد مثل استخدام لقطات الطائرات بدون طيار لتقييم آثار الكوارث البيئية.
- النماذج الأولية لسيارات سباق الفورمولا 1:يتم تدريب نماذج FSL مسبقًا على ديناميكيات السوائل والهوائية وغيرها من البيانات لمئات السيارات على مدار آلاف السباقات. ثم يستخدمون FSL للتنبؤ بالديناميكيات الهوائية وتدهور الأجزاء في نماذج السيارات الجديدة بناءً على عدد صغير من عمليات التشغيل الاختبارية باهظة الثمن.
- الترجمة الآلية:ساعدت FSL في بناء مترجمين آليين أكثر كفاءة يستخدمون القليل جدًا من المدخلات ويمكنهم التقاط الفروق الدقيقة في اللهجات والتنوع الإقليمي بدقة غير مسبوقة.
- الروبوتات:يتم استخدام FSL لتعليم الروبوتات كيفية فهم الأشياء من خلال مشاهدة العروض البشرية.
- تحليل المشاعر:يمكن استخدام نموذج FSL الذي تم تدريبه في الأصل على تقييمات الفنادق لتصنيف تقييمات المطاعم.
يعد FSL أيضًا جزءًا من السعي لبناء ذكاء اصطناعي عام لأنه يحاكي بشكل أوثق كيفية تعامل البشر مع حل المشكلات.
فوائد التعلم بالقليل من اللقطات
وتتمثل الفوائد الرئيسية لنماذج FSL في قدرتها على التعامل مع المشكلات التي تتوفر فيها بيانات محدودة، ويمكنها المساعدة في تقليل الموارد الحسابية والمالية اللازمة لتدريب النماذج الجديدة.
التعميم ببيانات محدودة
يمكن لنماذج FSL القيام بذلك لأنها لا تحفظ الصور أو الأصوات أو اللغة من خلال العديد من التكرارات. وبدلاً من ذلك، يتعلمون تحليل أوجه التشابه والاختلاف بسرعة. في حين تتفوق النماذج التقليدية في مهام محددة للغاية مثل تحديد نوع معين من الطيور أو مطابقة بصمات الأصابع، فإنها تفشل بمجرد أن تطلب منها إكمال أي مهمة أخرى.
باستخدام موارد أقل
تعتبر تقنيات مثل MAML طريقة أكثر فعالية لاستخدام موارد التدريب النموذجي. إنها تسمح بتكييف النماذج واسعة النطاق باهظة الثمن بسرعة وكفاءة مع حالات استخدام محددة دون خطوات إعادة تدريب باهظة الثمن. أحد التحديات الكبيرة في التعلم الآلي هو مقدار البيانات المطلوبة لتدريب النموذج لإنتاج مخرجات مفيدة، سواء من حيث تجميع مجموعات بيانات كبيرة وعالية الجودة أو من حيث مقدار الوقت والحساب المطلوب. يعد FSL بحل العديد من مشاكل العالم الحقيقي حيث تكون البيانات نادرة أو تتقاطع مع المجالات.
تحديات التعلم بالرصاصات القليلة
على الرغم من وعده، يواجه FSL تحديات يمكن أن تعيق فعالية النموذج.
التجهيز الزائد
يمكن أن يؤدي استخدام مجموعات بيانات محدودة إلى التجاوز، حيث يتماشى النموذج بشكل وثيق مع البيانات الموجودة في مجموعات التدريب الخاصة به ويكافح من أجل التعميم. هذه مشكلة مألوفة في تعلم الآلة والتي تحدث بشكل متكرر مع FSL مقارنة بطرق تعلم الآلة الأخرى. سيعمل نموذج FSL الذي يتسم بالتناسب الزائد بشكل جيد على بيانات الاختبار ولكنه لن يحدد فئات جديدة عند تقديمه مع أمثلة من العالم الحقيقي. ولمنع ذلك، من المهم أن يكون هناك تنوع في العينات المحدودة المستخدمة للتدريب على اللقطات القليلة. تحاول زيادة البيانات، التي تمت مناقشتها أعلاه، التخفيف من فرط التخصيص من خلال تجميع المزيد من الأمثلة للتدريب.
جودة البيانات
تعد البيانات عالية الجودة في كل من مرحلة ما قبل التدريب ومرحلة التعلم القليلة أمرًا مهمًا. يتم إعاقة نماذج FSL بسهولة أكبر بسبب البيانات المزعجة سيئة التصنيف. كما أنها لا تعمل بشكل جيد عندما تحتوي البيانات على قدر كبير جدًا من نوع واحد وليس من نوع آخر أو تحتوي على ميزات كثيرة جدًا بحيث لا يمكن للنموذج تحليلها؛ وفي هذه الحالات، فإنها تميل إلى أن تصبح معقدة للغاية. يمكن للباحثين في بعض الأحيان التعامل مع هذه المشكلات باستخدام تقنيات التنظيم، وهي طرق لتسهيل البيانات لمساعدة النموذج على معرفة ما يجب الانتباه إليه وما يجب تجاهله.