التعلم النقل: الاختصار إلى تطوير الذكاء الاصطناعي الأذكى والأسرع
نشرت: 2025-02-04إن إعادة استخدام نماذج الذكاء الاصطناعى وتكييفها مسبقًا هي تغيير كيفية التعامل مع مهام التعلم الآلي (ML). إن التعلم النقل هو طريقة فعالة وفعالة من حيث التكلفة لتكييف أنظمة الذكاء الاصطناعى الكبيرة والمعقدة مع المجالات والمشاكل الجديدة. في هذا الدليل ، سنستكشف الجوانب الرئيسية لتعلم النقل: كيف يعمل ، وأنواعها وتطبيقاتها المختلفة ، ومزاياه وتحدياتها.
جدول المحتويات
- ما هو التعلم النقل؟
- كيف يعمل التعلم النقل؟
- نقل التعلم مقابل الضبط
- أنواع تعلم النقل
- فوائد التعلم النقل
- تحديات التعلم النقل
- تطبيقات التعلم النقل
ما هو التعلم النقل؟
إن التعلم النقل هو تقنية تعليمية قوية تعزز نموذجًا تم تدريبه مسبقًا لمهمة مختلفة ولكن ذات صلة. يستخدم المعرفة العامة التي تم التقاطها في نموذج موجود كأساس لمعرفة كيفية حل المشكلات في المجالات الأكثر تحديدًا وذات صلة.
يقدم التعلم النقل العديد من المزايا: فهو يسارع تطوير ونشر تطبيقات الذكاء الاصطناعي المخصص (AI) ، وتخفيض تكاليف الموارد ، وغالبًا ما توفر أداءً أفضل من بناء نموذج من نقطة الصفر. نتيجة لذلك ، يعد التعلم النقل ذا قيمة خاصة للمؤسسات التي تهدف إلى تطوير حلول الذكاء الاصطناعي المتخصصة دون كميات هائلة من البيانات أو القوة الحسابية المطلوبة عادة لتدريب نموذج من نقطة الصفر.
مثال على التعلم النقل
النظر في مثال الشركة المصنعة التي تريد إنشاء نظام AI للكشف عن عيوب المنتج. يتمثل أحد الخيارات في توظيف ممارسي ML المتخصصين ، وجمع وتصنيع الملايين من صور المنتجات ذات الصلة ، وتوضيح الوقت والموارد الحسابية اللازمة لتدريب نموذج من نقطة الصفر. يقدم Transfer Learning خيارًا أفضل بكثير: يمكن للشركة المصنعة بدلاً من ذلك البدء بنموذج أكمل بالفعل تدريبًا باهظ الثمن ويستغرق وقتًا طويلاً على مجموعة بيانات صور كبيرة موحدة ، مثل ImageNet. يمكن للشركة المصنعة بعد ذلك استخدام التعلم النقل بسرعة وكفاءة لتكييف النموذج لاكتشاف العيوب في صور منتج محددة.
كيف يعمل التعلم النقل؟
نقل التعلم يتكيف مع المعرفة العامة للنموذج الذي تم تدريبه مسبقًا لمهمة جديدة ذات صلة. تتضمن العملية عادة ثلاث خطوات رئيسية:
- اختيار نموذج مناسب مسبقًا
- تحديث بنية النموذج
- تدريب النموذج على البيانات الجديدة
1. حدد نموذجًا مسبقًا مدربًا
الخطوة الأولى هي اختيار نموذج تم تدريبه بالفعل على مجموعة بيانات في مجال يتعلق بالمهمة المستهدفة. يجب أن يكون النموذج الذي تم تدريبه مسبقًا قد تعلم ميزات عامة وعالية المستوى ذات الصلة بالتطبيق الجديد.
- مثال في الرعاية الصحية:قد تبدأ منظمة الرعاية الصحية بنموذج تم تدريبه مسبقًا على مجموعة بيانات NIH (المعاهد الوطنية للصحة) ، والتي تحتوي على مجموعة واسعة من الصور الطبية المسمى. كان النموذج قد تعلم ميزات عامة مثل كيفية تنظيم صور الأشعة السينية وكيف ترتبط الخصائص البيولوجية بمكونات الصورة. يمكن أن يكون هذا النموذج بمثابة الأساس لتطوير أدوات تشخيصية لظروف محددة تقع في منطقة الصدر ومرئية على صور الأشعة السينية ، مثل الالتهاب الرئوي أو سرطان الرئة.
- مثال في التمويل:قد تستخدم المؤسسة المالية Finbert ، وهو نموذج تم تدريبه مسبقًا على المستندات المالية ، ومكالمات الأرباح ، والملاعب التنظيمية. كان النموذج قد تعلم ميزات عامة مثل هيكل اللغة المالية والمصطلحات المحددة التي تشير إلى معنويات السوق وأداء الأعمال. يمكن أن يكون نموذج Finbert بمثابة أساس لمزيد من الوظائف المتخصصة ، مثل الإبلاغ تلقائيًا فيما يتعلق بالبيانات في تقارير الأرباح.
يتضمن اختيار النموذج الصحيح الذي تم تدريبه مسبقًا ضمان توافق تدريبه الأصلي بشكل جيد مع التطبيق المقصود ، حيث أن هذا يزيد من احتمال التعديل الناجح.
2. تعديل بنية النموذج
بمجرد تحديد نموذج مناسب تم تدريبه مسبقًا ، يتم تكييف بنيةه لتناسب المهمة الجديدة. تتضمن هذه الخطوة عادة:
- استبدال طبقات الإخراج:تتم إزالة الطبقات النهائية للنموذج الذي تم تدريبه مسبقًا ، المصمم للمهمة الأصلية ، واستبداله بطبقات جديدة خاصة بالمهمة (على سبيل المثال ، طبقات متصلة بالكامل للتصنيف).
- الاحتفاظ بالميزات العامة:غالبًا ما يتم الحفاظ على الطبقات الداخلية ، التي تلتقط أنماطًا قابلة للتعميم مثل الحواف في الصور أو العلاقات اللغوية في النص. يمكن أن تنقل هذه الميزات بشكل فعال إلى المهام ذات الصلة.
يعتمد مدى التعديل المعماري على حالة الاستخدام المحددة ودرجة التشابه بين المهام المصدر والمهام المستهدفة.
3. تدريب النموذج على البيانات الجديدة
في الخطوة الأخيرة ، يتم تدريب النموذج المعدل على مجموعة بيانات مصممة للمهمة الجديدة. يمكن التعامل مع هذه الخطوة بطريقتين أساسيتين ، اعتمادًا على حجم مجموعة البيانات والتشابه بين المهام:
- استخراج الميزة:
- يتم تدريب الطبقات المضافة حديثًا فقط ، بينما تظل الطبقات الأصلية دون تغيير.
- تكون هذه الطريقة مثالية عندما ترتبط المهمة الجديدة ارتباطًا وثيقًا بالمهمة الأصلية أو عندما تكون مجموعة البيانات الهدف صغيرة.
- الكون المثالى:
- يتم إعادة تدريب النموذج بأكمله ولكن مع مجموعة بيانات أصغر ومعدل تعليمي لتجنب فقدان الميزات القيمة المستفادة خلال مرحلة ما قبل التدريب.
- هذا النهج أكثر ملاءمة لمجموعات البيانات الكبيرة أو عندما تختلف المهمة الجديدة بشكل كبير عن المهمة الأصلية.
بغض النظر عن النهج ، فإن الهدف هو تعريض النموذج للبيانات ذات الصلة الكافية ، وتمكينه من التعلم والتعميم على التطبيق الجديد بفعالية.
نقل التعلم مقابل الضبط
غالبًا ما يتم الخلط بين التعلم النقل مع الضبط. في حين أن المفاهيم مرتبطة ارتباطًا وثيقًا ، هناك اختلافات ملحوظة. الأهم من ذلك ، أن التعلم النقل هو العملية الشاملة لتكييف نموذج تم تدريبه مسبقًا لغرض جديد وقد يتضمن أو لا ينطوي على صقل دقيق. من ناحية أخرى ، يعد التغلب على التقنيات المستخدمة لإعادة تدريب بعض أو كل معلمات النموذج كجزء من عملية التعلم الإجمالية للنقل. النقل الدقيق ليس مجرد مجموعة فرعية من التعلم النقل ؛ يحتوي على تطبيقات في سياقات أخرى في ML خارج التعلم النقل ، مثل تحسين أداء النموذج على مجموعات فرعية محددة من البيانات أو تكييف نموذج لتحويل توزيعات البيانات.
بالإضافة إلى ذلك ، يتطلب التعلم النقل عادة إجراء تغييرات فعلية على بنية النموذج ، مثل إزالة الطبقات الموجودة واستبدالها أو إعادة هيكلة الاتصالات بين الطبقات. على النقيض من ذلك ، يتضمن الصقل الدقيق عمومًا تعديلات معلمة صغيرة ودقيقة دون تغييرات كبيرة في الهندسة المعمارية.
فكر في التعلم النقل على أنه تجديد مبنى مصمم لأغراض واحدة بحيث يمكن استخدامه لآخر ، مثل تحويل المرآب إلى شقة. من المحتمل أن يتضمن ذلك تحديثات هيكلية مثل تثبيت Windows والعزل أو حتى إضافة غرف جديدة واتصالات فائدة. من ناحية أخرى ، يشبه الضبط الشبه استخدام المرآب كمساحة عمل إضافية دون إجراء تغييرات كبيرة على الهيكل. على سبيل المثال ، قد يتم استبدال الأضواء ، ويمكن إضافة أرفف جديدة ، ولكن لا يزال الهيكل العام والهندسة المعمارية للمرآب دون تغيير.
أنواع تعلم النقل
يمكن أن يتخذ التعلم النقل عدة أشكال ، كل منها مناسب لسيناريوهات محددة. يعتمد النوع المناسب على عوامل مثل توافر البيانات المسمى في المجال المستهدف ، والتشابه بين المهام المصدر والمهام المستهدفة ، ومتطلبات العمل المحددة. الأنواع الرئيسية لتعلم النقل هي التعلم النقل الاستقرائي،وتعلم النقل التحويلي،وتعلم النقل غير الخاضع للإشراف. بالإضافة إلى ذلك ، غالبًا ما تستفيد الأساليب الحديثة مثلالتعلم القليلةوالتعلم الصفري من تقنيات التعلم النقل.

التعلم النقل الاستقرائي
إن التعلم النقل الاستقرائي هو النوع الأكثر شيوعًا لتعلم النقل ويتم استخدامه عندما تكون المهام الهدف والمصدر مرتبطة ارتباطًا وثيقًا ومختلفًا تمامًا.
مثال:قد تستخدم منظمة الرعاية الصحية التعلم النقل لتكييف نموذج مدرب لتصنيف صور التصوير بالرنين المغناطيسي العام للكشف عن ظروف دماغية محددة.
في هذا السيناريو ، تنقل إمكانات التعرف البصري العام لنموذج المصدر بشكل جيد إلى المهمة المستهدفة ، ولكن هناك حاجة إلى البيانات المسمى في المجال الهدف. يعد التعلم النقل فعالًا بشكل خاص للمهام التي تتوفر فيها الملصقات الجديدة ، ولكن المهمة نفسها تختلف عن (وعادة ما تكون نسخة أكثر تخصصًا) المصدر.
التعلم النقل التحويلي
في تعلم النقل التحويلي ، تكون المهام المصدر والمستهدفة هي نفسها ، لكن مجال المشكلة مختلف.
مثال:يمكن تكييف مرشح البريد العشوائي المدرب على رسائل البريد الإلكتروني باللغة الإنجليزية لتصنيف رسائل البريد الإلكتروني الفرنسية. في هذا السيناريو ، ينقل التعرف على أنماط نص نموذج المصدر وفهم بنية البريد الإلكتروني بشكل جيد إلى المهمة المستهدفة ، حتى لو اختلفت أنماط المفردات واللغة. تظل المهمة (تصنيف البريد الإلكتروني) دون تغيير ، لكن البيانات (اللغة) تختلف. يكون هذا النهج مفيدًا عندما يكون لمجال المصدر بيانات وفيدة وموضحة ، والمجال المستهدف يحتوي على القليل أو لا شيء.
التعلم النقل غير الخاضع للإشراف
يتم استخدام التعلم النقل غير الخاضع للإشراف عند عدم توفر البيانات المسمى في المجال المستهدف. بشكل عام ، يتم استخدام هذا النوع من التعلم النقل لتدريب النماذج على أداء المهام غير الخاضعة للإشراف مثل التجميع أو الحد من الأبعاد.
مثال:قد تستخدم مؤسسة تكنولوجيا المعلومات التعلم غير الخاضع للإشراف لمساعدة نظام الكشف عن التهديدات الذي يعمل بذات منظمة العفو الدولية على تحديد أنواع التهديدات الجديدة دون أمثلة موصوفة.
في هذه الحالة ، يمكن للنموذج نقل فهمه العام للأنماط العادية مقابل التهديدات المحتملة لأنواع التهديد الجديدة غير المعروفة سابقًا.
تعلم القليل من اللقطة
تعلّم القليل من التعلم (FSL) هو تقنية ML التي تستخدم التعلم النقل لمساعدة نموذج على التعلم من بيانات محدودة للغاية. في FSL ، تتعلم النماذج أداء مهام أو تصنيفات جديدة باستخدام بعض الأمثلة.
مثال:يمكن لنموذج التعرف على الوجه تحديد شخص جديد يعتمد على صورة واحدة أو صورتين فقط.
التعلم صفري
التعلم Zero-Shot (ZSL) هو تقنية ML التي تساعد النموذج على تعلم فصول جديدة لم تشاهدها في التدريب. يستخدم ZSL غالبًا مفاهيم التعلم النقل ولكنه يعتمد على العلاقات الدلالية والمعلومات المساعدة لتعميم المعرفة المستفادة على فئات جديدة.
على سبيل المثال:قد يتعلم النموذج التعرف على البلطي بناءً على فهمه لأنواع أخرى من الأسماك ومعرفته بأن البلطي نوع من الأسماك على الرغم من عدم رؤيته لمرة البلطي أثناء التدريب.
فوائد التعلم النقل
يوفر التعلم النقل العديد من المزايا للمؤسسات التي تسعى لتطوير حلول الذكاء الاصطناعى المصممة. وتشمل هذه متطلبات التطوير والموارد المنخفضة ، والأداء الجيد مع البيانات المحدودة ، وتحسين متانة النموذج.
انخفاض متطلبات التطوير والموارد
يعد التعلم النقل طريقة رائعة لتقصير دورة التطوير في وقت واحد وتقليل متطلبات الموارد لتطبيقات الذكاء الاصطناعى. يتضمن بناء نموذج من نقطة الصفر جمع البيانات والتنظيف ووضع العلامات - وهذا قبل أن يبدأ التدريب. مع التعلم النقل ، تصبح التطوير والنشر مسألة أسابيع أو حتى أيام بدلاً من أشهر. غالبًا ما يتطلب تدريب نموذج من نقطة الصفر وقتًا حسابيًا وقوة كبيرة ، في حين أن التعلم النقل لا. هذا يعني أن المنظمات يمكنها إحضار حلول الذكاء الاصطناعى إلى السوق بسرعة أكبر وبأقل أهمية.
أداء جيد مع بيانات محدودة
يتيح التعلم النقل النماذج أداءً جيدًا ، حتى مع مجموعات بيانات التدريب المحدودة. هذا مفيد للغاية للمؤسسات في المجالات المتخصصة ، مثل التصنيع أو الرعاية الصحية ، حيث يصعب العثور على البيانات المسمى أو شراؤها. على سبيل المثال ، قد يكون لدى منظمة الرعاية الصحية بضع مئات فقط من الأمثلة المسمى لحالات طبية محددة ولكن يمكنها استخدام التعلم النقل لبناء نظام اكتشاف الأداء بغض النظر.
تحسين المتانة والموثوقية
على الرغم من أنه قد يبدو غير بديهي ، إلا أن النماذج التي تم تدريبها من خلال التعلم النقل غالبًا ما يتم تعميمها بشكل أفضل من النماذج المدربة من نقطة الصفر على بيانات محدودة. وذلك لأن مجموعات البيانات واسعة النطاق المستخدمة في التدريب المسبق توفر أنماطًا وميزات متنوعة يمكن تعميمها على مجالات ومهام أكثر تحديدًا. بالإضافة إلى ذلك ، فإن البدء بنموذج تم اختباره بالفعل يقلل من خطر فشل النموذج ويزيد من الموثوقية. هذا انخفاض المخاطر أمر مهم في الصناعات المنظمة مثل الرعاية الصحية والتمويل.
تحديات التعلم النقل
على الرغم من فوائده العديدة ، فإن التعلم النقل لديه أيضًا العديد من التحديات والقيود. يجب أن تفهم المنظمات هذه التحديات حتى يتمكنوا من تصميم استراتيجية التنفيذ الصحيحة ولديها توقعات واقعية. وتشمل هذه التحديات النقل السلبي وعدم تطابق المجال واختيار النموذج.
النقل السلبي
في النقل السلبي ، تعوق المعرفة من مجال المصدر عن تعلم المهمة المستهدفة ويؤدي إلى أداء النموذج الذي تم تدريبه مسبقًا أسوأ من واحد مدرب من نقطة الصفر. هذا هو واحد من أكثر التحديات شيوعًا مع تعلم النقل ويحدث عادةً عندما تكون مجالات الهدف والمصدر مختلفة جدًا. على سبيل المثال ، من المحتمل أن يؤدي نموذج رؤية الكمبيوتر المدرب على تصنيف سلالات الكلاب في الصور بشكل سيء إذا تم تكييفه مع تحليل الصور الطبية ، حيث أن الميزات المستفادة غير ذات صلة بالمهمة الجديدة. الميزات التي تساعد على تمييز سلالات الكلاب ، مثل نسيج الفراء وطول الذيل وشكل الأذن ، ليس لها تطبيق ذي معنى عند محاولة تصنيف عمليات المسح الطبية. يجب على المنظمات مقارنة المجالات المصدر والمستهدفة بعناية لتجنب النقل السلبي.
عدم تطابق المجال
يحدث عدم تطابق المجال عندما تقلل الاختلافات بين البيانات المتاحة للمجالات المصدر والهدف من أداء النموذج. يمكن أن تشمل هذه الاختلافات الاختلافات في جودة البيانات أو التوزيع. على عكس النقل السلبي ، قد لا يزال النموذج الذي يعاني من عدم تطابق المجال أفضل من واحد مدرب من الصفر. على سبيل المثال ، لن يقوم نموذج مدرب على مجموعة بيانات كبيرة ومتنوعة من صور CAT بعمل جيد في تحديد الكلاب. ومع ذلك ، فإن النموذج سيظل أفضل بشكل عام من نموذج مدرب على مجموعة صغيرة من صور الكلاب.
اختيار النموذج وتعديله
يمكن أن يكون اختيار النموذج المناسب المدربين مسبقًا ومعرفة كيفية تعديله معقدًا ويستغرق وقتًا طويلاً. تحتاج المؤسسات إلى النظر في جميع أنواع العوامل ، بما في ذلك التوافق بين المجالات المصدر والمستهدفة ، والبنية التحتية المتاحة وموارد الموظفين ، وحجم وجودة مجموعة بيانات التدريب ، والهندسة المعمارية النموذجية. بالإضافة إلى ذلك ، غالبًا ما يتم بناء النماذج التي تم تدريبها مسبقًا مع الافتراضات والتبعيات التي قد لا تكون واضحة على الفور. يتطلب اختيار النموذج المناسب وإجراء التعديلات الصحيحة الخبرة ووقت التجريب والبنية التحتية التي قد لا تستطيع جميع المنظمات الوصول إليها.
تطبيقات التعلم النقل
يعد التعلم النقل وسيلة أسهل وأكثر موثوقية لإنشاء أنظمة الذكاء الاصطناعى لمهام أو مجالات محددة من بناء نموذج جديد. بعد ذلك ، وجدت هذه التقنية تبنيًا واسع النطاق ولديها العديد من التطبيقات ، بما في ذلك رؤية الكمبيوتر ، ومعالجة اللغة الطبيعية (NLP) ، والتعرف على الكلام وتوليدها.
رؤية الكمبيوتر
كان التعلم النقل ناجحًا للغاية في رؤية الكمبيوتر. يمكن للمؤسسات إنشاء تطبيقات رؤية مخصصة بسهولة نسبيًا باستخدام نماذج الرؤية التي تم تدريبها مسبقًا والتي تعلمت ميزات قابلة للتعميم من ملايين الصور. على سبيل المثال ، يمكن لشركة أمنية تكييف نموذج رؤية الكمبيوتر الذي تم تدريبه مسبقًا للكشف عن السلوك المشبوه في خلاصات المراقبة أو تحديد كائنات محددة ذات أهمية ، كل ذلك دون كميات هائلة من بيانات التدريب أو تطوير النموذج المتخصص.
معالجة اللغة الطبيعية (NLP)
تطبيق رئيسي لتعلم النقل هو تدريب نموذج للتعامل مع مهام NLP محددة. على سبيل المثال ، يمكن للشركة القانونية اختيار نموذج NLP المدربين مسبقًا كأساس لأداة تحليل المستندات ثم تعليم النموذج للتعامل مع المجالات القانونية المحددة باستخدام التعلم النقل.
التعرف على الكلام وتوليده
يستخدم التعلم النقل أيضًا لتدريب نماذج لتطبيقات الكلام المتخصصة. على سبيل المثال ، يمكن لمركز الاتصال تكييف نموذج الكلام المعمم لفهم المصطلحات الخاصة بالصناعة وإنشاء نظام خدمة عملاء تلقائي أكثر خصيصًا. مثال آخر هو استخدام TRANSFER LEARTH لتكييف نموذج أمر صوتي مدرب على مهام اللغة العامة للتعامل مع لهجات ولغات محددة.