التعلم الآلي 101: ما هو وكيف يعمل

نشرت: 2024-05-23

أصبح التعلم الآلي (ML) بسرعة أحد أهم التقنيات في عصرنا. وهو يشكل الأساس لمنتجات مثل ChatGPT وتوصيات Netflix والسيارات ذاتية القيادة ومرشحات البريد الإلكتروني العشوائي. ولمساعدتك على فهم هذه التكنولوجيا المنتشرة، يغطي هذا الدليل ماهية تعلم الآلة (وما لا يعنيه)، وكيفية عملها وتأثيرها.

جدول المحتويات

ما هو التعلم الآلي؟
كيف يعمل التعلم الآلي
نوع التعلم الآلي
التطبيقات
مزايا
سلبيات
مستقبل ML
خاتمة

ما هو التعلم الآلي؟

لفهم التعلم الآلي، يجب علينا أولاً أن نفهم الذكاء الاصطناعي (AI). على الرغم من أن الاثنين يتم استخدامهما بالتبادل، إلا أنهما ليسا متماثلين. الذكاء الاصطناعي هو هدف ومجال للدراسة. الهدف هو بناء أنظمة كمبيوتر قادرة على التفكير والاستدلال على المستوى البشري (أو حتى فوق طاقة البشر). يتكون الذكاء الاصطناعي أيضًا من العديد من الطرق المختلفة للوصول إلى هناك. يعد التعلم الآلي أحد هذه الأساليب، مما يجعله مجموعة فرعية من الذكاء الاصطناعي.

يركز التعلم الآلي بشكل خاص على استخدام البيانات والإحصاءات في السعي لتحقيق الذكاء الاصطناعي. الهدف هو إنشاء أنظمة ذكية يمكنها التعلم من خلال تغذيتها بالعديد من الأمثلة (البيانات) ولا تحتاج إلى برمجتها بشكل صريح. مع ما يكفي من البيانات وخوارزمية التعلم الجيدة، يلتقط الكمبيوتر الأنماط الموجودة في البيانات ويحسن أدائه.

في المقابل، لا تعتمد أساليب الذكاء الاصطناعي التي لا تعتمد على التعلم الآلي على البيانات ولديها منطق مشفر مكتوب. على سبيل المثال، يمكنك إنشاء روبوت ذكاء اصطناعي tic-tac-toe بأداء خارق عن طريق تشفير جميع الحركات المثالية (هناك 255.168 لعبة تيك تاك تو محتملة، لذا سيستغرق الأمر بعض الوقت، لكنه لا يزال ممكنًا). ومع ذلك، سيكون من المستحيل تشفير روبوت الذكاء الاصطناعي للشطرنج، فهناك ألعاب شطرنج محتملة أكثر من الذرات في الكون. سوف يعمل ML بشكل أفضل في مثل هذه الحالات.

والسؤال المعقول في هذه المرحلة هو، كيف يتحسن الكمبيوتر بالضبط عندما تعطيه أمثلة؟

كيف يعمل التعلم الآلي

في أي نظام تعلم الآلة، تحتاج إلى ثلاثة أشياء: مجموعة البيانات، ونموذج تعلم الآلة (GPT مثال)، وخوارزمية التدريب. أولاً، تقوم بتمرير أمثلة من مجموعة البيانات. ثم يتنبأ النموذج بالإخراج الصحيح لهذا المثال. إذا كان النموذج خاطئًا، فإنك تستخدم خوارزمية التدريب لزيادة احتمالية أن يكون النموذج صحيحًا لأمثلة مماثلة في المستقبل. تكرر هذه العملية حتى نفاد البيانات أو تصبح راضيًا عن النتائج. بمجرد الانتهاء من هذه العملية، يمكنك استخدام النموذج الخاص بك للتنبؤ بالبيانات المستقبلية.

أحد الأمثلة الأساسية لهذه العملية هو تعليم الكمبيوتر كيفية التعرف على الأرقام المكتوبة بخط اليد مثل تلك الموجودة أدناه.

مصدر

تقوم بجمع آلاف أو مئات الآلاف من صور الأرقام. عليك أن تبدأ بنموذج ML الذي لم يشاهد أي أمثلة حتى الآن. تقوم بإدخال الصور في النموذج وتطلب منه التنبؤ بالرقم الذي يعتقد أنه موجود في الصورة. سيُرجع رقمًا بين صفر وتسعة، مثلًا واحدًا. ثم تقول له بشكل أساسي: "هذا الرقم هو في الواقع خمسة، وليس واحدًا". تقوم خوارزمية التدريب بتحديث النموذج، لذلك من المرجح أن تستجيب بخمسة في المرة القادمة. تكرر هذه العملية مع جميع الصور المتاحة (تقريبًا)، ومن الناحية المثالية، يكون لديك نموذج جيد الأداء يمكنه التعرف على الأرقام بشكل صحيح بنسبة 90% من الوقت. يمكنك الآن استخدام هذا النموذج لقراءة ملايين الأرقام على نطاق واسع بشكل أسرع مما يستطيع الإنسان. ومن الناحية العملية، تستخدم خدمة البريد في الولايات المتحدة نماذج تعلم الآلة لقراءة 98% من العناوين المكتوبة بخط اليد.

يمكنك قضاء أشهر أو سنوات في تحليل التفاصيل حتى لجزء صغير من هذه العملية (انظر إلى عدد الإصدارات المختلفة لخوارزميات التحسين الموجودة).

الأنواع الشائعة للتعلم الآلي

هناك في الواقع أربعة أنواع مختلفة من أساليب التعلم الآلي: الخاضعة للإشراف، وغير الخاضعة للإشراف، وشبه الخاضعة للإشراف، والتعزيز. والفرق الرئيسي هو كيفية تسمية بياناتهم (أي مع أو بدون الإجابة الصحيحة).

التعلم تحت الإشراف

يتم إعطاء نماذج التعلم الخاضعة للإشراف بيانات مصنفة (مع الإجابات الصحيحة). يندرج مثال الأرقام المكتوبة بخط اليد ضمن هذه الفئة: يمكننا أن نقول للنموذج: "خمسة هي الإجابة الصحيحة". يهدف النموذج إلى معرفة الروابط الواضحة بين المدخلات والمخرجات. يمكن لهذه النماذج أن تنتج إما تسميات منفصلة (على سبيل المثال، توقع إما "قطة" أو "كلب" بالنظر إلى صورة حيوان أليف) أو أرقام (على سبيل المثال، السعر المتوقع للمنزل بالنظر إلى عدد الأسرة والحمامات والموقع وما إلى ذلك) .

تعليم غير مشرف عليه

يتم إعطاء نماذج التعلم غير الخاضعة للرقابة بيانات غير مصنفة (بدون إجابات صحيحة). تحدد هذه النماذج الأنماط في البيانات المدخلة لتجميع البيانات بشكل مفيد. على سبيل المثال، بالنظر إلى العديد من صور القطط والكلاب دون إجابة صحيحة، فإن نموذج تعلم الآلة غير الخاضع للرقابة سيبحث في أوجه التشابه والاختلاف في الصور لتجميع صور الكلاب والقطط معًا. يعد التجميع وقواعد الارتباط وتقليل الأبعاد من الأساليب الأساسية في تعلم الآلة غير الخاضع للرقابة.

التعلم شبه الخاضع للإشراف

التعلم شبه الخاضع للإشراف هو نهج للتعلم الآلي يقع بين التعلم الخاضع للإشراف وغير الخاضع للإشراف. توفر هذه الطريقة كمية كبيرة من البيانات غير المسماة ومجموعة أصغر من البيانات المسماة لتدريب النموذج. أولاً، يتم تدريب النموذج على البيانات المسماة، ثم يقوم بتعيين تسميات للبيانات غير المسماة من خلال مقارنة تشابهها مع البيانات المسماة.

تعزيز التعلم

لا يحتوي التعلم المعزز على مجموعة معينة من الأمثلة والتسميات. وبدلاً من ذلك، يتم منح النموذج بيئة (على سبيل المثال، الألعاب شائعة)، ووظيفة المكافأة، والهدف. يتعلم النموذج تحقيق الهدف عن طريق التجربة والخطأ. سوف يقوم بإجراء ما، وتخبره وظيفة المكافأة إذا كان الإجراء يساعد في تحقيق الهدف الشامل. بعد ذلك، يقوم النموذج بتحديث نفسه للقيام بأكثر أو أقل من هذا الإجراء. يمكن للنموذج أن يتعلم كيفية تحقيق الهدف من خلال القيام بذلك عدة مرات.

أحد الأمثلة الشهيرة لنموذج التعلم المعزز هو AlphaGo Zero. تم تدريب هذا النموذج للفوز بألعاب Go وتم إعطاؤه فقط حالة لوحة Go. ثم لعبت ملايين الألعاب ضد نفسها، وتعلمت بمرور الوقت أي الحركات أعطتها المزايا وأيها لم تمنحها المزايا. لقد حققت أداءً خارقًا على مستوى البشر خلال 70 ساعة من التدريب، متفوقة على أبطال العالم في لعبة Go.

التعلم الخاضع للإشراف الذاتي

يوجد في الواقع نوع خامس من التعلم الآلي الذي أصبح مهمًا مؤخرًا: التعلم الخاضع للإشراف الذاتي. يتم إعطاء نماذج التعلم الخاضعة للإشراف الذاتي بيانات غير مصنفة ولكنها تتعلم كيفية إنشاء تسميات من هذه البيانات. وهذا هو الأساس لنماذج GPT وراء ChatGPT. أثناء تدريب GPT، يهدف النموذج إلى التنبؤ بالكلمة التالية بالنظر إلى سلسلة إدخال من الكلمات. على سبيل المثال، خذ الجملة "جلست القطة على السجادة". يُعطى GPT "The" ويطلب منه توقع الكلمة التالية. إنه يتنبأ (على سبيل المثال، "كلب")، ولكن بما أنه يحتوي على الجملة الأصلية، فإنه يعرف ما هي الإجابة الصحيحة: "قطة". بعد ذلك، يُعطى GPT "القط" ويطلب منه التنبؤ بالكلمة التالية، وهكذا. ومن خلال القيام بذلك، يمكنه تعلم الأنماط الإحصائية بين الكلمات والمزيد.

تطبيقات التعلم الآلي

يمكن لأي مشكلة أو صناعة بها الكثير من البيانات استخدام التعلم الآلي. لقد شهدت العديد من الصناعات نتائج غير عادية من خلال القيام بذلك، وتظهر المزيد من حالات الاستخدام باستمرار. فيما يلي بعض حالات الاستخدام الشائعة لـ ML:

كتابة

تعمل نماذج ML على تشغيل منتجات الكتابة المولدة بالذكاء الاصطناعي مثل Grammarly. من خلال التدريب على كميات كبيرة من الكتابة الرائعة، يمكن لـ Grammarly إنشاء مسودة لك، ومساعدتك في إعادة الكتابة وصقلها، وتبادل الأفكار معك، كل ذلك بالأسلوب والأسلوب المفضل لديك.

اعمل بشكل أكثر ذكاءً مع Grammarly

شريك الكتابة بالذكاء الاصطناعي لأي شخص لديه عمل للقيام به

التعرف على الكلام

يعتمد كل من Siri وAlexa والإصدار الصوتي من ChatGPT على نماذج ML. يتم تدريب هذه النماذج على العديد من الأمثلة الصوتية، إلى جانب النصوص الصحيحة المقابلة. باستخدام هذه الأمثلة، يمكن للنماذج تحويل الكلام إلى نص. بدون تعلم الآلة، ستكون هذه المشكلة مستعصية على الحل تقريبًا لأن كل شخص لديه طرق مختلفة في التحدث والنطق. سيكون من المستحيل تعداد كل الاحتمالات.

التوصيات

خلف خلاصاتك على TikTok وNetflix وInstagram وAmazon توجد نماذج توصية لتعلم الآلة. يتم تدريب هذه النماذج على العديد من أمثلة التفضيلات (على سبيل المثال، الأشخاص مثلك أعجبوا بهذا الفيلم على هذا الفيلم، وهذا المنتج على هذا المنتج) لتظهر لك العناصر والمحتوى الذي تريد رؤيته. وبمرور الوقت، يمكن للنماذج أيضًا دمج تفضيلاتك المحددة لإنشاء موجز يروق لك على وجه التحديد.

الكشف عن الغش

تستخدم البنوك نماذج ML للكشف عن الاحتيال على بطاقات الائتمان. يستخدم موفرو البريد الإلكتروني نماذج ML لاكتشاف البريد الإلكتروني العشوائي وتحويله. تُعطى نماذج تعلم الآلة الاحتيالية العديد من الأمثلة على البيانات الاحتيالية؛ ثم تتعلم هذه النماذج الأنماط بين البيانات لتحديد الاحتيال في المستقبل.

سيارات ذاتية القيادة

تستخدم السيارات ذاتية القيادة التعلم الآلي لتفسير الطرق والتنقل فيها. يساعد التعلم الآلي السيارات على تحديد المشاة وحارات الطريق، والتنبؤ بحركة السيارات الأخرى، وتحديد الإجراء التالي (على سبيل المثال، السرعة، تبديل الممرات، وما إلى ذلك). تكتسب السيارات ذاتية القيادة الكفاءة من خلال التدريب على مليارات الأمثلة باستخدام أساليب التعلم الآلي هذه.

مزايا التعلم الآلي

عندما يتم تنفيذه بشكل جيد، يمكن أن يكون تعلم الآلة تحويليًا. يمكن لنماذج ML بشكل عام أن تجعل العمليات أرخص أو أفضل أو كليهما.

كفاءة تكلفة العمالة

يمكن لنماذج تعلم الآلة المدربة محاكاة عمل الخبير مقابل جزء بسيط من التكلفة. على سبيل المثال، يتمتع سمسار العقارات الخبير البشري بحدس كبير عندما يتعلق الأمر بتكلفة المنزل، ولكن قد يستغرق ذلك سنوات من التدريب. كما أن توظيف السماسرة الخبراء (والخبراء من أي نوع) مكلف أيضًا. ومع ذلك، فإن نموذج التعلم الآلي الذي تم تدريبه على ملايين الأمثلة يمكن أن يقترب من أداء سمسار عقارات خبير. يمكن تدريب مثل هذا النموذج في غضون أيام وستكون تكلفة استخدامه أقل بكثير بعد التدريب. يمكن للوسطاء العقاريين الأقل خبرة استخدام هذه النماذج للقيام بمزيد من العمل في وقت أقل.

كفاءة الوقت

نماذج ML ليست مقيدة بالوقت بنفس الطريقة التي يكون بها البشر. لعب AlphaGo Zero4.9 مليون مباراةمن لعبة Go خلال ثلاثة أيام من التدريب . وهذا سيستغرق سنوات بشرية، إن لم يكن عقودًا، للقيام به. وبسبب قابلية التوسع هذه، كان النموذج قادرًا على استكشاف مجموعة واسعة من حركات Go ومواضعها، مما أدى إلى أداء خارق. يمكن لنماذج تعلم الآلة أن تلتقط الأنماط التي يفتقدها الخبراء؛ حتى أن AlphaGo Zero عثر واستخدم حركات لا يلعبها البشر عادةً. هذا لا يعني أن الخبراء لم يعودوا ذوي قيمة؛ لقد تحسن خبراء Go كثيرًا باستخدام نماذج مثل AlphaGo لتجربة استراتيجيات جديدة.

عيوب التعلم الآلي

بالطبع، هناك أيضًا جوانب سلبية لاستخدام نماذج تعلم الآلة. أي أن تدريبها مكلف، ولا يمكن تفسير نتائجها بسهولة.

تدريب باهظ الثمن

يمكن أن يصبح التدريب على تعلم الآلة باهظ الثمن. على سبيل المثال، كلف تطوير AlphaGo Zero 25 مليون دولار، وكلف تطوير GPT-4 أكثر من 100 مليون دولار. التكاليف الرئيسية لتطوير نماذج تعلم الآلة هي تصنيف البيانات، ونفقات الأجهزة، ورواتب الموظفين.

تتطلب نماذج تعلم الآلة الرائعة الخاضعة للإشراف الملايين من الأمثلة المصنفة، والتي يجب أن يتم تصنيف كل منها بواسطة الإنسان. بمجرد جمع كافة الملصقات، ستكون هناك حاجة إلى أجهزة متخصصة لتدريب النموذج. تعد وحدات معالجة الرسومات (GPUs) ووحدات معالجة الموتر (TPUs) هي المعيار لأجهزة ML ويمكن أن يكون استئجارها أو شرائها مكلفًا - يمكن أن تكلف وحدات معالجة الرسومات ما بين آلاف وعشرات الآلاف من الدولارات للشراء.

وأخيرًا، يتطلب تطوير نماذج تعلم الآلة الممتازة توظيف باحثين أو مهندسين في مجال تعلم الآلة، والذين يمكنهم المطالبة برواتب عالية نظرًا لمهاراتهم وخبراتهم.

محدودية الوضوح في اتخاذ القرار

بالنسبة للعديد من نماذج تعلم الآلة، ليس من الواضح سبب تقديم النتائج التي يقدمونها. لا يستطيع برنامج AlphaGo Zero تفسير السبب الكامن وراء اتخاذه للقرار؛ فهي تعلم أن هذه الخطوة ستنجح في موقف محدد ولكن ليسالسبب. يمكن أن يكون لهذا عواقب وخيمة عند استخدام نماذج التعلم الآلي في مواقف الحياة اليومية. قد تعطي نماذج التعلم الآلي المستخدمة في الرعاية الصحية نتائج غير صحيحة أو متحيزة، وقد لا نعرفها لأن السبب وراء نتائجها غير واضح. يشكل التحيز، بشكل عام، مصدر قلق كبير في نماذج تعلم الآلة، كما أن الافتقار إلى إمكانية التفسير يجعل التعامل مع المشكلة أكثر صعوبة. تنطبق هذه المشكلات بشكل خاص على نماذج التعلم العميق. نماذج التعلم العميق هي نماذج تعلم الآلة التي تستخدم شبكات عصبية متعددة الطبقات لمعالجة المدخلات. إنهم قادرون على التعامل مع البيانات والأسئلة الأكثر تعقيدًا.

من ناحية أخرى، فإن نماذج تعلم الآلة الأبسط والأكثر "سطحية" (مثل أشجار القرار ونماذج الانحدار) لا تعاني من نفس العيوب. ما زالوا بحاجة إلى الكثير من البيانات ولكن تدريبهم على خلاف ذلك رخيص. كما أنها أكثر قابلية للتفسير. الجانب السلبي هو أن مثل هذه النماذج يمكن أن تكون محدودة في الفائدة؛ تتطلب التطبيقات المتقدمة مثل GPT نماذج أكثر تعقيدًا.

مستقبل التعلم الآلي

كانت نماذج تعلم الآلة المبنية على المحولات رائجة للغاية خلال السنوات القليلة الماضية. هذا هو نوع نموذج ML المحدد الذي يدعم GPT (T في GPT)، وGrammarly، وClaude AI. وقد حظيت نماذج تعلم الآلة القائمة على الانتشار، والتي تعمل على تشغيل منتجات إنشاء الصور مثل DALL-E وMidjourney، بالاهتمام أيضًا.

ولا يبدو أن هذا الاتجاه سيتغير في أي وقت قريب. تركز شركات تعلم الآلة على زيادة حجم نماذجها، وهي نماذج أكبر تتمتع بقدرات أفضل ومجموعات بيانات أكبر لتدريبها عليها. يحتوي GPT-4 على 10 أضعاف عدد معلمات النموذج التي يمتلكها GPT-3، على سبيل المثال. من المحتمل أن نرى المزيد من الصناعات تستخدم الذكاء الاصطناعي التوليدي في منتجاتها لإنشاء تجارب مخصصة للمستخدمين.

الروبوتات تسخن أيضًا. يستخدم الباحثون تعلم الآلة لإنشاء روبوتات يمكنها تحريك واستخدام الأشياء مثل البشر. يمكن لهذه الروبوتات إجراء التجارب في بيئتها واستخدام التعلم المعزز للتكيف بسرعة وتحقيق أهدافها، على سبيل المثال، كيفية ركل كرة القدم.

ومع ذلك، نظرًا لأن نماذج تعلم الآلة أصبحت أكثر قوة وانتشارًا، فهناك مخاوف بشأن تأثيرها المحتمل على المجتمع. وتشهد قضايا مثل التحيز، والخصوصية، وإزاحة الوظائف مناقشات ساخنة، وهناك اعتراف متزايد بالحاجة إلى مبادئ توجيهية أخلاقية وممارسات تنمية مسؤولة.

خاتمة

التعلم الآلي هو مجموعة فرعية من الذكاء الاصطناعي، بهدف واضح هو إنشاء أنظمة ذكية من خلال السماح لها بالتعلم من البيانات. يعد التعلم الخاضع للإشراف وغير الخاضع للإشراف وشبه الخاضع للإشراف والتعزيز الأنواع الرئيسية لتعلم الآلة (جنبًا إلى جنب مع التعلم الخاضع للإشراف الذاتي). يعد التعلم الآلي هو جوهر العديد من المنتجات الجديدة التي يتم طرحها اليوم، مثل ChatGPT والسيارات ذاتية القيادة وتوصيات Netflix. يمكن أن يكون أرخص أو أفضل من الأداء البشري، لكنه في الوقت نفسه مكلف في البداية وأقل قابلية للتفسير والتوجيه. ومن المتوقع أيضًا أن ينمو تعلم الآلة بشكل أكثر شعبية خلال السنوات القليلة المقبلة.

هناك الكثير من التعقيدات في تعلم الآلة، وتتزايد فرص التعلم والمساهمة في هذا المجال. على وجه الخصوص، يمكن أن تساعدك أدلة Grammarly حول الذكاء الاصطناعي والتعلم العميق وChatGPT على معرفة المزيد حول الأجزاء المهمة الأخرى في هذا المجال. أبعد من ذلك، فإن الدخول في تفاصيل تعلم الآلة (مثل كيفية جمع البيانات، والنماذج التي تبدو في الواقع، والخوارزميات وراء "التعلم") يمكن أن يساعدك على دمجها بشكل فعال في عملك.

مع استمرار نمو التعلم الآلي - ومع توقع أنه سيمس كل الصناعات تقريبًا - فقد حان الوقت لبدء رحلة تعلم الآلة!