الشبكات العصبية: كل ما يجب أن تعرفه
نشرت: 2024-06-26في هذه المقالة، سوف نتعمق في عالم الشبكات العصبية، ونستكشف أعمالها الداخلية وأنواعها وتطبيقاتها والتحديات التي تواجهها.
جدول المحتويات
- ما هي الشبكة العصبية؟
- كيف يتم هيكلة الشبكات العصبية
- كيف تعمل الشبكات العصبية
- كيف تولد الشبكات العصبية الإجابات
- أنواع الشبكات العصبية
- التطبيقات
- التحديات
- مستقبل الشبكات العصبية
- خاتمة
ما هي الشبكة العصبية؟
الشبكة العصبية هي نوع من نماذج التعلم العميق ضمن المجال الأوسع للتعلم الآلي (ML) الذي يحاكي الدماغ البشري. يقوم بمعالجة البيانات من خلال عقد مترابطة أو خلايا عصبية مرتبة في طبقات – المدخلات والمخفية والمخرجات. تقوم كل عقدة بإجراء حسابات بسيطة، مما يساهم في قدرة النموذج على التعرف على الأنماط وإجراء التنبؤات.
تعتبر الشبكات العصبية للتعلم العميق فعالة بشكل خاص في التعامل مع المهام المعقدة مثل التعرف على الصور والكلام، وتشكل عنصرًا حاسمًا في العديد من تطبيقات الذكاء الاصطناعي. أدت التطورات الحديثة في بنيات الشبكات العصبية وتقنيات التدريب إلى تعزيز قدرات أنظمة الذكاء الاصطناعي بشكل كبير.
كيف يتم هيكلة الشبكات العصبية
كما هو واضح من اسمه، فإن نموذج الشبكة العصبية مستوحى من الخلايا العصبية، وهي اللبنات الأساسية للدماغ. لدى البشر البالغين حوالي 85 مليار خلية عصبية، كل منها متصل بحوالي 1000 خلية أخرى. تتحدث إحدى خلايا الدماغ إلى أخرى عن طريق إرسال مواد كيميائية تسمى الناقلات العصبية. إذا حصلت الخلية المستقبلة على ما يكفي من هذه المواد الكيميائية، فإنها تستثار وترسل المواد الكيميائية الخاصة بها إلى خلية أخرى.
الوحدة الأساسية لما يسمى أحيانًا بالشبكة العصبية الاصطناعية (ANN) هيالعقدة، والتي بدلاً من أن تكون خلية، هي وظيفة رياضية. تمامًا مثل الخلايا العصبية، فإنها تتواصل مع العقد الأخرى إذا حصلت على ما يكفي من المدخلات.
هذا هو المكان الذي تنتهي فيه أوجه التشابه. يتم تنظيم الشبكات العصبية بشكل أبسط بكثير من الدماغ، مع طبقات محددة بدقة: الإدخال، والمخفية، والمخرجات. تسمى مجموعة من هذه الطبقاتبالنموذج.إنهم يتعلمون أويتدربونمن خلال المحاولة المتكررة لتوليد مخرجات مصطنعة تشبه إلى حد كبير النتائج المرجوة. (المزيد عن ذلك في دقيقة واحدة.)
طبقات الإدخال والإخراج واضحة بذاتها. معظم ما تفعله الشبكات العصبية يحدث في الطبقات المخفية. عندما يتم تنشيط العقدة عن طريق الإدخال من الطبقة السابقة، فإنها تقوم بإجراء حساباتها وتقرر ما إذا كان سيتم تمرير المخرجات إلى العقد في الطبقة التالية. تمت تسمية هذه الطبقات بهذا الاسم لأن عملياتها غير مرئية للمستخدم النهائي، على الرغم من وجود تقنيات للمهندسين لمعرفة ما يحدث في ما يسمى بالطبقات المخفية.
عندما تشتمل الشبكات العصبية على طبقات مخفية متعددة، فإنها تسمى شبكات التعلم العميق. عادةً ما تحتوي الشبكات العصبية العميقة الحديثة على عدة طبقات، بما في ذلك الطبقات الفرعية المتخصصة التي تؤدي وظائف متميزة. على سبيل المثال، تعمل بعض الطبقات الفرعية على تعزيز قدرة الشبكة على النظر في المعلومات السياقية بما يتجاوز المدخلات المباشرة التي يتم تحليلها.
كيف تعمل الشبكات العصبية
فكر في كيفية تعلم الأطفال. إنهم يحاولون شيئًا ما، ويفشلون، ثم يحاولون مرة أخرى بطريقة مختلفة. تستمر الحلقة مرارًا وتكرارًا حتى يتقنوا السلوك. هذه هي الطريقة التي تتعلم بها الشبكات العصبية أيضًا.
في بداية تدريبها، تقوم الشبكات العصبية بتخمينات عشوائية. تقرر العقد الموجودة في طبقة الإدخال بشكل عشوائي أي من العقد في الطبقة المخفية الأولى سيتم تنشيطها، ثم تقوم تلك العقد بتنشيط العقد بشكل عشوائي في الطبقة التالية، وهكذا، حتى تصل هذه العملية العشوائية إلى طبقة الإخراج. (تحتوي النماذج اللغوية الكبيرة مثل GPT-4 على حوالي 100 طبقة، مع عشرات أو مئات الآلاف من العقد في كل طبقة.)
مع الأخذ في الاعتبار كل هذه العشوائية، يقارن النموذج نتائجه - وهو أمر فظيع على الأرجح - ويكتشف مدى الخطأ. ثم يقوم بعد ذلك بضبط اتصال كل عقدة بالعقد الأخرى، مما يغير مدى تعرضها للتنشيط بدرجة أكبر أو أقل بناءً على مدخلات معينة. ويقوم بذلك بشكل متكرر حتى تصبح مخرجاته قريبة من الإجابات المطلوبة.
إذًا، كيف تعرف الشبكات العصبية ما يفترض أن تفعله؟ يمكن تقسيم التعلم الآلي إلى أساليب مختلفة، بما في ذلك التعلم الخاضع للإشراف وغير الخاضع للإشراف. في التعلم الخاضع للإشراف، يتم تدريب النموذج على البيانات التي تتضمن تسميات أو إجابات صريحة، مثل الصور المقترنة بنص وصفي. ومع ذلك، يتضمن التعلم غير الخاضع للرقابة تزويد النموذج ببيانات غير مصنفة، مما يسمح له بتحديد الأنماط والعلاقات بشكل مستقل.
أحد المكملات الشائعة لهذا التدريب هو التعلم المعزز، حيث يتحسن النموذج استجابةً للتغذية الراجعة. في كثير من الأحيان، يتم توفير ذلك بواسطة مقيمين بشريين (إذا قمت بالنقر فوق إبهام لأعلى أو إبهام لأسفل لاقتراح جهاز كمبيوتر، فقد ساهمت في التعلم المعزز). ومع ذلك، هناك طرق للنماذج للتعلم بشكل مستقل أيضًا.
من الدقيق والمفيد التفكير في مخرجات الشبكة العصبية كتنبؤ. سواء في تقييم الجدارة الائتمانية أو إنشاء أغنية، تعمل نماذج الذكاء الاصطناعي من خلال تخمين ما هو على الأرجح صحيح. الذكاء الاصطناعي التوليدي، مثل ChatGPT، يأخذ التنبؤ خطوة إلى الأمام. إنه يعمل بشكل تسلسلي، ويخمن ما يجب أن يأتي بعد الإخراج الذي قام به للتو. (سنتعرف على سبب كون ذلك مشكلة لاحقًا.)
كيف تولد الشبكات العصبية الإجابات
بمجرد تدريب الشبكة، كيف يمكنها معالجة المعلومات التي تراها للتنبؤ بالاستجابة الصحيحة؟ عندما تكتب مطالبة مثل "أخبرني قصة عن الجنيات" في واجهة ChatGPT، كيف يقرر ChatGPT كيفية الرد؟
الخطوة الأولى هي أن تقوم طبقة الإدخال في الشبكة العصبية بتقسيم المطالبة إلى أجزاء صغيرة من المعلومات، تُعرف باسمالرموز المميزة. بالنسبة لشبكة التعرف على الصور، قد تكون الرموز المميزة عبارة عن وحدات بكسل. بالنسبة للشبكة التي تستخدم معالجة اللغة الطبيعية (NLP)، مثل ChatGPT، يكون الرمز عادةً كلمة أو جزءًا من كلمة أو عبارة قصيرة جدًا.
بمجرد قيام الشبكة بتسجيل الرموز المميزة في الإدخال، يتم تمرير هذه المعلومات عبر الطبقات المخفية التي تم تدريبها مسبقًا. تقوم العقد التي تنتقل من طبقة إلى الطبقة التالية بتحليل أقسام أكبر وأكبر من المدخلات. بهذه الطريقة، يمكن لشبكة البرمجة اللغوية العصبية في النهاية تفسير جملة أو فقرة كاملة، وليس مجرد كلمة أو حرف.
الآن يمكن للشبكة أن تبدأ في صياغة استجابتها، وهو ما تفعله كسلسلة من التنبؤات كلمة بكلمة لما سيأتي بعد ذلك بناءً على كل ما تم تدريبها عليه.
فكر في المطالبة "أخبرني قصة عن الجنيات". لتوليد استجابة، تقوم الشبكة العصبية بتحليل المطالبة للتنبؤ بالكلمة الأولى الأكثر احتمالاً. على سبيل المثال، قد يحدد أن هناك احتمالًا بنسبة 80% أن يكون "The" هو الخيار الأفضل، وفرصة 10% لـ "A"، وفرصة 10% لـ "مرة واحدة". ثم يقوم بعد ذلك باختيار رقم بشكل عشوائي: إذا كان الرقم بين 1 و8، فإنه يختار "The"؛ إذا كان 9، فإنه يختار "أ"؛ وإذا كان الرقم 10، فإنه يختار "مرة واحدة". لنفترض أن الرقم العشوائي هو 4، والذي يتوافق مع "The." تقوم الشبكة بعد ذلك بتحديث المطالبة إلى "أخبرني قصة عن الجنيات. "" ويكرر العملية للتنبؤ بالكلمة التالية التي تلي "". تستمر هذه الدورة، مع توقع كل كلمة جديدة بناءً على المطالبة المحدثة، حتى يتم إنشاء قصة كاملة.
ستجعل الشبكات المختلفة هذا التنبؤ مختلفًا. على سبيل المثال، قد يحاول نموذج التعرف على الصور التنبؤ بالملصق الذي يجب إعطاؤه لصورة كلب وتحديد أن هناك احتمالًا بنسبة 70% أن يكون التصنيف الصحيح هو "مختبر الشوكولاتة"، و20% "الذليل الإنجليزي"، و10%. لـ "المسترد الذهبي". في حالة التصنيف، بشكل عام، ستختار الشبكة الخيار الأكثر ترجيحًا بدلاً من التخمين الاحتمالي.
أنواع الشبكات العصبية
فيما يلي نظرة عامة على الأنواع المختلفة للشبكات العصبية وكيفية عملها.
- الشبكات العصبية المغذية (FNNs):في هذه النماذج، تتدفق المعلومات في اتجاه واحد: من طبقة الإدخال، عبر الطبقات المخفية، وأخيرًا إلى طبقة الإخراج. يعد هذا النوع من النماذج هو الأفضل لمهام التنبؤ الأبسط، مثل اكتشاف الاحتيال في بطاقة الائتمان.
- الشبكات العصبية المتكررة (RNNs):على عكس الشبكات العصبية المتكررة، تأخذ شبكات RNN في الاعتبار المدخلات السابقة عند إنشاء التنبؤ. وهذا يجعلها مناسبة تمامًا لمهام معالجة اللغة نظرًا لأن نهاية الجملة التي يتم إنشاؤها استجابةً للموجه تعتمد على كيفية بدء الجملة.
- شبكات الذاكرة الطويلة قصيرة المدى (LSTMs):تنسى شبكات الذاكرة طويلة المدى المعلومات بشكل انتقائي، مما يسمح لها بالعمل بكفاءة أكبر. وهذا أمر بالغ الأهمية لمعالجة كميات كبيرة من النص؛ على سبيل المثال، اعتمدت ترقية Google Translate لعام 2016 إلى الترجمة الآلية العصبية على LSTMs.
- الشبكات العصبية التلافيفية (CNNs):تعمل الشبكات العصبية التلافيفية بشكل أفضل عند معالجة الصور. يستخدمونطبقات تلافيفيةلمسح الصورة بأكملها والبحث عن ميزات مثل الخطوط أو الأشكال. يتيح ذلك لشبكات CNN مراعاة الموقع المكاني، مثل تحديد ما إذا كان الكائن موجودًا في النصف العلوي أو السفلي من الصورة، وكذلك تحديد الشكل أو نوع الكائن بغض النظر عن موقعه.
- شبكات الخصومة التوليدية (GANs):غالبًا ما تُستخدم شبكات GAN لإنشاء صور جديدة بناءً على وصف أو صورة موجودة. لقد تم تصميمها كمنافسة بين شبكتين عصبيتين: شبكةالمولدات، التي تحاول خداع الشبكةالتمييزيةللاعتقاد بأن المدخلات المزيفة حقيقية.
- المحولات وشبكات الانتباه:المحولات مسؤولة عن الانفجار الحالي في قدرات الذكاء الاصطناعي. تتضمن هذه النماذج تسليط الضوء على الانتباه الذي يسمح لها بتصفية مدخلاتها للتركيز على العناصر الأكثر أهمية، وكيفية ارتباط هذه العناصر ببعضها البعض، حتى عبر صفحات النص. يمكن للمحولات أيضًا أن تتدرب على كميات هائلة من البيانات، لذلك تسمى النماذج مثل ChatGPT وGemini بنماذج اللغة الكبيرة (LLMs).
تطبيقات الشبكات العصبية
هناك الكثير مما لا يمكن إدراجه، لذا إليك مجموعة مختارة من الطرق التي تُستخدم بها الشبكات العصبية اليوم، مع التركيز على اللغة الطبيعية.
المساعدة في الكتابة:لقد غيرت المحولات الطريقة التي يمكن بها لأجهزة الكمبيوتر مساعدة الأشخاص على الكتابة بشكل أفضل. توفر أدوات الكتابة المدعمة بالذكاء الاصطناعي، مثل Grammarly، إمكانية إعادة كتابة الجملة والفقرة لتحسين النغمة والوضوح. لقد أدى هذا النوع من النماذج أيضًا إلى تحسين سرعة ودقة الاقتراحات النحوية الأساسية. تعرف على المزيد حول كيفية استخدام Grammarly للذكاء الاصطناعي.
إنشاء المحتوى:إذا كنت قد استخدمت ChatGPT أو DALL-E، فقد قمت بتجربة الذكاء الاصطناعي التوليدي بشكل مباشر. لقد أحدثت المحولات ثورة في قدرة أجهزة الكمبيوتر على إنشاء وسائط لها صدى لدى البشر، بدءًا من قصص ما قبل النوم وحتى العروض المعمارية الواقعية.
التعرف على الكلام:تتحسن أجهزة الكمبيوتر يومًا بعد يوم في التعرف على الكلام البشري. ومع التكنولوجيات الأحدث التي تسمح لهم بدراسة المزيد من السياق، أصبحت النماذج دقيقة بشكل متزايد في التعرف على ما ينوي المتحدث قوله، حتى لو كان للأصوات وحدها تفسيرات متعددة.
التشخيص والبحث الطبي:تتفوق الشبكات العصبية في اكتشاف الأنماط وتصنيفها، والتي تُستخدم بشكل متزايد لمساعدة الباحثين ومقدمي الرعاية الصحية على فهم الأمراض ومعالجتها. على سبيل المثال، علينا أن نشكر الذكاء الاصطناعي جزئيًا على التطور السريع للقاحات كوفيد-19.
تحديات وقيود الشبكات العصبية
فيما يلي نظرة سريعة على بعض المشكلات التي تثيرها الشبكات العصبية، وليس كلها.
التحيز:لا يمكن للشبكة العصبية أن تتعلم إلا مما يقال لها. إذا تعرض لمحتوى جنسي أو عنصري، فمن المحتمل أن يكون إنتاجه متحيزًا جنسيًا أو عنصريًا أيضًا. يمكن أن يحدث هذا عند الترجمة من لغة غير مرتبطة بالجنس إلى لغة جنسانية، حيث تستمر القوالب النمطية دون تحديد جنساني واضح.
التجهيز الزائد:يمكن للنموذج الذي تم تدريبه بشكل غير صحيح أن يقرأ الكثير من البيانات المقدمة له ويواجه صعوبة في التعامل مع المدخلات الجديدة. على سبيل المثال، قد يكون أداء برامج التعرف على الوجه، التي يتم تدريبها في الغالب على أشخاص من عرق معين، سيئًا مع الوجوه من أعراق أخرى. أو قد يفتقد عامل تصفية البريد العشوائي مجموعة متنوعة جديدة من البريد غير الهام لأنه يركز بشكل كبير على الأنماط التي شاهدها من قبل.
الهلوسة:يستخدم الكثير من الذكاء الاصطناعي التوليدي اليوم الاحتمالات إلى حد ما لاختيار ما سيتم إنتاجه بدلاً من اختيار الاختيار الأعلى دائمًا. يساعد هذا الأسلوب على أن يكون أكثر إبداعًا وينتج نصًا يبدو أكثر طبيعية، ولكنه قد يؤدي أيضًا إلى الإدلاء بعبارات خاطئة. (وهذا أيضًا هو السبب الذي يجعل طلاب ماجستير القانون في بعض الأحيان يخطئون في الرياضيات الأساسية.) لسوء الحظ، يصعب اكتشاف هذه الهلوسة إلا إذا كنت تعرف بشكل أفضل أو تتحقق من مصادر أخرى.
قابلية التفسير:غالبًا ما يكون من المستحيل معرفة كيفية عمل الشبكة العصبية للتنبؤات. في حين أن هذا قد يكون محبطًا من وجهة نظر شخص يحاول تحسين النموذج، إلا أنه قد يكون له أيضًا عواقب، حيث يتم الاعتماد بشكل متزايد على الذكاء الاصطناعي لاتخاذ القرارات التي تؤثر بشكل كبير على حياة الناس. بعض النماذج المستخدمة اليوم لا تعتمد على الشبكات العصبية على وجه التحديد لأن منشئيها يريدون أن يكونوا قادرين على فحص وفهم كل مرحلة من مراحل العملية.
الملكية الفكرية:يعتقد الكثيرون أن LLMs تنتهك حقوق الطبع والنشر من خلال دمج الكتابة والأعمال الفنية الأخرى دون إذن. على الرغم من أنها لا تميل إلى إعادة إنتاج الأعمال المحمية بحقوق الطبع والنشر بشكل مباشر، فمن المعروف أن هذه النماذج تنشئ صورًا أو عبارات من المحتمل أن تكون مستمدة من فنانين محددين أو حتى تنشئ أعمالًا بأسلوب مميز للفنان عند الطلب.
استهلاك الطاقة:كل هذا التدريب وتشغيل نماذج المحولات يستخدم طاقة هائلة. في الواقع، في غضون سنوات قليلة، يمكن أن يستهلك الذكاء الاصطناعي نفس القدر من الطاقة التي تستهلكها السويد أو الأرجنتين. وهذا يسلط الضوء على الأهمية المتزايدة للنظر في مصادر الطاقة وكفاءتها في تطوير الذكاء الاصطناعي.
مستقبل الشبكات العصبية
من المعروف أن التنبؤ بمستقبل الذكاء الاصطناعي أمر بالغ الصعوبة. في عام 1970، توقع أحد كبار الباحثين في مجال الذكاء الاصطناعي أنه “في غضون ثلاث إلى ثماني سنوات، سيكون لدينا آلة تتمتع بالذكاء العام للإنسان العادي”. (ما زلنا غير قريبين جدًا من الذكاء العام الاصطناعي (AGI). على الأقل معظم الناس لا يعتقدون ذلك.)
ومع ذلك، يمكننا أن نشير إلى بعض الاتجاهات التي يجب الانتباه إليها. ومن شأن النماذج الأكثر كفاءة أن تقلل من استهلاك الطاقة وتشغيل شبكات عصبية أكثر قوة مباشرة على أجهزة مثل الهواتف الذكية. يمكن أن تسمح تقنيات التدريب الجديدة بتنبؤات أكثر فائدة مع بيانات تدريب أقل. يمكن أن يؤدي التقدم في قابلية التفسير إلى زيادة الثقة وتمهيد مسارات جديدة لتحسين مخرجات الشبكة العصبية. وأخيرا، فإن الجمع بين الحوسبة الكمومية والشبكات العصبية يمكن أن يؤدي إلى ابتكارات لا يمكننا إلا أن نبدأ في تخيلها.
خاتمة
تعتبر الشبكات العصبية، المستوحاة من بنية ووظيفة الدماغ البشري، أساسية للذكاء الاصطناعي الحديث. إنهم يتفوقون في مهام التعرف على الأنماط والتنبؤ، مما يدعم العديد من تطبيقات الذكاء الاصطناعي اليوم، بدءًا من التعرف على الصور والكلام وحتى معالجة اللغة الطبيعية. مع التقدم في الهندسة المعمارية وتقنيات التدريب، تستمر الشبكات العصبية في إحداث تحسينات كبيرة في قدرات الذكاء الاصطناعي.
على الرغم من إمكاناتها، تواجه الشبكات العصبية تحديات مثل التحيز، والتجهيز الزائد، والاستهلاك العالي للطاقة. تعد معالجة هذه المشكلات أمرًا بالغ الأهمية مع استمرار تطور الذكاء الاصطناعي. وبالنظر إلى المستقبل، فإن الابتكارات في كفاءة النماذج، وقابلية التفسير، والتكامل مع الحوسبة الكمومية تعد بزيادة توسيع إمكانيات الشبكات العصبية، مما قد يؤدي إلى المزيد من التطبيقات التحويلية.