ما هو التشفير التلقائي؟ دليل المبتدئين

نشرت: 2024-10-28

تعد أجهزة التشفير التلقائي مكونًا أساسيًا للتعلم العميق، خاصة في مهام التعلم الآلي غير الخاضعة للرقابة. في هذه المقالة، سنستكشف كيفية عمل أجهزة التشفير التلقائي وبنيتها والأنواع المختلفة المتاحة. ستكتشف أيضًا تطبيقاتها الواقعية، بالإضافة إلى المزايا والمقايضات التي ينطوي عليها استخدامها.

جدول المحتويات

  • ما هو التشفير التلقائي؟
  • بنية التشفير التلقائي
  • أنواع أجهزة الترميز التلقائي
  • طلب
  • المزايا
  • العيوب

ما هو التشفير التلقائي؟

تعد أجهزة التشفير التلقائي أحد أنواع الشبكات العصبية المستخدمة في التعلم العميق لتعلم تمثيلات فعالة ومنخفضة الأبعاد لبيانات الإدخال، والتي يتم استخدامها بعد ذلك لإعادة بناء البيانات الأصلية. ومن خلال القيام بذلك، تتعلم هذه الشبكة أهم ميزات البيانات أثناء التدريب دون الحاجة إلى تسميات واضحة، مما يجعلها جزءًا من التعلم الخاضع للإشراف الذاتي. يتم تطبيق أجهزة التشفير التلقائي على نطاق واسع في مهام مثل تقليل تشويش الصورة، والكشف عن الحالات الشاذة، وضغط البيانات، حيث تكون قدرتها على ضغط البيانات وإعادة بنائها ذات قيمة.

اعمل بشكل أكثر ذكاءً مع Grammarly
شريك الكتابة بالذكاء الاصطناعي لأي شخص لديه عمل للقيام به

بنية التشفير التلقائي

يتكون جهاز التشفير التلقائي من ثلاثة أجزاء: جهاز التشفير، عنق الزجاجة (المعروف أيضًا باسم المساحة الكامنة أو الكود)، ووحدة فك التشفير. تعمل هذه المكونات معًا لالتقاط الميزات الرئيسية لبيانات الإدخال واستخدامها لإنشاء عمليات إعادة بناء دقيقة.

تعمل أجهزة التشفير التلقائي على تحسين إنتاجها عن طريق ضبط أوزان كل من جهاز التشفير ووحدة فك التشفير، بهدف إنتاج تمثيل مضغوط للمدخلات التي تحافظ على الميزات المهمة. يقلل هذا التحسين من خطأ إعادة البناء، الذي يمثل الفرق بين بيانات الإدخال والإخراج.

بنية التشفير التلقائي

التشفير

أولاً، يقوم المشفر بضغط البيانات المدخلة إلى تمثيل أكثر كفاءة. تتكون أجهزة التشفير بشكل عام من طبقات متعددة مع عدد أقل من العقد في كل طبقة. ومع معالجة البيانات من خلال كل طبقة، فإن انخفاض عدد العقد يجبر الشبكة على تعلم أهم ميزات البيانات لإنشاء تمثيل يمكن تخزينه في كل طبقة. تعمل هذه العملية، المعروفة باسم تقليل الأبعاد، على تحويل المدخلات إلى ملخص مدمج للخصائص الرئيسية للبيانات. تتضمن المعلمات الفائقة الرئيسية في برنامج التشفير عدد الطبقات والخلايا العصبية لكل طبقة، والتي تحدد عمق ودقة الضغط، ووظيفة التنشيط، التي تحدد كيفية تمثيل ميزات البيانات وتحويلها في كل طبقة.

عنق الزجاجة

عنق الزجاجة، المعروف أيضًا باسم المساحة الكامنة أو الكود، هو المكان الذي يتم فيه تخزين التمثيل المضغوط لبيانات الإدخال أثناء المعالجة. يحتوي عنق الزجاجة على عدد صغير من العقد؛ وهذا يحد من كمية البيانات التي يمكن تخزينها ويحدد مستوى الضغط. عدد العقد في عنق الزجاجة هو عبارة عن معلمة تشعبية قابلة للضبط، مما يسمح للمستخدمين بالتحكم في المفاضلة بين الضغط والاحتفاظ بالبيانات. إذا كان عنق الزجاجة صغيرًا جدًا، فقد يقوم جهاز التشفير التلقائي بإعادة بناء البيانات بشكل غير صحيح بسبب فقدان تفاصيل مهمة. من ناحية أخرى، إذا كان عنق الزجاجة كبيرًا جدًا، فقد يقوم جهاز التشفير التلقائي ببساطة بنسخ بيانات الإدخال بدلاً من تعلم تمثيل عام ذي معنى.

فك التشفير

في هذه الخطوة الأخيرة، يقوم جهاز فك التشفير بإعادة إنشاء البيانات الأصلية من النموذج المضغوط باستخدام الميزات الأساسية التي تم تعلمها أثناء عملية التشفير. يتم قياس جودة تخفيف الضغط هذا باستخدام خطأ إعادة الإعمار، والذي يعد في الأساس مقياسًا لمدى اختلاف البيانات المعاد بناؤها عن المدخلات. يتم حساب خطأ إعادة الإعمار بشكل عام باستخدام متوسط ​​الخطأ التربيعي (MSE). نظرًا لأن MSE يقيس الفرق التربيعي بين البيانات الأصلية والبيانات المعاد بناؤها، فإنه يوفر طريقة رياضية مباشرة لمعاقبة أخطاء إعادة البناء الأكبر بشكل أكبر.

أنواع أجهزة الترميز التلقائي

هناك عدة أنواع من أجهزة التشفير التلقائي المتخصصة، تم تحسين كل منها لتطبيقات محددة، على غرار الشبكات العصبية الأخرى.

تقليل الضوضاء لأجهزة الترميز التلقائي

تم تصميم أجهزة التشفير التلقائي التي تقلل الضوضاء لإعادة بناء البيانات النظيفة من المدخلات الصاخبة أو التالفة. أثناء التدريب، تتم إضافة الضوضاء عمدًا إلى البيانات المدخلة، مما يمكّن النموذج من تعلم الميزات التي تظل ثابتة على الرغم من الضوضاء. ثم تتم مقارنة المخرجات بالمدخلات النظيفة الأصلية. تجعل هذه العملية أجهزة التشفير التلقائي لتقليل الضوضاء فعالة للغاية في مهام تقليل ضوضاء الصورة والصوت، بما في ذلك إزالة ضوضاء الخلفية في مؤتمرات الفيديو.

أجهزة الترميز التلقائي المتفرقة

تعمل أجهزة التشفير التلقائي المتفرقة على تقييد عدد الخلايا العصبية النشطة في أي وقت، مما يشجع الشبكة على تعلم تمثيلات أكثر كفاءة للبيانات مقارنة بأجهزة التشفير التلقائي القياسية. يتم فرض هذا القيد المتناثر من خلال عقوبة لا تشجع على تنشيط عدد أكبر من الخلايا العصبية أكثر من عتبة محددة. تعمل أجهزة التشفير التلقائي المتفرقة على تبسيط البيانات عالية الأبعاد مع الحفاظ على الميزات الأساسية، مما يجعلها ذات قيمة لمهام مثل استخراج الميزات القابلة للتفسير وتصور مجموعات البيانات المعقدة.

أجهزة التشفير التلقائي المتغيرة (VAEs)

على عكس أجهزة التشفير التلقائي النموذجية، تقوم أجهزة VAEs بإنشاء بيانات جديدة عن طريق تشفير الميزات من بيانات التدريب إلى توزيع احتمالي، بدلاً من نقطة ثابتة. ومن خلال أخذ عينات من هذا التوزيع، يمكن لـ VAEs إنشاء بيانات جديدة متنوعة، بدلاً من إعادة بناء البيانات الأصلية من المدخلات. هذه الإمكانية تجعل VAEs مفيدة للمهام التوليدية، بما في ذلك إنشاء البيانات الاصطناعية. على سبيل المثال، في مجال إنشاء الصور، يمكن لـ VAE المدرب على مجموعة بيانات من الأرقام المكتوبة بخط اليد إنشاء أرقام جديدة ذات مظهر واقعي بناءً على مجموعة التدريب التي ليست نسخًا متماثلة تمامًا.

أجهزة الترميز التلقائي التعاقدية

تقدم أجهزة التشفير التلقائي التعاقدية عقوبة إضافية أثناء حساب خطأ إعادة البناء، مما يشجع النموذج على تعلم تمثيلات الميزات القوية ضد الضوضاء. تساعد هذه العقوبة على منع التجاوز من خلال تعزيز تعلم الميزات الذي لا يتغير مع الاختلافات الصغيرة في بيانات الإدخال. ونتيجة لذلك، تكون أجهزة التشفير التلقائي الانكماشية أكثر مقاومة للضوضاء من أجهزة التشفير التلقائي القياسية.

أجهزة التشفير التلقائي التلافيفية (CAEs)

يستخدم رؤساء التدقيق الداخلي الطبقات التلافيفية لالتقاط التسلسلات الهرمية والأنماط المكانية ضمن البيانات عالية الأبعاد. إن استخدام الطبقات التلافيفية يجعل CAEs مناسبًا بشكل خاص لمعالجة بيانات الصورة. يتم استخدام CAEs بشكل شائع في مهام مثل ضغط الصور واكتشاف الشذوذ في الصور.

تطبيقات أجهزة التشفير التلقائي في الذكاء الاصطناعي

تحتوي أجهزة التشفير التلقائي على العديد من التطبيقات، مثل تقليل الأبعاد وتقليل تشويش الصورة والكشف عن الحالات الشاذة.

تخفيض الأبعاد

تعد أجهزة التشفير التلقائي أدوات فعالة لتقليل أبعاد بيانات الإدخال مع الحفاظ على الميزات الرئيسية. تعتبر هذه العملية ذات قيمة لمهام مثل تصور مجموعات البيانات عالية الأبعاد وضغط البيانات. ومن خلال تبسيط البيانات، يؤدي تقليل الأبعاد أيضًا إلى تعزيز الكفاءة الحسابية، مما يقلل من الحجم والتعقيد.

كشف الشذوذ

من خلال تعلم الميزات الرئيسية لمجموعة البيانات المستهدفة، يمكن لأجهزة التشفير التلقائي التمييز بين البيانات العادية والشاذة عند تزويدها بمدخلات جديدة. تتم الإشارة إلى الانحراف عن المعدل الطبيعي بمعدلات خطأ إعادة البناء أعلى من المعدل الطبيعي. على هذا النحو، يمكن تطبيق أجهزة التشفير التلقائي على مجالات متنوعة مثل الصيانة التنبؤية وأمن شبكات الكمبيوتر.

تقليل الضوضاء

يمكن لأجهزة التشفير التلقائي التي تعمل على تقليل الضوضاء تنظيف البيانات المزعجة من خلال تعلم إعادة بنائها من مدخلات التدريب المزعجة. تجعل هذه الإمكانية أجهزة التشفير التلقائي لتقليل الضوضاء ذات قيمة لمهام مثل تحسين الصورة، بما في ذلك تحسين جودة الصور الباهتة. تعد أجهزة التشفير التلقائي التي تعمل على تقليل الضوضاء مفيدة أيضًا في معالجة الإشارات، حيث يمكنها تنظيف الإشارات المزعجة من أجل معالجة وتحليل أكثر كفاءة.

مزايا التشفير التلقائي

تتمتع أجهزة الترميز التلقائي بعدد من المزايا الرئيسية. يتضمن ذلك القدرة على التعلم من البيانات غير المسماة، وتعلم الميزات تلقائيًا دون تعليمات صريحة، واستخراج الميزات غير الخطية.

القدرة على التعلم من البيانات غير المسماة

تعد أجهزة التشفير التلقائي نموذجًا للتعلم الآلي غير خاضع للرقابة، مما يعني أنه يمكنها تعلم ميزات البيانات الأساسية من البيانات غير المسماة. تعني هذه الإمكانية أنه يمكن تطبيق أجهزة التشفير التلقائي على المهام التي قد تكون فيها البيانات المصنفة نادرة أو غير متوفرة.

التعلم التلقائي للميزات

غالبًا ما تكون تقنيات استخلاص الميزات القياسية، مثل تحليل المكونات الرئيسية (PCA)، غير عملية عندما يتعلق الأمر بمعالجة مجموعات البيانات المعقدة و/أو الكبيرة. نظرًا لأنه تم تصميم أجهزة التشفير التلقائي مع وضع مهام مثل تقليل الأبعاد في الاعتبار، فيمكنها التعرف تلقائيًا على الميزات والأنماط الرئيسية في البيانات دون تصميم يدوي للميزات.

استخراج الميزة غير الخطية

يمكن لأجهزة التشفير التلقائي التعامل مع العلاقات غير الخطية في البيانات المدخلة، مما يسمح للنموذج بالتقاط الميزات الرئيسية من تمثيلات البيانات الأكثر تعقيدًا. تعني هذه القدرة أن أجهزة التشفير التلقائي تتمتع بميزة على النماذج التي يمكنها العمل فقط مع البيانات الخطية، حيث يمكنها التعامل مع مجموعات بيانات أكثر تعقيدًا.

القيود المفروضة على أجهزة الترميز التلقائي

مثل نماذج ML الأخرى، تأتي أجهزة التشفير التلقائي مع مجموعة عيوبها الخاصة. وتشمل هذه الافتقار إلى إمكانية التفسير، والحاجة إلى مجموعات بيانات تدريب كبيرة لأداء جيد، وقدرات تعميم محدودة.

عدم القدرة على التفسير

على غرار نماذج تعلم الآلة المعقدة الأخرى، تعاني أجهزة التشفير التلقائي من نقص القدرة على التفسير، مما يعني أنه من الصعب فهم العلاقة بين بيانات الإدخال ومخرجات النموذج. في أجهزة التشفير التلقائي، يحدث هذا النقص في إمكانية التفسير لأن أجهزة التشفير التلقائي تتعلم الميزات تلقائيًا على عكس النماذج التقليدية، حيث يتم تعريف الميزات بشكل صريح. غالبًا ما يكون تمثيل الميزات المولد آليًا مجردًا للغاية ويميل إلى الافتقار إلى ميزات قابلة للتفسير من قبل الإنسان، مما يجعل من الصعب فهم ما يعنيه كل مكون في التمثيل.

تتطلب مجموعات بيانات تدريب كبيرة

تتطلب أجهزة التشفير التلقائي عادةً مجموعات بيانات تدريب كبيرة للتعرف على تمثيلات قابلة للتعميم لميزات البيانات الرئيسية. نظرًا لمجموعات بيانات التدريب الصغيرة، قد تميل أجهزة التشفير التلقائي إلى الإفراط في التخصيص، مما يؤدي إلى ضعف التعميم عند تقديم بيانات جديدة. من ناحية أخرى، توفر مجموعات البيانات الكبيرة التنوع اللازم لجهاز التشفير التلقائي للتعرف على ميزات البيانات التي يمكن تطبيقها عبر مجموعة واسعة من السيناريوهات.

تعميم محدود على البيانات الجديدة

غالبًا ما تتمتع أجهزة التشفير التلقائي المدربة على مجموعة بيانات واحدة بقدرات تعميم محدودة، مما يعني أنها تفشل في التكيف مع مجموعات البيانات الجديدة. يحدث هذا القيد لأن أجهزة التشفير التلقائي موجهة نحو إعادة بناء البيانات بناءً على الميزات البارزة من مجموعة بيانات معينة. على هذا النحو، تقوم أجهزة التشفير التلقائي عمومًا بطرح تفاصيل أصغر من البيانات أثناء التدريب ولا يمكنها التعامل مع البيانات التي لا تتناسب مع تمثيل الميزات المعمم.