ما هي شجرة القرار في التعلم الآلي؟
نشرت: 2024-08-14تعد أشجار القرار إحدى الأدوات الأكثر شيوعًا في مجموعة أدوات التعلم الآلي لمحلل البيانات. في هذا الدليل، ستتعرف على ماهية أشجار القرار، وكيفية بنائها، والتطبيقات المتنوعة، والفوائد، والمزيد.
جدول المحتويات
- ما هي شجرة القرار؟
- مصطلحات شجرة القرار
- أنواع أشجار القرار
- كيف تعمل أشجار القرار
- التطبيقات
- المزايا
- العيوب
ما هي شجرة القرار؟
في التعلم الآلي (ML)، شجرة القرار هي خوارزمية تعلم خاضعة للإشراف تشبه المخطط الانسيابي أو مخطط القرار. على عكس العديد من خوارزميات التعلم الخاضعة للإشراف الأخرى، يمكن استخدام أشجار القرار لكل من مهام التصنيف والانحدار. غالبًا ما يستخدم علماء ومحللو البيانات أشجار القرار عند استكشاف مجموعات البيانات الجديدة لأنها سهلة الإنشاء والتفسير. بالإضافة إلى ذلك، يمكن أن تساعد أشجار القرار في تحديد ميزات البيانات المهمة التي قد تكون مفيدة عند تطبيق خوارزميات تعلم الآلة الأكثر تعقيدًا.
مصطلحات شجرة القرار
من الناحية الهيكلية، تتكون شجرة القرار عادةً من ثلاثة مكونات: العقدة الجذرية، والعقد الورقية، وعقد القرار (أو الداخلية). تمامًا مثل المخططات الانسيابية أو الأشجار في المجالات الأخرى، تتحرك القرارات في الشجرة عادةً في اتجاه واحد (إما لأسفل أو لأعلى)، بدءًا من العقدة الجذرية، مروراً ببعض عقد القرار، وتنتهي عند عقدة ورقية محددة. تقوم كل عقدة طرفية بتوصيل مجموعة فرعية من بيانات التدريب بالتسمية. يتم تجميع الشجرة من خلال عملية التدريب والتحسين على تعلم الآلة، وبمجرد بنائها، يمكن تطبيقها على مجموعات البيانات المختلفة.
فيما يلي نظرة أعمق على بقية المصطلحات:
- العقدة الجذرية:عقدة تحتوي على أول سلسلة من الأسئلة التي ستطرحها شجرة القرار حول البيانات. سيتم توصيل العقدة بعقدة قرار أو عقدة ورقية واحدة على الأقل (ولكن عادةً ما تكون اثنتين أو أكثر).
- عقد القرار (أو العقد الداخلية):العقد الإضافية التي تحتوي على الأسئلة. ستحتوي عقدة القرار على سؤال واحد بالضبط حول البيانات وتوجه تدفق البيانات إلى أحد أبنائها بناءً على الاستجابة.
- الأطفال:عقدة واحدة أو أكثر تشير إليها عقدة الجذر أو عقدة القرار. وهي تمثل قائمة بالخيارات التالية التي يمكن أن تتخذها عملية صنع القرار أثناء تحليل البيانات.
- العقد الورقية (أو العقد الطرفية):العقد التي تشير إلى اكتمال عملية اتخاذ القرار. بمجرد وصول عملية القرار إلى العقدة الطرفية، فإنها ستعيد القيمة (القيم) من العقدة الطرفية كمخرج لها.
- التسمية (الفئة، الفئة):بشكل عام، سلسلة مرتبطة بعقدة طرفية مع بعض بيانات التدريب. على سبيل المثال، قد تربط الورقة التسمية "العميل الراضي" بمجموعة من العملاء المحددين الذين تم تقديم خوارزمية تدريب ML لشجرة القرار معهم.
- الفرع (أو الشجرة الفرعية):هذه هي مجموعة العقد التي تتكون من عقدة القرار في أي نقطة في الشجرة، مع جميع أبنائها وأبنائهم، وصولاً إلى العقد الورقية.
- التقليم:عملية تحسين يتم إجراؤها عادةً على الشجرة لتصغيرها ومساعدتها في إرجاع المخرجات بشكل أسرع. يشير التقليم عادةً إلى "ما بعد التقليم"، والذي يتضمن إزالة العقد أو الفروع خوارزميًا بعد أن تقوم عملية التدريب على تعلم الآلة ببناء الشجرة. يشير "التقليم المسبق" إلى وضع حد تعسفي لمدى عمق أو حجم شجرة القرار التي يمكن أن تنمو أثناء التدريب. تفرض كلتا العمليتين أقصى قدر من التعقيد لشجرة القرار، ويتم قياسه عادةً بأقصى عمق أو ارتفاع. تتضمن التحسينات الأقل شيوعًا تحديد الحد الأقصى لعدد عقد القرار أو العقد الطرفية.
- التقسيم:خطوة التحويل الأساسية التي يتم إجراؤها على شجرة القرار أثناء التدريب. يتضمن تقسيم العقدة الجذرية أو عقدة القرار إلى عقدتين فرعيتين أو أكثر.
- التصنيف:خوارزمية ML تحاول معرفة أي (من قائمة ثابتة ومنفصلة من الفئات أو الفئات أو التصنيفات) هو الأكثر احتمالاً لتطبيقه على جزء من البيانات. قد تحاول الإجابة على أسئلة مثل "ما هو أفضل يوم من أيام الأسبوع لحجز رحلة طيران؟" المزيد عن التصنيف أدناه.
- الانحدار:خوارزمية ML تحاول التنبؤ بقيمة مستمرة، والتي قد لا يكون لها حدود دائمًا. قد تحاول الإجابة (أو التنبؤ بالإجابة) على أسئلة مثل "كم عدد الأشخاص الذين من المحتمل أن يحجزوا رحلة طيران يوم الثلاثاء المقبل؟" سنتحدث أكثر عن أشجار الانحدار في القسم التالي.
أنواع أشجار القرار
عادةً ما يتم تجميع أشجار القرار في فئتين: أشجار التصنيف وأشجار الانحدار. قد يتم إنشاء شجرة محددة لتطبيقها على التصنيف أو الانحدار أو كلتا حالتي الاستخدام. تستخدم معظم أشجار القرار الحديثة خوارزمية CART (أشجار التصنيف والانحدار)، والتي يمكنها تنفيذ كلا النوعين من المهام.
أشجار التصنيف
تحاول أشجار التصنيف، وهي النوع الأكثر شيوعًا لشجرة القرار، حل مشكلة التصنيف. من قائمة الإجابات المحتملة لسؤال ما (غالبًا ما تكون بسيطة مثل "نعم" أو "لا")، ستختار شجرة التصنيف الإجابة الأكثر احتمالية بعد طرح بعض الأسئلة حول البيانات المقدمة معها. يتم تنفيذها عادةً كأشجار ثنائية، مما يعني أن كل عقدة قرار لها طفلان بالضبط.
قد تحاول أشجار التصنيف الإجابة على أسئلة الاختيار من متعدد مثل "هل هذا العميل راضٍ؟" أو "ما المتجر الفعلي الذي من المحتمل أن يزوره هذا العميل؟" أو "هل سيكون الغد يومًا جيدًا للذهاب إلى ملعب الجولف؟"
تعتمد الطريقتان الأكثر شيوعًا لقياس جودة شجرة التصنيف على اكتساب المعلومات والإنتروبيا:
- اكتساب المعلومات:يتم تعزيز كفاءة الشجرة عندما تطرح أسئلة أقل قبل الوصول إلى إجابة. يقيس اكتساب المعلومات مدى "سرعة" الشجرة في تحقيق الإجابة من خلال تقييم مقدار المعلومات الإضافية التي يتم تعلمها حول جزء من البيانات في كل عقدة قرار. فهو يقيم ما إذا كانت الأسئلة الأكثر أهمية وإفادة قد تم طرحها أولاً في الشجرة.
- الإنتروبيا:الدقة أمر بالغ الأهمية بالنسبة لتصنيفات شجرة القرار. تقيس مقاييس الإنتروبيا هذه الدقة من خلال تقييم العلامات التي تنتجها الشجرة. يقومون بتقييم عدد المرات التي تنتهي فيها قطعة عشوائية من البيانات بتسمية خاطئة والتشابه بين جميع أجزاء بيانات التدريب التي تتلقى نفس التسمية.
تشمل القياسات الأكثر تقدمًا لجودة الشجرةمؤشر جينيونسبة الكسبوتقييمات مربع كايوقياسات مختلفة لتقليل التباين.
أشجار الانحدار
تُستخدم أشجار الانحدار عادةً في تحليل الانحدار للتحليل الإحصائي المتقدم أو للتنبؤ بالبيانات من نطاق مستمر وربما غير محدود. بالنظر إلى مجموعة من الخيارات المستمرة (على سبيل المثال، من صفر إلى ما لا نهاية على مقياس العدد الحقيقي)، تحاول شجرة الانحدار التنبؤ بالتطابق الأكثر احتمالاً لجزء معين من البيانات بعد طرح سلسلة من الأسئلة. كل سؤال يضيق نطاق الإجابات المحتملة. على سبيل المثال، يمكن استخدام شجرة الانحدار للتنبؤ بدرجات الائتمان، أو الإيرادات من أحد خطوط الأعمال، أو عدد التفاعلات على مقطع فيديو تسويقي.
عادةً ما يتم تقييم دقة أشجار الانحدار باستخدام مقاييس مثلمتوسط مربع الخطأأومتوسط الخطأ المطلق، والتي تحسب مدى المسافة بين مجموعة معينة من التنبؤات والقيم الفعلية.
كيف تعمل أشجار القرار
وكمثال على التعلم الخاضع للإشراف، تعتمد أشجار القرار على بيانات جيدة التنسيق للتدريب. تحتوي البيانات المصدر عادةً على قائمة بالقيم التي يجب أن يتعلم النموذج كيفية التنبؤ بها أو تصنيفها. يجب أن تحتوي كل قيمة على تسمية مرفقة وقائمة بالميزات المرتبطة، وهي الخصائص التي يجب أن يتعلم النموذج كيفية ربطها بالتسمية.
البناء أو التدريب
أثناء عملية التدريب، يتم تقسيم عقد القرار في شجرة القرار بشكل متكرر إلى عقد أكثر تحديدًا وفقًا لخوارزمية تدريب واحدة أو أكثر. قد يبدو الوصف على المستوى البشري للعملية كما يلي:
- ابدأ بالعقدة الجذريةالمتصلة بمجموعة التدريب بأكملها.
- تقسيم العقدة الجذرية:باستخدام نهج إحصائي، قم بتعيين قرار للعقدة الجذرية استنادًا إلى إحدى ميزات البيانات وتوزيع بيانات التدريب على عقدتين منفصلتين على الأقل، متصلتين بالجذر كأبناء.
- قم بتطبيق الخطوة الثانية بشكل متكررعلى كل من الأطفال، وتحويلهم من العقد الورقية إلى عقد القرار. توقف عند الوصول إلى حد ما (على سبيل المثال، ارتفاع/عمق الشجرة، أو قياس جودة الأطفال في كل ورقة عند كل عقدة، وما إلى ذلك) أو إذا نفدت البيانات لديك (على سبيل المثال، تحتوي كل ورقة على بيانات النقاط المرتبطة بتسمية واحدة بالضبط).
يختلف قرار الميزات التي يجب مراعاتها في كل عقدة بالنسبة للتصنيف والانحدار والتصنيف المشترك وحالات استخدام الانحدار. هناك العديد من الخوارزميات للاختيار من بينها لكل سيناريو. تشمل الخوارزميات النموذجية ما يلي:
- ID3 (التصنيف):يحسن الانتروبيا واكتساب المعلومات
- C4.5 (التصنيف):إصدار أكثر تعقيدًا من ID3، يضيف التطبيع إلى اكتساب المعلومات
- CART (التصنيف/الانحدار): "شجرة التصنيف والانحدار"؛ خوارزمية جشعة تعمل على تحسين الحد الأدنى من الشوائب في مجموعات النتائج
- CHAID (التصنيف/الانحدار): "الكشف التلقائي عن التفاعل بمربع تشي"؛ يستخدم قياسات مربع كاي بدلاً من الإنتروبيا واكتساب المعلومات
- MARS (التصنيف/الانحدار): يستخدم تقديرات خطية متعددة التعريف لالتقاط اللاخطيات
نظام التدريب الشائع هو الغابة العشوائية. الغابة العشوائية، أو غابة القرار العشوائي، هي نظام يقوم ببناء العديد من أشجار القرار ذات الصلة. قد يتم تدريب إصدارات متعددة من الشجرة بالتوازي باستخدام مجموعات من خوارزميات التدريب. واستنادًا إلى قياسات مختلفة لجودة الأشجار، سيتم استخدام مجموعة فرعية من هذه الأشجار للتوصل إلى إجابة. بالنسبة لحالات استخدام التصنيف، يتم إرجاع الفئة المحددة بواسطة أكبر عدد من الأشجار كإجابة. بالنسبة لحالات استخدام الانحدار، يتم تجميع الإجابة، عادةً كمتوسط أو متوسط التنبؤ للأشجار الفردية.
تقييم واستخدام أشجار القرار
بمجرد إنشاء شجرة القرار، يمكنها تصنيف البيانات الجديدة أو التنبؤ بالقيم لحالة استخدام محددة. من المهم الاحتفاظ بمقاييس أداء الشجرة واستخدامها لتقييم الدقة وتكرار الأخطاء. إذا انحرف النموذج كثيرًا عن الأداء المتوقع، فقد يكون الوقت قد حان لإعادة تدريبه على البيانات الجديدة أو البحث عن أنظمة تعلم الآلة الأخرى لتطبيقها على حالة الاستخدام هذه.
تطبيقات أشجار القرار في ML
تتمتع أشجار القرار بمجموعة واسعة من التطبيقات في مختلف المجالات. فيما يلي بعض الأمثلة لتوضيح تنوعها:
اتخاذ قرارات شخصية مستنيرة
قد يقوم الفرد بتتبع البيانات المتعلقة بالمطاعم التي يزورها، على سبيل المثال. وقد يتتبعون أي تفاصيل ذات صلة - مثل وقت السفر، ووقت الانتظار، والمأكولات المقدمة، وساعات العمل، ومتوسط نقاط المراجعة، والتكلفة، وآخر زيارة، إلى جانب درجة الرضا عن زيارة الفرد لهذا المطعم. يمكن تدريب شجرة القرار على هذه البيانات للتنبؤ بدرجة الرضا المحتملة لمطعم جديد.
حساب الاحتمالات حول سلوك العملاء
قد تستخدم أنظمة دعم العملاء أشجار القرار للتنبؤ برضا العملاء أو تصنيفه. يمكن تدريب شجرة القرار للتنبؤ برضا العملاء بناءً على عوامل مختلفة، مثل ما إذا كان العميل قد اتصل بالدعم أو أجرى عملية شراء متكررة أو بناءً على الإجراءات التي يتم تنفيذها داخل التطبيق. بالإضافة إلى ذلك، يمكن أن تتضمن نتائج من استطلاعات الرضا أو تعليقات العملاء الأخرى.
المساعدة في اتخاذ القرارات التجارية
بالنسبة لبعض القرارات التجارية التي تحتوي على ثروة من البيانات التاريخية، يمكن لشجرة القرارات أن توفر تقديرات أو تنبؤات للخطوات التالية. على سبيل المثال، يمكن لشركة تقوم بجمع معلومات ديموغرافية وجغرافية عن عملائها تدريب شجرة قرارات لتقييم المواقع الجغرافية الجديدة التي من المحتمل أن تكون مربحة أو يجب تجنبها. يمكن أن تساعد أشجار القرار أيضًا في تحديد أفضل حدود التصنيف للبيانات الديموغرافية الموجودة، مثل تحديد الفئات العمرية التي يجب مراعاتها بشكل منفصل عند تجميع العملاء.
اختيار الميزات لتعلم الآلة المتقدم وحالات الاستخدام الأخرى
هياكل شجرة القرار قابلة للقراءة والفهم من قبل الإنسان. بمجرد إنشاء الشجرة، من الممكن تحديد الميزات الأكثر صلة بمجموعة البيانات وبأي ترتيب. يمكن لهذه المعلومات أن توجه تطوير أنظمة تعلم الآلة أو خوارزميات القرار الأكثر تعقيدًا. على سبيل المثال، إذا تعلمت شركة من شجرة القرارات أن العملاء يمنحون الأولوية لتكلفة المنتج قبل كل شيء، فيمكنها تركيز أنظمة تعلم الآلة الأكثر تعقيدًا على هذه الرؤية أو تجاهل التكلفة عند استكشاف المزيد من الميزات الدقيقة.
مزايا أشجار القرار في ML
توفر أشجار القرار العديد من المزايا المهمة التي تجعلها خيارًا شائعًا في تطبيقات تعلم الآلة. فيما يلي بعض الفوائد الرئيسية:
سريعة وسهلة البناء
تعد أشجار القرار واحدة من خوارزميات تعلم الآلة الأكثر نضجًا وفهمًا. وهي لا تعتمد على حسابات معقدة بشكل خاص، ويمكن بناؤها بسرعة وسهولة. طالما أن المعلومات المطلوبة متاحة بسهولة، فإن شجرة القرار هي خطوة أولى سهلة يجب اتخاذها عند النظر في حلول تعلم الآلة لمشكلة ما.
من السهل على البشر أن يفهموا
إن المخرجات من أشجار القرار سهلة القراءة والتفسير بشكل خاص. لا يعتمد التمثيل الرسومي لشجرة القرار على الفهم المتقدم للإحصاءات. على هذا النحو، يمكن استخدام أشجار القرار وتمثيلاتها لتفسير وتفسير ودعم نتائج التحليلات الأكثر تعقيدًا. تعتبر أشجار القرار ممتازة في العثور على بعض الخصائص عالية المستوى لمجموعة بيانات معينة وإبرازها.
الحد الأدنى من معالجة البيانات المطلوبة
يمكن بناء أشجار القرار بنفس السهولة على بيانات غير كاملة أو بيانات تتضمن القيم المتطرفة. نظرًا للبيانات المزينة بميزات مثيرة للاهتمام، تميل خوارزميات شجرة القرار إلى عدم التأثر بقدر خوارزميات تعلم الآلة الأخرى إذا تم تغذيتها ببيانات لم تتم معالجتها مسبقًا.
مساوئ أشجار القرار في ML
في حين أن أشجار القرار توفر العديد من الفوائد، إلا أنها تأتي أيضًا مع العديد من العيوب:
عرضة للإفراط في التجهيز
تكون أشجار القرار عرضة للتجاوز، والذي يحدث عندما يتعلم النموذج التشويش والتفاصيل في بيانات التدريب، مما يقلل من أدائه على البيانات الجديدة. على سبيل المثال، إذا كانت بيانات التدريب غير كاملة أو متفرقة، فإن التغييرات الصغيرة في البيانات يمكن أن تنتج هياكل شجرة مختلفة بشكل كبير. يمكن للتقنيات المتقدمة مثل التقليم أو تحديد أقصى عمق أن تحسن سلوك الشجرة. من الناحية العملية، غالبًا ما تحتاج أشجار القرار إلى التحديث بمعلومات جديدة، مما قد يغير هيكلها بشكل كبير.
قابلية التوسع ضعيفة
بالإضافة إلى ميلها إلى الإفراط في التخصيص، تواجه أشجار القرار مشكلات أكثر تقدمًا تتطلب المزيد من البيانات بشكل ملحوظ. بالمقارنة مع الخوارزميات الأخرى، فإن وقت التدريب على أشجار القرار يزداد بسرعة مع نمو حجم البيانات. بالنسبة لمجموعات البيانات الكبيرة التي قد تحتوي على خصائص مهمة عالية المستوى لاكتشافها، فإن أشجار القرار ليست مناسبة تمامًا.
ليست فعالة في حالات الانحدار أو الاستخدام المستمر
لا تتعلم أشجار القرار توزيعات البيانات المعقدة بشكل جيد. لقد قاموا بتقسيم مساحة الميزة على طول خطوط يسهل فهمها ولكنها بسيطة من الناحية الرياضية. بالنسبة للمشكلات المعقدة التي تكون فيها القيم المتطرفة ذات صلة، والانحدار، وحالات الاستخدام المستمر، غالبًا ما يُترجم هذا إلى أداء أضعف بكثير من نماذج وتقنيات تعلم الآلة الأخرى.