Abstract:
استخراج البيانات هو أداة يمكنها تحديد الأنماط الخفية التي تؤثر على النجاح الأكاديمي. يهدف هذا البحث إلى دراسة وتصنيف الأداء الأكاديمي لطلاب التمريض في السنة الأولى بجامعة طبرق. تركز هذه الدراسة على المرحلة الأولية لمعالجة البيانات المسبقة وتصنيف استخراج البيانات. تشمل منهجية تصنيف الأداء الأكاديمي مرحلة الحصول على البيانات ومعالجتها المسبقة باستخدام أوامر SQL لاستخراج بيانات الطلاب من قاعدة بيانات الجامعة والخضوع للتنظيف والتحويل الأساسيين. يتبع التصنيف الأولي وتحليل البيانات باستخدام البيانات المعالجة مسبقًا، والتي تم تحسينها بشكل أكبر بواسطة خوارزميات أداة استخراج البيانات WEKA بما في ذلك BayesNet و NaiveBayes و JRIP و J48. تُظهر نتائج توزيع البيانات الأولي والتصنيف الأولي أن J48 هو منشئ النماذج الأكثر دقة باستخدام التصنيف المنتظم (88.6619) ومحدد السمات (97.8261). بالنسبة للخوارزميات الثلاث الأخرى، سجلت J48 أيضًا أعلى دقة واستدعاء ومقياس F1 وأقل قياس للخطأ. يُثبت إحصاء كابا المُسجل لـ J48 (0.7779 و0.9599) أيضًا أهمية نتيجة التصنيف، والتي فُسِّرت على أنها درجات موثوقية تتراوح بين كبيرة وشبه مثالية على التوالي، والتي حققها كلٌّ من BayesNet وJRIP. تُظهر النتائج أن سمة "النهائيات" (نتيجة الامتحان النهائي) هي العامل الأهم في تحديد التقييم الوصفي لدرجات الطالب في الجامعة. يُمكن استخدام النموذج المُبتكر كمُصنِّف لمجموعات الاختبارات المستقبلية، وقد يُوفر أساسًا لمزيد من البحث وتطوير النموذج. سيساعد إجراء المزيد من التعديلات على تحديد العوامل التي تُساهم في نجاح الطلاب والتدخلات المُناسبة اللازمة لتحسين التحصيل الأكاديمي لطلاب برنامج التمريض.