Prediksi Performa Akademik Siswa Pada Pelajaran Matematika Menggunakan Bayesian Networks dan Algoritma Klasifikasi Machine Learning
Abstract
Mengidentifikasi data yang relevan agar bisa memprediksi performa akademik siswa
merupakan hal yang menarik untuk diteliti. Penelitian ini menggunakan data akademik dan
personal siswa menengah pada nilai mata pelajaran matematika di Portugal. Tujuan penelitian
ini adalah mempelajari bagaimana Bayesian Networks diterapkan agar dapat menentukan
keterkaitan antar variabel dan mengetahui variabel apa saja yang berpengaruh, lalu digunakan
sebagai teknik seleksi fitur. Struktur graf Bayesian Networks yang divisualisasikan menggunakan
software CaMML versi 1.4.1 dan package J-API. Algoritma klasifikasi machine learning yang
diterapkan di antaranya Random Forest, MLP, SVM, dan Naïve Bayes. Evaluasi prediksi
dilakukan dengan membandingkan akurasi sebelum dan sesudah melalui pemodelan struktur graf
Bayesian Networks. Terdapat sebelas struktur Graf Bayesian Networks yang terbentuk dari
eksperimen tahap pertama dan digunakan untuk langkah menyeleksi variabel yang relevan.
Eksperimen tahap kedua menggunakan 10 fold cross validation menunjukkan bahwa model dari
struktur graf Bayesian Networks dapat meningkatkan performa algoritma klasifikasi machine
learning dalam memprediksi performa akademik siswa.Hasil penelitian ini juga menunjukkan ada
25 variabel yang efektif untuk memprediksi perfoma akademik siswa pada mata pelajaran
matematika