Implementasi Data Mining Menggunakan Algoritme Naive Bayes Classifier dan C4.5 untuk Memprediksi Kelulusan Mahasiswa

Endang Etriyanti, Dedy Syamsuar, Yesi Novaria Kunang

Abstract


Abstract: The inability of students to complete their studies on time is faced by most of higher education institution. STMIK Bina Nusantara Jaya Lubuklinggau is one of those which is experienced with this matter. In most cases, the students could complete their studies longer than the expected duration. From 162 students of Sistem Informasi study program in the year 2013 and 2014 there were 117 students completed their studies on time, while 45 students were late. As a result, it could prevent new students to join the instituion since the limited student capacity. This study deploys data mining technique in predicting graduation status of students on time. First, preprocessing is used to obtain a good dataset. Secondly, the data is processed to obtain a set of prediction. In this step, two mining algoritm were applied – Naive bayes classifier and C4.5 algoritm to be knowing the performance of the two methods, the method has a greater accuracy value will be recommended to solving the problem of prediction of students graduation at STMIK Bina Nusantara Jaya Lubuklinggau. Thirdly, the result then was validated using K-Fold Cross Validation technique. Finally, Coffusion Matrix is deployed to ensure the accuration of the prediction. The results indicates that the C4.5 Algorithm method can be used to predict student graduation status with an accuracy rate of 79,08% while the accuracy rate of the Naive Bayes Classifier method is only 78,46%. The dominan factor is IPK-S4 variable.

Abstrak: Ketidakmampuan mahasiswa untuk menyelesaikan studi tepat waktu dialami oleh sebagian besar Lembaga Pendidikan Tinggi. STMIK Bina Nusantara Jaya Lubuklinggau adalah salah satu perguruan tinggi yang mengalami hal tersebut. Dalam banyak kasus para mahasiswa menyelesaikan studi mereka lebih lama dari rentang waktu yang diharapkan. Dari 162 mahasiswa program studi Sistem Informasi tahun angkatan 2013 dan 2014 terdapat 117 mahasiswa yang menyelesakan studinya tepat waktu, sedangkan 45 mahasiswa terlambat. Akibatnya hal tersebut dapat menghambat mahasiswa baru untuk bergabung dengan lembaga karena kapasitas mahasiswa yang terbatas. Penelitian ini menggunakan teknik data mining dalam memprediksi status kelulusan mahasiswa tepat waktu. Pertama, preprocessing digunakan untuk mendapatkan dataset yang berkualitas. Kedua, data diproses untuk mendapatkan serangkaian prediksi. Pada langkah ini, dua algoritma data mining diterapkan - Naive Bayes Classifier dan Algoritma C4.5 dengan tujuan untuk mengetahui kinerja dari kedua metode, metode dengan tingkat akurasi yang lebih besar akan direkomendasikan untuk menyelesaikan masalah prediksi kelulusan mahasiswa pada STMIK Bina Nusantara Jaya Lubuklinggau. Ketiga, hasilnya kemudian divalidasi menggunakan teknik K-Fold Cross Validation. Terakhir, Coffusion Matrix digunakan untuk memvalidasi nilai akurasi hasil prediksi. Hasil penelitian menunjukkan bahwa metode Algoritma C4. dapat digunakan untuk memprediksi status kelulusan mahasiswa dengan tingkat akurasi 79,08% sedangkan metode  Naive Bayes Classifier hanya 78,46%. Dengan faktor dominan adalah variabel IPK-S4.


Keywords


Naive Bayes Classifier; Algoritme C4.5; Kelulusan Mahasiswa; RapidMiner

Full Text:

pdf (Indonesian)

References


Amalia, H. E. (2017). Komparasi Metode Data Mining Untuk Penentuan Proses Persalinan Ibu Melahirkan, 13, 103–109.

Anam, C., & Santoso, H. B. (2018). Perbandingan Kinerja Algoritma C4 . 5 dan Naive Bayes untuk Klasifikasi Penerima Beasiswa, 8(1), 13–19.

Bisri, A. (2015). Penerapan Adaboost untuk Penyelesaian Ketidakseimbangan Kelas pada Penentuan Kelulusan Mahasiswa dengan Metode Decision Tree, 1(1).

Juliansa, H. (2019). Data Mining Rought Set Dalam Menganalisa Kinerja Dosen STMIK Bina Nusantara Jaya Lubuklinggau, 4(1), 11–17.

Mulya, D. P. (2019). Analisa dan Implementasi Association Rule Dengan Algoritma FP-Growth, 1(1), 47–57.

Prakoso, S. A., & Tutik, E. T. (2017). Komparasi Algoritma C4.5 Dengan Naive Bayes Untuk Klasifikasi Kelulusan Mahasiswa Tepat Waktu Di PTS “KZX,” 3(1).

Priati. (2016). Kajian Perbandingan Teknik Klasifikasi Algoritma C4 . 5 , Naive Bayes Dan Cart Untuk Prediksi Kelulusan Mahasiswa (Studi Kasus : STMIK Rosma Karawang), (July 2016). https://doi.org/10.5281/zenodo.1184054

Risqiati, & Ismanto, B. (2017). Analisis Komparasi Algoritma Naive Bayes Dan C4-5 Untuk Waktu Kelulusan Mahasiswa, XII(1), 33–38.

Romadhona, Agus; suprapedi; himawan, H. (2017). Prediksi Kelulusan Tepat Waktu Mahasiswa Stmik-Ymi, 13, 917.

Salmu, S., & Solichin, A. (2017). Prediksi Tingkat Kelulusan Mahasiswa Tepat Waktu Menggunakan Naïve Bayes : Studi Kasus UIN Syarif Hidayatullah Jakarta Prediction of Timeliness Graduation of Students Using Naïve Bayes : A Case Study at Islamic State University Syarif Hidayatullah Jakarta, (April), 701–709.

Septiani, W. D. (2017). Komparasi Metode Klasifikasi Data Mining Algoritma C4.5 Dan Naive Bayes Untuk Prediksi Penyakit Hepatitis. Jurnal Pilar Nusa Mandiri, 13(1), 76–84.

Supriyanti, W., Kusrini, & Armadyah, A. (2016). Perbandingan kinerja algoritma c4.5 dan naive bayes untuk ketepatan pemilihan konsentrasi mahasiswa, 1(2012).

Suyanto. (2017). Data Mining Untuk Klasifikasi dan Klasterisasi Data. Informatika Bandung.

Zainuddin, M. (2019). Perbandingan 4 Algoritma Berbasis Particle Swarm Optimization ( pso ) Untuk Prediksi Kelulusan Tepat Waktu Mahasiswa, 13(1), 1–12.




DOI: http://dx.doi.org/10.35671/telematika.v13i1.881

Refbacks

  • There are currently no refbacks.




Indexed by:


Telematika
ISSN: 2442-4528 (online) | ISSN: 1979-925X (print)
Published by : Universitas Amikom Purwokerto
Jl. Let. Jend. POL SUMARTO Watumas, Purwonegoro - Purwokerto, Indonesia


Creative Commons License This work is licensed under a Creative Commons Attribution 4.0 International License .