
Sistem manajemen E-learning merupakan bentuk kemajuan teknologi dalam bidang pendidikan dan telah banyak menghasilkan kumpulan data-data pendidikan yang salah satunya adalah data aktivitas pembelajaran siswa dalam sistem manajemen E-learning. Banyaknya data pendidikan yang belum tereksplorasi dengan baik dapat di manfaatkan dengan menggunakan teknik data mining. Pada penelitian ini akan dilakukan perbandingan 3 model data berbeda yaitu data awal tanpa preprocessing dan data yang di preprocessing menggunakan seleksi fitur correlation-based feature selection dan Information Gain. Data yang digunakan adalah data aktivitas pembelajaran siswa dalam sistem manajemen E-learning. Selanjutnya proses pengujian data dengan menggunakan 10 folds cross validation dengan metode C4.5 dan evaluasi data menggunakan confusion matrix. Hasil dari pengujian data menggunakan algoritma C4.5 yang dikombinasikan dengan seleksi fitur correlation-based feature selection menghasilkan nilai akurasi yang lebih tinggi dengan nilai akurasi sebesar 76.92%. Sementara itu hasil dari pengujian data awal tanpa selesksi fitur dan data yang di seleksi fitur menggunakan information gain memiliki nilai akrasi yang sama dengan nilai akurasi sebesar 76.19%. Hal ini dikarenakan data yang diproses menggunakan algoritma C4.5 tanpa preprocessing dan data yang telah di preprocessing menggunakan information gain sama-sama menghitung nilai gain untuk membuat model pohon keputusan, dan menghasilkan model pohon keputusan yang sama. Sehingga hasil dari proses pengujian data memiliki nilai akurasi yang sama.
C4.5, Coorelation-Based Feature Selection, Information Gain, Information technology, T58.5-58.64, Educational Data Mining
C4.5, Coorelation-Based Feature Selection, Information Gain, Information technology, T58.5-58.64, Educational Data Mining
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
