KLASIFIKASI KELAS PADA DATA TIDAK SEIMBANG DALAM DETEKSI MIKROKALSIFIKASI MENGGUNAKAN SMOTE-ENN DAN XGBOOST DENGAN OPTIMASI BAYESIAN
Kata Kunci:
Data Tidak Seimbang, Klasifikasi, Optimasi Bayesian, SMOTE-ENN, XGBoostAbstrak
Data tidak seimbang merupakan masalah umum dalam klasifikasi. Klasifikasi kelas pada data tidak seimbang dapat ditangani dengan dua pendekatan, yaitu level data dan level algoritma. Level data digunakan untuk menyeimbangkan distribusi kelas. Level algoritma digunakan untuk memperbaiki algoritma klasifikasi. Penelitian ini bertujuan untuk menangani klasifikasi kelas pada data tidak seimbang dan mengetahui efektivitas optimasi hyperparameter. Pada penelitian ini dilakukan analisis klasifikasi deteksi mikrokalsifikasi yang mengalami ketidakseimbangan kelas sebesar 98%. Metode-metode yang digunakan dalam penelitian ini adalah SMOTE-ENN sebagai metode pada pendekatan level data, XGBoost sebagai metode pada pendekatan level algoritma, dan optimasi Bayesian sebagai metode optimasi hyperparameter. Evaluasi performa kinerja klasifikasi dilakukan dengan membandingkan XGBoost yang menggunakan nilai default dan XGBoost yang menggunakan optimasi Bayesian. Hasil penelitian menunjukkan bahwa metode SMOTE-ENN mampu menyeimbangkan distribusi kelas data yang sangat tidak seimbang. Metode XGBoost mampu membentuk model klasifikasi dengan nilai accuracy yang tinggi, namun cukup rendah pada nilai precision dan F-measure. Metode Optimasi Bayesian mampu meningkatkan performa kinerja klasifikasi secara signifikan, di mana berhasil meningkatkan nilai accuracy, specificity, precision, dan F-measure, tetapi mengalami penurunan pada nilai recall. Berdasarkan hasil analisis pada penelitian ini, diperoleh bahwa metode XGBoost dengan menggunakan optimasi Bayesian menghasilkan evaluasi performa kinerja yang lebih baik dibandingkan metode XGBoost dengan menggunakan nilai default.