Penerapan Algoritma Stacking Ensemble Machine Learning Berbasis Pohon untuk Prediksi Penyakit Diabetes
Abstract
Prediksi kelas pasien diabetes menggunakan machine learning sudah banyak dilakukan. Model prediksi menggunakan machine learning secara tunggal masih bisa dioptimalkan untuk mencapai akurasi lebih baik, biasanya menggunakan teknik ensemble. Stacking adalah salah satu teknik ensemble yang menggabungkan beberapa model pembelajaran mesin. Penelitian ini bertujuan menerapkan stacking ensemble untuk mengklasifikasi data klinis pasien kedalam kelas diabetes atau tidak diabetes. Algoritma classifier yang digunakan adalah berbasis pohon, antara lain CatBoost, XGBoost, Extra Tree, Decision Tree, dan Random Forest sebagai base learner dan Light Gradient-Boosting Machine (LGBM) sebagai meta learner. Hasil penerapan menunjukkan akurasi model prediksi untuk base learner yaitu CatBoost mencapai 76,04%, XGBoostmencapai 75,71%, Random Forest mencapai 84,82%, Extra Tree mencapai 84,96%, Decision Tree mencapai 80,66%, Light Gradient-Boostingmencapai 72,87%. Sedangkan model stacking ensemble yang dibangun berdasarkan base learner tersebut dengan meta learner LGBM mencapai akurasi 87,47%. Dengan demikian, penelitian menunjukkan bahwa model stacking lebih baik daripada model individu.