Implementasi Metode XGBoost dan SHAP untuk Klasifikasi dan Analisis Faktor Risiko Penyakit Diabetes Mellitus

  • Fatika Lovina Febrianti Universitas Muhammadiyah Semarang
  • Indah Manfaati Nur
  • M. Al Haris
  • Saeful Amri
Keywords: Diabetes Mellitus, Faktor Risiko, Klasifikasi, SHAP, XGboost

Abstract

Diabetes Mellitus (DM) adalah penyakit tidak menular dengan prevalensi yang terus meningkat. Deteksi dini dan pemahaman terhadap faktor risiko menjadi langkah penting untuk mencegah komplikasi yang lebih serius. Penelitian ini bertujuan membangun model klasifikasi risiko diabetes serta mengidentifikasi faktor-faktor yang paling berpengaruh terhadap hasil prediksi. Metode yang digunakan adalah algoritma Extreme Gradient Boosting (XGBoost) untuk klasifikasi dan Shapley Additive Explanations (SHAP) untuk menilai pengaruh masing-masing variabel. Dataset yang digunakan adalah Early Stage Diabetes Risk Prediction Dataset dari UCI Machine Learning Repository yang berisi 520 observasi dengan 16 variabel prediktor. Hasil penelitian menunjukkan bahwa model XGBoost mampu mengklasifikasikan risiko diabetes dengan baik, dengan akurasi 98,7%. SHAP mengidentifikasi gejala polyuria, polydipsia, serta faktor gender sebagai variabel yang paling berkontribusi terhadap klasifikasi risiko diabetes. Kombinasi XGBoost dan SHAP tidak hanya mampu memberikan prediksi yang akurat, tetapi juga menjelaskan alasan di balik keputusan model, sehingga dapat menjadi alat bantu yang potensial dalam deteksi dini dan pengambilan keputusan medis berbasis data.

Downloads

Download data is not yet available.
Published
2025-07-24
How to Cite
Febrianti, F., Nur, I., Haris, M. A., & Amri, S. (2025, July 24). Implementasi Metode XGBoost dan SHAP untuk Klasifikasi dan Analisis Faktor Risiko Penyakit Diabetes Mellitus. PROSIDING SEMINAR NASIONAL SAINS DATA, 5(1), 336-346. https://doi.org/https://doi.org/10.33005/senada.v5i1.487