Penerapan Machine Learning Algoritma Random Forest Untuk Prediksi Penyakit Jantung
Abstract
Menurut perkiraan Organisasi Kesehatan Dunia (WHO), penyakit jantung diproyeksikan tetap menjadi penyebab kematian utama di dunia pada tahun 2030.. Lebih dari 17 juta jiwa dilaporkan kehilangan nyawa setiap tahun karena penyakit kardiovaskular, menurut WHO. Penelitian ini bertujuan meningkatkan akurasi deteksi penyakit jantung dengan memanfaatkan algoritma Random Forest untuk menangani kompleksitas data dan mencegah overfitting .Penelitian ini mengevaluasi kinerja empat algoritma pembelajaran mesin, yaitu Random Forest, Support Vector Machine (SVM), K-Nearest Neighbors (KNN), dan Regresi Logistik, dalam memprediksi kegagalan jantung. Evaluasi dilakukan dengan menggunakan dataset "Heart Failure Prediction Dataset" yang diunduh dari Kaggle yang terdiri dari 918 observasi dengan 12 atribut. Langkah-langkah persiapan datanya termasuk pengelolaan nilai yang hilang, pemrosesan variabel kategorik, dan normalisasi. Dalam pengalaman nyata, Hasil menunjukkan bahwa Random Forest menghasilkan hasil terbaik dengan akurasi 87.7% di data pengujian dan 92.63% di data validasi. Oleh karena itu, penekanan penelitian ini adalah pada kemampuan Random Forest dalam.