Perbandingan Klasifikasi PM2.5 di Daerah Khusus Jakarta Algoritma C5.0, Random Forest, dan SVM
Abstract
Komposisi kualitas udara Jakarta yang buruk berupa polutan PM2.5 ditentukan oleh banyak faktor, salah satunya faktor meteorologi. Data mining adalah proses menemukan informasi melalui pola tertentu yang didapatkan dari sekumpulan data. Metode data mining yang digunakan pada penelitian ini adalah klasifikasi yang bertujuan untuk mengklasifikasikan kualitas udara Jakarta dalam sudut pandang PM2.5 berdasarkan faktor meteorologi tertentu. Metode klasifikasi berupa C5.0, Random Forest, dan SVM dibandingkan dengan kriteria evaluasi tertentu dan metode C5.0 terpilih sebagai metode terbaik dengan nilai akurasi 81,48%, presisi 80%, recall 63,16%, dan f1-score 70,59%.