Implementasi Ekosistem Big Data Menggunakan Hadoop untuk Analisis Prediksi Curah Hujan dengan Metode Random Forest di Kota Bandar Lampung
Abstract
Prediksi curah hujan yang akurat sangat penting dalam mendukung mitigasi bencana dan
perencanaan sumber daya air, khususnya di wilayah rawan bencana seperti Kota Bandar Lampung.
Penelitian ini bertujuan untuk mengembangkan sistem prediksi curah hujan berbasis algoritma
Random Forest yang dijalankan pada ekosistem Big Data Hadoop. Data cuaca harian dari BMKG
tahun 2020–2024 diolah menggunakan arsitektur Medallion (Bronze, Silver, Gold) dan diproses
melalui pipeline Spark MLlib untuk pelatihan model klasifikasi. Proses melibatkan pembersihan data,
transformasi, kategorisasi curah hujan, serta evaluasi model menggunakan metrik presisi, recall, dan
f1-score. Hasil menunjukkan bahwa model sangat baik dalam mengklasifikasikan hujan ringan,
namun belum optimal dalam memprediksi kelas minor seperti hujan sedang dan lebat. Temuan ini
menunjukkan perlunya penanganan ketidakseimbangan kelas dan pengayaan data minor. Sistem ini
memberikan kontribusi nyata dalam integrasi teknologi Hadoop untuk prediksi iklim lokal dan
mendukung pengembangan sistem peringatan dini berbasis Big Data.