Implementasi Ekosistem Big Data Menggunakan Hadoop untuk Analisis Prediksi Curah Hujan dengan Metode Random Forest di Kota Bandar Lampung

  • Chalifia Wananda Institut Teknologi Sumatera
  • Ardika Satria
  • Kemas Veriandra Ramadhan
  • Haikal Dwi Syaputra
  • Dwi Sulistiania
  • Vidia Vidia
  • Luluk Muthoharoh

Abstract

Prediksi curah hujan yang akurat sangat penting dalam mendukung mitigasi bencana dan
perencanaan sumber daya air, khususnya di wilayah rawan bencana seperti Kota Bandar Lampung.
Penelitian ini bertujuan untuk mengembangkan sistem prediksi curah hujan berbasis algoritma
Random Forest yang dijalankan pada ekosistem Big Data Hadoop. Data cuaca harian dari BMKG
tahun 2020–2024 diolah menggunakan arsitektur Medallion (Bronze, Silver, Gold) dan diproses
melalui pipeline Spark MLlib untuk pelatihan model klasifikasi. Proses melibatkan pembersihan data,
transformasi, kategorisasi curah hujan, serta evaluasi model menggunakan metrik presisi, recall, dan
f1-score. Hasil menunjukkan bahwa model sangat baik dalam mengklasifikasikan hujan ringan,
namun belum optimal dalam memprediksi kelas minor seperti hujan sedang dan lebat. Temuan ini
menunjukkan perlunya penanganan ketidakseimbangan kelas dan pengayaan data minor. Sistem ini
memberikan kontribusi nyata dalam integrasi teknologi Hadoop untuk prediksi iklim lokal dan
mendukung pengembangan sistem peringatan dini berbasis Big Data.

Downloads

Download data is not yet available.
Published
2025-07-24
How to Cite
Wananda, C., Satria, A., Ramadhan, K., Syaputra, H., Sulistiania, D., Vidia, V., & Muthoharoh, L. (2025, July 24). Implementasi Ekosistem Big Data Menggunakan Hadoop untuk Analisis Prediksi Curah Hujan dengan Metode Random Forest di Kota Bandar Lampung. PROSIDING SEMINAR NASIONAL SAINS DATA, 5(1), 232-240. https://doi.org/https://doi.org/10.33005/senada.v5i1.473

Most read articles by the same author(s)