PROSIDING SEMINAR NASIONAL SAINS DATA https://prosiding-senada.upnjatim.ac.id/index.php/senada <p>SENADA (Seminar Nasional Sains Data) diselenggarakan oleh Program Studi Sains Data, Fakultas Ilmu Komputer, UPN "Veteran" Jawa Timur</p> en-US senada@upnjatim.ac.id (Aviolla Terza Damaliana) senada@upnjatim.ac.id (Trimono) Fri, 25 Jul 2025 00:00:00 +0000 OJS 3.1.0.0 http://blogs.law.harvard.edu/tech/rss 60 Prediksi Pengiriman Barang dengan Algoritma Weighted Moving Average pada Sistem Manajemen Rantai Pasok UMKM https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/437 <p>Pengelolaan rantai pasok merupakan faktor penting dalam meningkatkan efisiensi distribusi barang, khususnya pada usaha kecil dan menengah. Permasalahan pencatatan stok secara manual sering menyebabkan ketidaksesuaian pengiriman, pemborosan waktu, serta inefisiensi penggunaan sumber daya. Penelitian ini bertujuan mengembangkan sistem prediksi pengiriman stok berbasis metode Weighted Moving Average (WMA) untuk mengoptimalkan distribusi pada UMKM makanan olahan beku yang memiliki 12 cabang. Data yang digunakan berupa catatan penjualan bulanan periode Januari hingga Desember 2023 dari masing-masing cabang. Prediksi kebutuhan stok dihitung menggunakan metode WMA dengan evaluasi akurasi melalui Mean Absolute Percentage Error. Hasil penelitian menunjukkan bahwa metode WMA mampu meningkatkan ketepatan prediksi kebutuhan stok dan membantu mengurangi pemborosan dalam proses pengiriman. Penerapan sistem ini berpotensi meningkatkan efisiensi operasional UMKM secara keseluruhan, serta menjadi solusi praktis dalam menghadapi tantangan manajemen rantai pasok skala kecil.</p> Intan Dzikria, Rika Yulianto ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/437 Fri, 25 Jul 2025 00:00:00 +0000 Penjadwalan Shift Kerja Berbasis Permintaan Karyawan dengan Algoritma Simulated Annealing https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/440 <p>Penjadwalan shift kerja merupakan salah satu tantangan utama yang dihadapi oleh perusahaan manufaktur yang beroperasi 24 jam sehari. Penjadwalan yang tidak optimal dapat memengaruhi efisiensi operasional dan kesejahteraan karyawan. Oleh karena itu, penelitian ini bertujuan untuk mengembangkan sistem penjadwalan shift kerja karyawan berbasiskan pada permintaan karyawan menggunakan algoritma Simulated Annealing. Algoritma ini dipilih karena kemampuannya dalam menyelesaikan permasalahan optimasi dengan efisien, termasuk dalam penjadwalan kerja yang kompleks. Sistem yang dirancang juga dilengkapi dengan fitur fleksibilitas yang memungkinkan karyawan untuk mengajukan permohonan (request) pergantian shift, cuti, atau libur dengan lebih mudah. Pengembangan sistem mengikuti metode Waterfall. Hasil penelitian menunjukkan bahwa algoritma SA mampu membuat jadwal shift kerja karyawan dengan batasan-batasan yang telah ditentukan dan berdasarkan permintaan. Hasil penelitian ini diharapkan dapat memberikan solusi penjadwalan yang efisien, adil, dan adaptif terhadap kebutuhan karyawan dan perusahaan</p> Intan Dzikria, Rika Pramudhita ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/440 Fri, 25 Jul 2025 00:00:00 +0000 Sistem Pengenalan Kata Isyarat Tangan Berbasis CNN dengan Integrasi Hadoop Storage dan Antarmuka GUI Python https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/450 <p><strong><em>Abstract:&nbsp; </em></strong><em><span style="font-weight: 400;">Communication between people with disabilities and the general public is often hampered by limitations in the use of sign language. This study aims to develop a hand gesture recognition system based on Convolutional Neural Network (CNN) using TensorFlow integrated with Hadoop Distributed File System (HDFS) and a Python GUI-based graphical interface. Data in the form of hand gesture images from American Sign Language (ASL) are processed through preprocessing, augmentation, and training stages using the CNN architecture. The resulting model achieves a validation accuracy of 94.24% with a loss value of 0.3096. In addition, the system is equipped with an automatic pipeline and GUI for efficient data upload to Hadoop. The evaluation results show that the system is able to recognize gestures with an accuracy of above 98% in most classes. This system has the potential to improve communication accessibility for people with disabilities.</span></em></p> <p><strong><em>Keywords: </em></strong><em><span style="font-weight: 400;">Apache Hadoop, Disabilities, GUI Python, Hand Sign, Model Integration</span></em></p> <p>&nbsp;</p> <p><strong>Abstrak: </strong><span style="font-weight: 400;">Komunikasi antara penyandang disabilitas dan masyarakat umum seringkali terhambat akibat keterbatasan dalam penggunaan bahasa isyarat. Penelitian ini bertujuan untuk mengembangkan sistem pengenalan kata isyarat tangan berbasis Convolutional Neural Network (CNN) menggunakan TensorFlow yang diintegrasikan dengan Hadoop Distributed File System (HDFS) dan antarmuka grafis berbasis Python GUI. Data berupa gambar isyarat tangan dari American Sign Language (ASL) diproses melalui tahap preprocessing, augmentasi, dan pelatihan menggunakan arsitektur CNN. Model yang dihasilkan mencapai akurasi validasi sebesar 94.24% dengan nilai loss 0.3096. Selain itu, sistem dilengkapi dengan pipeline otomatis dan GUI untuk pengunggahan data ke Hadoop secara efisien. Hasil evaluasi menunjukkan bahwa sistem mampu mengenali kata isyarat dengan akurasi di atas 98% pada sebagian besar kelas. Sistem ini berpotensi meningkatkan aksesibilitas komunikasi bagi penyandang disabilitas.</span></p> <p><strong>Kata kunci: </strong><span style="font-weight: 400;">Apache Hadoop, Disabilitas, Isyarat Tangan, Integrasi Model, Python GUI</span></p> Abdurrahman Al-atsary ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/450 Fri, 25 Jul 2025 00:00:00 +0000 Algoritma TOPSIS pada Sistem Customer Relationship Management UMKM untuk Pengelompokan Tipe Loyalitas Pelanggan https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/443 <p>UMKM berperan penting dalam pertumbuhan ekonomi nasional, namun sering kali menghadapi tantangan dalam mempertahankan loyalitas pelanggan. Penelitian ini bertujuan merancang dan mengembangkan sistem Customer Relationship Management (CRM) yang dilengkapi metode Technique for Order Preference by Similarity to Ideal Solution (TOPSIS) untuk mengelompokkan pelanggan berdasarkan tingkat loyalitas. Perhitungan TOPSIS mengacu pada empat kriteria utama, yaitu frekuensi pembelian, total transaksi, durasi menjadi pelanggan, dan partisipasi pelanggan. Hasil implementasi menunjukkan bahwa algoritma TOPSIS dapat mengelompokkan pelanggan secara objektif ke dalam kategori loyalitas tertentu, yang dapat digunakan oleh pelaku UMKM untuk merancang strategi retensi pelanggan. Penelitian ini memberikan kontribusi terhadap penerapan teknologi pengambilan keputusan dalam CRM berbasis data untuk sektor UMKM.</p> Intan Dzikria, Earnestine Immanuel Andrianto ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/443 Fri, 25 Jul 2025 00:00:00 +0000 Analisis Feasibilitas Model CNN untuk Prediksi Aksi pada Pasar Saham di Indonesia https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/446 <p>Banyak peneliti berlomba-lomba untuk melakukan regresi harga di masa depan. Namun, pendekatan berbasis regresi seperti ini tak jarang hanya menghasilkan prediksi harga yang tertunda relatif terhadap harga aslinya, dimana membuat hasil prediksi menjadi tidak dapat diandalkan. Alih-alih memandang masalah ini sebagai masalah regresi, mengapa tidak memandangnya sebagai masalah klasifikasi untuk memprediksi langkah terbaik antara jual, beli dan tahan di masa depan. Terinspirasi dari penelitian sebelumnya, artikel ini akan mencoba untuk membangun model CNN yang bisa melakukan generalisasi, tidak <em>overfit</em> mapupun <em>underfit</em>, serta meninjau feasibilitas model pada dunia nyata. Data yang digunakan dalam penelitian ini adalah data saham BBCA, BBRI, BMRI dan BBNI. Hasil dari penelitian ini menunjukkan bahwa model CNN berhasil belajar dan tidak hanya sekadar menghafal, dibuktikan dengan penurunan kerugian dan peningkatan akurasi pada data latih. Selain itu, model CNN juga berhasil melakukan generalisasi sampai batas tertentu dibuktikan dengan penurunan kerugian pada data validasi serta nilai <em>Macro Average F1-Score </em>model CNN yang senantiasa lebih besar dibbanding dengan <em>Macro Average F1-Score </em>model naif. Namun, masalah akurasi model CNN masih menjadi tantangan, hal ini terbukti dari plot kurva akurasi yang tidak stabil pada data validasi dan nilai <em>Sharpe Ratio</em> yang bernilai kurang dari 0.1 pada simulasi jual-beli untuk seluruh data saham.</p> Aryadharma Wibowo, Rudy Kusdiantara, Nuning Nuraini ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/446 Fri, 25 Jul 2025 00:00:00 +0000 Perbandingan Algoritma Naïve Bayes dan Regresi Logistik pada Klasifikasi Produk Olahraga Tokopedia Berdasarkan Gender https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/449 <p><em>This research examines the application of Naïve Bayes algorithm and Logistic Regression for data classification on the Tokopedia e-commerce platform using PySpark. In the context of large and varied data volumes, PySpark is used to process and analyze data efficiently. Naïve Bayes, which is known for its simplicity and speed in the classification process, is applied to categorize products based on descriptions and other features. Additionally, logistic regression is applied to predict users' propensity to make purchases based on their activity history. The results show that both algorithms perform well in classification tasks, with logistic regression slightly superior in prediction accuracy 0.9967. This study provides insight by implementing machine learning methods to optimize efficiency and effectiveness of data classification in the e-commerce industry.</em></p> <p><strong><em>Keywords: </em></strong><em>Tokopedia, PySpark, Naïve Bayes, Logistic Regression, Big Data</em></p> Veni Zahara Kartika ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/449 Fri, 25 Jul 2025 00:00:00 +0000 Penerapan Streaming K-Means Clustering Menggunakan Sparklyr untuk Penentuan Nilai K Terbaik pada Data US Covid Surat Kabar NY Times https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/452 <p><strong><em>Abstract:&nbsp; </em></strong><em>Big data processing is a major focus in modern data analysis, especially in the context of the COVID-19 pandemic. Researchers propose an approach to determine the best K value in the Streaming K-Means Clustering algorithm using Sparklyr in the Apache Spark environment. Researchers apply this approach to COVID-19 data from the NY Times Newspaper, with the development of the Silhouette Coefficient evaluation method. Experimental results show that this approach is able to provide reliable and analytically relevant clustering results. This makes an important contribution to the understanding of the dynamics of the COVID-19 pandemic, strengthening the potential of real-time data analysis from news sources such as the NY Times Newspaper in providing valuable insights for stakeholders.</em></p> <p><strong><em>Keywords: </em></strong><em>Apache Spark, COVID-19, Sparklyr, Streaming K-Means Clustering Algorithm</em></p> <p><strong>Abstrak: </strong>Pemrosesan data besar menjadi fokus utama dalam analisis data modern, terutama dalam konteks pandemi COVID-19. Peneliti mengusulkan pendekatan untuk menentukan nilai K terbaik dalam algoritma Streaming K-Means Clustering dengan menggunakan Sparklyr di lingkungan Apache Spark. Peneliti menerapkan pendekatan ini pada data COVID-19 dari Surat Kabar NY Times, dengan pengembangan metode evaluasi Silhouette Coefficient. Hasil eksperimen menunjukkan bahwa pendekatan ini mampu memberikan hasil klasterisasi yang andal dan relevan secara analitis. Hal ini memberikan kontribusi penting untuk pemahaman dinamika pandemi COVID-19, memperkuat potensi analisis data real-time dari sumber-sumber berita seperti Surat Kabar NY Times dalam memberikan wawasan berharga bagi pemangku kepentingan.</p> <p><strong>Kata kunci: </strong>Algoritma Streaming K-Means Clustering, Apache Spark, COVID-19, Sparklyr</p> Rafi Fadhlillah, Muhammad Fathir Fadillah, Mujadid Choirus Surya, Muhammad Farhan, Catherine Sinaga, Luluk Muthoharoh, Ardika Satria, Rizty Maulida Badri ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/452 Fri, 25 Jul 2025 00:00:00 +0000 Rancang Bangun dan Evaluasi Sistem Pipeline Asinkron untuk Pengelolaan dan Analitik Data Meteorologi dan Panel Surya https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/453 <p>Penelitian ini menghadirkan solusi terjangkau dengan mengembangkan sistem Data Pipeline ETL asinkron yang mampu memproses data cuaca dan radiasi matahari untuk menganalisis serta memprediksi kinerja panel surya secara real-time. Sistem ini memanfaatkan teknologi open-source seperti RabbitMQ, Celery, dan PostgreSQL, yang terbukti hemat biaya dan mudah diimplementasikan (deployable). Pipeline ini diuji sebagai proof-of-concept yang berhasil memproses sekitar 35.000 entri timeseries data secara modular dan paralel, mendukung pemrosesan data besar dengan kecepatan dan akurasi tinggi. Model XGBoost yang digunakan menunjukkan performa terbaik dalam prediksi kinerja panel surya, sementara teknik K-Means menghasilkan segmentasi data cuaca, awan, dan suhu yang relevan. Pipeline ini juga dirancang sebagai scalable solution, memungkinkan ekspansi sistem dan integrasi data IoT di masa depan. Hasil penelitian menunjukkan sistem ini mampu mendukung pengambilan keputusan berbasis data dan memberikan dasar kuat untuk pengembangan aplikasi energi surya berkelanjutan di Indonesia. Dengan demikian, pipeline ini tidak hanya menawarkan efisiensi biaya tetapi juga menjadi solusi praktis dan fleksibel dalam mendorong transisi energi hijau nasional.</p> Ibrahim Frosly Alesandro, Alisha Deana Tabina, Muhammad Raihan Fasya, Ibnu Febry Kurniawan ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/453 Fri, 25 Jul 2025 00:00:00 +0000 Pengelompokan Provinsi di Indonesia Berdasarkan Produksi dan Nelayan Cakalang 2023 dengan Block-Based K-Medoids https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/455 <p>Indonesia merupakan negara kepulauan dengan potensi sumber daya laut yang melimpah, salah satunya ikan cakalang yang menjadi komoditas penting dalam sektor perikanan tangkap. Namun, pemanfaatannya masih belum merata di seluruh provinsi, yang tercermin dari ketimpangan volume produksi, nilai produksi, dan jumlah nelayan. Penelitian ini bertujuan untuk mengelompokkan provinsi di Indonesia berdasarkan ketiga indikator tersebut pada tahun 2023 dengan menggunakan metode <em>Block-Based K-Medoids</em>. Metode <em>Block-Based K-Medoids </em>memanfaatkan objek representatif berdasarkan blok standar deviasi dan jumlah nilai variabel untuk menentukan medoid awal, sehingga lebih stabil dan akurat dalam menghasilkan kelompok. Hasil analisis menunjukkan 3 <em>cluster</em> provinsi dengan karakteristik berbeda yaitu <em>cluster</em> 1 memiliki volume dan nilai produksi rendah namun jumlah nelayan tinggi, mengindikasikan produktivitas rendah. <em>Cluster </em>2 menunjukkan volume dan nilai produksi sedang dengan jumlah nelayan paling sedikit, mencerminkan efisiensi produktivitas yang tinggi. Sedangkan, <em>cluster</em> 3 memiliki volume, nilai produksi, dan jumlah nelayan tertinggi, mencerminkan daerah dengan sektor perikanan tangkap yang besar dan berkembang.</p> khansa qamila ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/455 Thu, 24 Jul 2025 03:02:17 +0000 Analisis Perkembangan Capaian Investasi dan Capaian Tenaga Kerja di Kawasan Ekonomi Khusus (KEK) 2020-2024 menggunakan Dynamic Time Warping https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/456 <p>Kawasan Ekonomi Khusus (KEK) merupakan strategi pemerintah untuk mendorong pertumbuhan ekonomi dan meningkatkan penyerapan tenaga kerja di Indonesia. Kenyataannya saat ini masih terdapat ketimpangan antar KEK yang dilihat melalui indikator capaian investasi dan capaian tenaga kerja, penelitian ini bertujuan untuk mengelompokkan KEK berdasarkan capaian investasi dan capaian tenaga kerja dimulai pada tahun 2020-2024. Metode yang akan digunakan pada indikator keberhasilan KEK yaitu <em>K-Means Clustering </em>dan <em>Dynamic Time Warping </em>(DTW). Hasil penelitian ini menunjukkan bahwa capaian investasi terdapat 2 klaster, KEK pada klaster 2 memiliki pola capaian investasi yang sempat mengalami penurunan namun kemudian mengalami kenaikan yang drastis, sementara klaster 2 memiliki pola yang sama seperti klaster 1 tetapi kenaikan yang dialami klaster 2 tidak setinggi klaster 1, dan untuk klaster 3 merupakan KEK yang memiliki pola capaian investasi yang sangat fluktuatif. Capaian tenaga kerja menghasilkan 3 klaster, klaster 1 menunjukkan KEK yang memiliki pola fluktuasi yang tidak konsisten, klaster 2 merupakan KEK yang mengalami kenaikan signifikan namun mengalami penurunan di akhir periode, dan klaster 3 menunjukkan KEK yang memiliki capaian tenaga kerja paling tinggi. Hasil penelitian ini semoga dapat memberikan gambaran penting bagi pengambil kebijakan dalam menentukan strategi yang tepat agar mendorong pemerataan dan pengembangan KEK</p> Fatma Sheifa Kanaya ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/456 Thu, 24 Jul 2025 03:03:38 +0000 Perbandingan Klasifikasi Cuaca Kota Denpasar dengan Regresi Logistik Multinomial dan Analisis Diskriminan https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/458 <p><strong><em>Abstract: </em></strong><em>Weather forecasting plays a vital role in supporting public activities, especially in tourist areas such as Denpasar City, Bali. This study aims to classify weather conditions in 2019 into four main categories: Clouds, Rain, Thunderstorm, and Clear, using Linear Discriminant Analysis (LDA) and Multinomial Logistic Regression (MLR). The dataset, obtained from Kaggle, consists of 264,925 hourly weather observations, covering 34 atmospheric variables such as temperature, humidity, pressure, wind speed, and precipitation. The analysis process included data exploration and cleaning, followed by the application of both methods to build accurate and interpretable classification models. Results show that MLR with PCA achieved the highest accuracy (0.7713), followed by MLR without PCA (0.7664), and LDA (0.6725). MLR outperformed LDA in weather classification, while PCA contributed to model simplification. The most influential variable in LDA was temperature (temp, 3.21), while in both MLR models, it was clouds_all (857.28 without PCA and 252.40 with PCA). These findings highlight the importance of multivariate approaches in developing data-driven weather classification systems.<br></em></p> <p><strong>Abstrak: </strong>Prakiraan cuaca berperan penting dalam menunjang aktivitas masyarakat, terutama di wilayah wisata seperti Kota Denpasar, Bali. Penelitian ini bertujuan mengklasifikasikan kondisi cuaca tahun 2019 ke dalam empat kategori utama: Clouds, Rain, Thunderstorm, dan Clear, menggunakan Analisis Diskriminan Linear (LDA) dan Regresi Logistik Multinomial (MLR). Dataset diperoleh dari Kaggle, terdiri dari 264.925 observasi cuaca yang dicatat setiap satu jam, dengan 34 variabel atmosfer seperti suhu, kelembapan, tekanan, kecepatan angin, dan curah hujan. Proses analisis dimulai dari eksplorasi dan pembersihan data, dilanjutkan dengan penerapan kedua metode untuk membangun model klasifikasi yang akurat dan interpretatif. Hasil menunjukkan MLR dengan PCA memberikan akurasi tertinggi (0,7713), disusul MLR tanpa PCA (0,7664), dan LDA (0,6725). MLR lebih unggul dalam klasifikasi cuaca, sedangkan PCA membantu menyederhanakan model. Variabel paling berpengaruh dalam LDA adalah suhu (temp, 3,21), sedangkan dalam MLR tanpa PCA atau dengan PCA adalah clouds_all (857,28 dan 252,40)<strong>. </strong>Temuan ini menegaskan pentingnya pendekatan multivariat dalam pengembangan sistem klasfikasi cuaca berbasis data.</p> MUHAMAD ALFA REZA GOBEL, ALFATHRINDRA AGASTYO YULIANTO, HIZKIA MARVEL ABINAYA, IKE FITRIYANINGSIH, M.Si ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/458 Thu, 24 Jul 2025 00:00:00 +0000 Multivariate Analysis of Variance pada Faktor yang Mempengaruhi Pendanaan dan Valuasi Startup https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/459 <p>Penelitian ini bertujuan untuk menganalisis pengaruh sektor industri dan <em>status exit</em> terhadap kinerja startup, yang diukur melalui volume pendanaan dan valuasi startup. Selain itu, penelitian ini juga mempertimbangkan variabel kovariat seperti umur startup, jumlah karyawan, dan pangsa pasar (<em>market share</em>) untuk memberikan pemahaman yang lebih mendalam mengenai faktor-faktor yang memengaruhi kesuksesan startup. Data yang digunakan berasal dari platform publik dan mencakup 500 startup yang terbaru tersebar di berbagai kawasan, termasuk Asia, Australia, Eropa, Amerika Utara, dan Amerika Selatan. Melalui pendekatan statistik multivariat <em>MANOVA</em> dan <em>MANCOVA</em>, ditemukan bahwa sektor industri dan pangsa pasar memiliki pengaruh signifikan terhadap kombinasi pendanaan dan valuasi startup. Sebaliknya, variabel seperti status exit tidak menunjukkan pengaruh yang signifikan. Temuan ini menujukkan pentingnya konteks industri dalam membentuk dinamika pertumbuhan startup. Analisis lanjutan mengungkap bahwa pengaruh pangsa pasar paling kuat terlihat pada sektor <em>E-Commerce</em> dan <em>Internet of Things (IoT)</em>, yang menunjukkan sensitivitas tinggi terhadap kompetisi pasar. Hasil ini menegaskan bahwa dalam menilai postensi dan keberhasilan startup, faktor kontekstual seperti jenis industri dan kekuatan pasar harus menjadi pertimbangan utama dalam strategi investasi dan pengambilan keputusan bisnis.</p> Ulfa Siti Nuraini, Dinda Galuh Guminta, Ibrahim Frosly Alesandro, Naufal Harith, Alisha Deana Tabina ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/459 Fri, 25 Jul 2025 00:00:00 +0000 Fine-Tuning LLM Llama 3 dengan PySpark dan QLoRa pada Data Penelitian Ilmiah https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/460 <p>Studi ini mengeksplorasi penerapan PySpark untuk <em>fine-tuning </em>Llama 3 LLM menggunakan QLoRa pada kumpulan data yang terdiri dari 1,5 juta makalah ilmiah. Praproses data dan pelatihan model terdistribusi dilakukan untuk meningkatkan kinerja model dalam tugas NLP. Model yang disempurnakan menunjukkan kemampuan yang kuat dalam prompting sederhana dan kompleks. Kerugian pelatihan akhir sebesar 2,64857 tercapai, yang menunjukkan efektivitas QLoRa dalam meningkatkan efisiensi memori sekaligus mempertahankan kinerja.</p> Muhammad Arsal Ranjana Utama, Husni Na’fa Mubarok, Lis Nurani, Salwa Amelia Salsabila, Nabila Azhari, Muhammad Bagas Kurnia, Luluk Muthoharoh, Ardika Satria, Rizty Maulida Badri ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/460 Fri, 25 Jul 2025 00:00:00 +0000 Pengaruh Sosial Ekonomi dan Non-Akademik Terhadap Prestasi Akademik Menggunakan Structural Equation Modeling https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/461 <p>Pendidikan memiliki peran krusial dalam membentuk sumber daya manusia yang kompetitif, khususnya dalam konteks globalisasi. Prestasi akademik sering dijadikan indikator keberhasilan pendidikan, namun pencapaiannya tidak hanya ditentukan oleh faktor kognitif. Faktor eksternal seperti status sosial ekonomi dan keterlibatan aktivitas non-akademik turut memengaruhi capaian siswa. Meski telah banyak penelitian yang mengkaji keduanya secara terpisah, studi yang menganalisis dampak dari kedua faktor ini masih terbatas. Penelitian ini menggunakan <em>Confirmatory Factor Analysis</em> (CFA) dan <em>Structural Equation Modeling</em> (SEM) untuk menganalisis pengaruh sosial ekonomi dan aktivitas non-akademik terhadap prestasi akademik. Hasil CFA menunjukkan kecocokan model yang baik, sementara SEM menunjukkan bahwa aktivitas non-akademik memiliki pengaruh positif dan signifikan terhadap prestasi akademik, sedangkan sosial ekonomi menunjukkan pengaruh negatif signifikan. Model secara keseluruhan menunjukkan kecocokan yang memadai (CFI = 0.911, RMSEA = 0.067). Penelitian ini menekankan pentingnya mendukung keterlibatan siswa dalam aktivitas non-akademik sebagai upaya peningkatan prestasi, bahkan lebih kuat dibandingkan pengaruh latar belakang sosial ekonomi.</p> Dinda Galuh Guminta, Ulfa Siti Nuraini, Sintiya Risla Miftaqul Nikmah, Krisjen Fraulein Hutagalung, Sofia Zahira Rohman ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/461 Fri, 25 Jul 2025 00:00:00 +0000 Pipeline ETL Terdistribusi untuk Klasifikasi Berita Clickbait dan Topik Berita https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/462 <p>Penelitian ini bertujuan untuk merancang dan mengimplementasikan pipeline ETL terdistribusi yang efisien dalam klasifikasi berita clickbait dan topik berita, dengan fokus pada pengelolaan data berita dalam skala besar di era digital. Sistem yang dikembangkan memanfaatkan RabbitMQ sebagai message broker dan Celery sebagai task queue manager untuk pemrosesan paralel dan asynchronous. Proses ETL meliputi ekstraksi data dari file CSV, transformasi data melalui tahap pre-processing, klasifikasi berita clickbait dan non-clickbait , serta klasifikasi topik menggunakan feature engineering TF-IDF dan model Random Forest. Hasil penelitian menunjukkan bahwa sistem ini dapat mengelompokkan berita ke dalam kategori clickbait dan topik dengan efisien, sambil menangani volume data yang besar. Sistem yang dikembangkan juga mampu menyimpan hasil klasifikasi ke dalam database PostgreSQL, memungkinkan analisis dan pemantauan lebih lanjut. Penelitian ini memberikan kontribusi pada pengembangan sistem berbasis ETL yang modular dan terdistribusi, serta memperkenalkan pendekatan yang dapat digunakan untuk analisis data berita digital dalam skala besar.</p> Gesang Nur Zamroji, Rafly Anugrah Syahputra, Sofia Zahira Rohman, Ibnu Febry Kurniawan ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/462 Fri, 25 Jul 2025 00:00:00 +0000 Penerapan Metode Autoregressive Integrated Moving Average (ARIMA) dalam Peramalan Nilai Tukar Rupiah terhadap Dollar Amerika Pada Tahun 2022-2024 https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/463 <p><span class="s31">Kondisi </span><span class="s31">per</span><span class="s31">ekonomi</span><span class="s31">an</span><span class="s31"> Indonesia sangat dipengaruhi oleh fluktuasi nilai tukar Rupiah terhadap mata uang asing, khususnya Dollar Amerika Serikat (USD), yang merupakan salah satu indikator utama dalam menilai </span><span class="s31">kestabilan</span><span class="s31"> ekonomi nasional. </span><span class="s31">Pergerakan n</span><span class="s31">ilai tukar ini </span><span class="s31">ditentukan</span><span class="s31"> oleh </span><span class="s31">sejumlah</span><span class="s31"> faktor eksternal</span><span class="s31">,</span><span class="s31">seperti </span><span class="s31">tingkat </span><span class="s31">inflasi dan suku bunga, serta </span><span class="s31">berdampak</span><span class="s31"> besar terhadap harga barang, arus investasi asing, dan ketahanan ekonomi negara. Untuk mengantisipasi dampak dari fluktuasi tersebut, penelitian ini melakukan p</span><span class="s31">rediksi</span><span class="s31"> nilai tukar Rupiah terhadap USD untuk periode Oktober 2022 hingga Desember 2024 menggunakan metode </span><span class="s26">Autoregressive Integrated Moving Average</span><span class="s31"> (ARIMA). Berdasarkan proses </span><span class="s31">penentuan</span><span class="s31"> model, estimasi parameter, dan evaluasi kriteria informasi, diperoleh model terbaik yaitu ARIMA</span> <span class="s31">(2,1,2) </span><span class="s31">terpilih</span><span class="s31"> karena memiliki nilai Akaike’s Information Criterion (AIC) terkecil, yakni sebesar 4781.886. Model ini menghasilkan nilai </span><span class="s26">Mean Absolute Percentage Error</span><span class="s31"> (MAPE) sebesar 26%, yang menunjukkan bahwa tingkat akurasi peramalan berada pada kategori moderat. Dengan demikian, model ARIMA</span> <span class="s31">(2,1,2) </span><span class="s31">layak</span><span class="s31"> digunakan sebagai alat bantu dalam memprediksi pergerakan nilai tukar Rupiah terhadap USD secara kuantitatif </span><span class="s31">guna</span><span class="s31"> mendukung pengambilan keputusan ekonomi</span><span class="s31">.</span></p> Rayan Koemi Karuby, Sesilia Putri Subandi, Dhea Amalia Putri, Natasya Ega Lina Marbun, Khusnun Nisa, Ganiya Syazwa, Luluk Muthoharoh, Mika Alvionita, Ira Safitri ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/463 Thu, 24 Jul 2025 01:50:49 +0000 Implementasi Ekosistem Hadoop untuk Analisis Segmentasi Pelanggan E-commerce di Pulau Sumatera https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/465 <p><span style="font-weight: 400;">tudi ini mengembangkan solusi big data berbasis ekosistem Hadoop untuk analisis segmentasi pelanggan </span><em><span style="font-weight: 400;">e-commerce</span></em><span style="font-weight: 400;"> di wilayah Sumatera. Pendekatan arsitektur medallion tiga lapis (</span><em><span style="font-weight: 400;">bronze, silver, gold</span></em><span style="font-weight: 400;">) diimplementasikan dengan memanfaatkan teknologi </span><em><span style="font-weight: 400;">Sqoop</span></em><span style="font-weight: 400;"> untuk integrasi data, Spark SQL untuk transformasi, dan MLlib untuk pemodelan prediktif. Pada lapisan </span><em><span style="font-weight: 400;">bronze</span></em><span style="font-weight: 400;">, data mentah disimpan dalam format </span><em><span style="font-weight: 400;">Parquet</span></em><span style="font-weight: 400;"> di HDFS, kemudian diproses di lapisan silver melalui tahap pembersihan data dan ekstraksi fitur RFM (</span><em><span style="font-weight: 400;">Recency, Frequency, Monetary Value</span></em><span style="font-weight: 400;">). Pada lapisan gold, algoritma </span><em><span style="font-weight: 400;">K-Means</span></em><span style="font-weight: 400;"> dioptimalkan menggunakan kombinasi Metode </span><em><span style="font-weight: 400;">Elbow</span></em><span style="font-weight: 400;"> dan </span><em><span style="font-weight: 400;">Silhouette Score</span></em><span style="font-weight: 400;"> untuk menentukan jumlah cluster optimal, menghasilkan empat segmen pelanggan yang berbeda. Visualisasi hasil segmentasi dikembangkan menggunakan </span><em><span style="font-weight: 400;">Apache</span></em><span style="font-weight: 400;"> Superset, menyediakan dashboard interaktif untuk analisis bisnis. Seluruh alur kerja diotomatisasi melalui Apache </span><em><span style="font-weight: 400;">Oozie</span></em><span style="font-weight: 400;">, dengan dukungan Apache</span><em><span style="font-weight: 400;"> Atlas</span></em><span style="font-weight: 400;"> untuk manajemen metadata dan integrasi Apache Ambari serta </span><em><span style="font-weight: 400;">ZooKeeper</span></em><span style="font-weight: 400;"> untuk pemantauan kluster secara real-time. Temuan penelitian membuktikan kemampuan sistem dalam mengatasi tantangan pengolahan data </span><em><span style="font-weight: 400;">e-commerce</span></em><span style="font-weight: 400;"> skala besar di Sumatera, sekaligus menyediakan landasan yang kuat untuk pengembangan strategi pemasaran berbasis data yang lebih efektif dan terukur. </span></p> Nabila Zakiyah Zahra, Ardika Satria, Feryadi Yulius, Khoirul Mizan Abdullah, Kharisa Harvanny, Luluk Muthoharoh, Vidia Vidia ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/465 Thu, 24 Jul 2025 01:52:25 +0000 Perbandingan Model Regresi Linier dan Nonlinier untuk Prediksi Suhu Udara di Provinsi Lampung https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/466 <p><em>This study aims to analyze the relationship between air temperature and variables such as air pressure, humidity, and wind speed using both linear and nonlinear regression approaches. Three models are compared: multiple linear regression, second-degree polynomial regression, and spline regression. The analysis results show that the spline regression model delivers the best performance, with an RMSE of 0.556 and an MAE of 0.427, which are lower than those of the polynomial regression (RMSE = 0.746; MAE = 0.570) and multiple linear regression (RMSE = 0.972; MAE = 0.715). Overall, spline regression effectively captures the complex nonlinear patterns in the data, including the presence of turning points in the influence of predictor variables on temperature. These findings indicate that nonlinear approaches, particularly spline regression, are more accurate and appropriate for modeling climate phenomena characterized by nonlinear relationships among variables.</em></p> Mika Alvionita S ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/466 Thu, 24 Jul 2025 01:53:49 +0000 Perancangan Sistem Vision-Based Traffic Monitoring untuk Penghitungan dan Estimasi Kecepatan Kendaraan https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/469 <p>Kemajuan dalam rekayasa lalu lintas serta implementasi konsep smart city telah mendorong munculnya berbagai metode otomatisasi dalam pemantauan lalu lintas, termasuk di antaranya pengukuran kecepatan kendaraan secara otomatis. Salah satu pendekatan yang digunakan berbasis visi komputer, dengan memanfaatkan kamera pengawas untuk merekam dan menganalisis pergerakan kendaraan secara digital. Dalam penelitian ini, pendekatan Mixture of Gaussians dikombinasikan dengan metode ORB (Oriented FAST and Rotated BRIEF) untuk memungkinkan pengukuran jarak antar titik lintas kendaraan dengan tingkat presisi yang lebih tinggi. Selain itu, sistem dilengkapi dengan fitur pencocokan ORB antar frame, sehingga Region of Interest (ROI) dapat menyesuaikan secara dinamis terhadap perubahan posisi kamera yang bersifat minor. Hasil penelitian menunjukkan tingkat akurasi metode dalam melakukan penghitungan kendaraan dan estimasi kecepatan dengan akurasi sebesar 92.79% membuktikan bahwa penerapan metode transformasi perspektif ke bird eye’s view dapat menghasilkan estimasi kecepatan yang mendekati kecepatan aktual.</p> Hasanuddin Al-Habib, M.Si, Mochamad Akbar Hanafi, Shofwa Aulia Mursyidah, Irgieta Villa Cantika, Yuni Rosita Dewi ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/469 Thu, 24 Jul 2025 01:55:37 +0000 Pengaruh Faktor Spasial Terhadap Sebaran Tuberkulosis Menggunakan Pendekatan Spatial AutoRegressive Sumatera Utara https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/470 <p><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">Tuberkulosis (TBC) merupakan salah satu penyakit menular yang masih menjadi masalah kesehatan </span></span><br><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">serius di Indonesia, khususnya di Provinsi Sumatera Utara. Penyebaran kasus TBC yang tidak merata antar </span></span><br><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">kabupaten/kota menunjukkan adanya indikasi pengaruh faktor spasial terhadap penyebarannya. Penelitian ini </span></span><br><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">bertujuan untuk menganalisis pengaruh faktor-faktor spasial, seperti jumlah penduduk miskin, persentase </span></span><br><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">perokok, rumah kumuh, sanitasi tidak layak, dan penduduk yang sakit terhadap jumlah kasus TBC dengan </span></span><br><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">menggunakan pendekatan regresi spasial, yakni Spatial Autoregressive Model (SAR) dan Spatial Durbin Model </span></span><br><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">(SDM). Data yang digunakan merupakan data sekunder dari Badan Pusat Statistik Provinsi Sumatera Utara tahun </span></span><br><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">2023–2024. Hasil analisis menunjukkan bahwa terdapat autokorelasi spasial positif dalam penyebaran TBC, yang </span></span><br><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">berarti wilayah dengan jumlah kasus tinggi yang cenderung mencakup wilayah serupa. Model SAR dan SDM berhasil </span></span><br><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">mengidentifikasi bahwa jumlah penduduk miskin dan sanitasi tidak layak merupakan faktor dominan yang </span></span><br><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">berkontribusi terhadap sebaran kasus TBC. Temuan ini pentingnya pendekatan spasial dalam </span></span><br><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">kebijakan penanggulangan penyakit menular, agar intervensi yang dilakukan lebih efektif dan sesuai </span></span><br><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">dengan karakteristik wilayah.</span></span></p> rizty Maulida Badri, Khusnun Nisa, Jaclin Alcavella, Johannes Krisjon Silitonga, Irvan Alfaritzi, Febri Dwi Irawati, Rani Puspita Sari ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/470 Thu, 24 Jul 2025 01:57:10 +0000 Implementasi Ekosistem Big Data Menggunakan Hadoop untuk Analisis Prediksi Curah Hujan dengan Metode Random Forest di Kota Bandar Lampung https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/473 <p>Prediksi curah hujan yang akurat sangat penting dalam mendukung mitigasi bencana dan <br>perencanaan sumber daya air, khususnya di wilayah rawan bencana seperti Kota Bandar Lampung. <br>Penelitian ini bertujuan untuk mengembangkan sistem prediksi curah hujan berbasis algoritma <br>Random Forest yang dijalankan pada ekosistem Big Data Hadoop. Data cuaca harian dari BMKG <br>tahun 2020–2024 diolah menggunakan arsitektur Medallion (Bronze, Silver, Gold) dan diproses <br>melalui pipeline Spark MLlib untuk pelatihan model klasifikasi. Proses melibatkan pembersihan data, <br>transformasi, kategorisasi curah hujan, serta evaluasi model menggunakan metrik presisi, recall, dan <br>f1-score. Hasil menunjukkan bahwa model sangat baik dalam mengklasifikasikan hujan ringan, <br>namun belum optimal dalam memprediksi kelas minor seperti hujan sedang dan lebat. Temuan ini <br>menunjukkan perlunya penanganan ketidakseimbangan kelas dan pengayaan data minor. Sistem ini <br>memberikan kontribusi nyata dalam integrasi teknologi Hadoop untuk prediksi iklim lokal dan <br>mendukung pengembangan sistem peringatan dini berbasis Big Data.</p> Chalifia Wananda, Ardika Satria, Kemas Veriandra Ramadhan, Haikal Dwi Syaputra, Dwi Sulistiania, Vidia Vidia, Luluk Muthoharoh ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/473 Thu, 24 Jul 2025 02:01:11 +0000 Evaluasi Kinerja Metode Interpolasi Spasial untuk Estimasi Curah Hujan: https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/475 <p>Indonesia yang terletak di garis khatulistiwa memiliki iklim tropis dengan intensitas curah hujan yang tinggi di sebagian besar wilayahnya, termasuk Provinsi Sumatera Utara. Curah hujan (dalam mm) merupakan ukuran ketinggian air hujan yang tertampung pada permukaan datar tanpa aliran. Penelitian ini bertujuan untuk membandingkan tiga metode interpolasi spasial <em>Inverse Distance Weighting</em> (IDW), <em>Spline</em>, dan <em>Kriging</em> dalam memodelkan distribusi curah hujan di Provinsi Sumatera Utara pada kuartal pertama tahun 2025. Data yang digunakan berupa curah hujan bulanan dari sepuluh stasiun meteorologi yang tersebar di wilayah studi. Setiap metode interpolasi diterapkan untuk menghasilkan model spasial curah hujan, yang kemudian dievaluasi menggunakan metrik <em>Root Mean Square Error</em> (RMSE) dan <em>Mean Absolute Error</em> (MAE). Hasil penelitian menunjukkan bahwa metode <em>Spline</em> memberikan hasil terbaik, dengan nilai RMSE sebesar 17.674 dan MAE sebesar 11.111, serta mampu mengidentifikasi wilayah dengan curah hujan tinggi di sekitar Stasiun Meteorologi Tobing dan wilayah dengan curah hujan rendah di sekitar Stasiun Kualanamu. Hasil penelitian menunjukkan bahwa metode Spline lebih akurat dalam merepresentasikan variasi spasial curah hujan dibandingkan metode lainnya, dan direkomendasikan untuk digunakan dalam pemetaan distribusi curah hujan di wilayah dengan keterbatasan titik pengamatan.</p> Febri Dwi Irawati, Elilya Octaviani, Dhea Amelia Putri, Virdio Samuel Saragih, Lia Alyani, Ibrahim Al-Kahfi, Rizty Maulida Badri ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/475 Thu, 24 Jul 2025 02:02:45 +0000 Interpolasi Fire Radiative Power (FRP) di Kalimantan Barat Menggunakan Ordinary Kriging https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/448 <p><strong><em>Abstract:&nbsp; </em></strong><em>Fire Radiative Power (FRP) is an indicator used to evaluate the intensity of forest fires. Forest and land fires are environmental disasters with widespread impacts, especially in regions such as West Kalimantan, which frequently experience such events. Accurate FRP prediction is crucial for fire suppression and mitigation efforts. This study aims to predict FRP values in West Kalimantan for July, August, and September 2024 using the Ordinary Kriging method. FRP data were obtained from the VIIRS NOAA-20 satellite through the NASA FIRMS website, with spatial variables including latitude, longitude, and FRP values. The analysis showed that all three months followed a normal distribution. The best semivariogram model for July and August was the spherical model, while the Gaussian model was used for September based on the smallest RMSE value. The highest and lowest estimated FRP values varied each month and were distributed across different regencies. The prediction maps indicated that hotspots with high intensity tended to shift between regions each month, with certain concentrations appearing in specific areas.</em></p> <p><strong><em>Keywords: </em></strong><em>Fire Radiative Power</em><em>, Kriging, Semivariogram, Forest Fire</em></p> <p><strong>Abstrak: </strong><em>Fire Radiative Power</em> (FRP) merupakan indikator yang digunakan untuk mengevaluasi intensitas kebakaran hutan. Kebakaran hutan dan lahan merupakan bencana lingkungan yang berdampak luas, terutama di wilayah seperti Kalimantan Barat yang sering mengalami kejadian tersebut. Prediksi FRP yang akurat menjadi sangat penting dalam pemadaman kebakaran dan upaya mitigasi. Penelitian ini bertujuan untuk memprediksi dengan menggunakan nilai <em>Fire Radiative Power</em> (FRP) di Kalimantan Barat pada bulan Juli, Agustus, dan September 2024 menggunakan metode <em>Ordinary Kriging</em>. Data FRP diperoleh dari satelit VIIRS NOAA-20 melalui <em>website</em> FIRMS NASA, dengan variabel spasial berupa <em>latitude</em>, <em>longitude</em>, dan nilai FRP. Hasil analisis menunjukkan bahwa ketiga bulan memiliki distribusi normal. Model semivariogram terbaik untuk bulan Juli dan Agustus adalah model <em>spherical</em>, sedangkan September menggunakan model <em>gaussian</em> berdasarkan nilai RMSE terkecil. Estimasi nilai FRP tertinggi dan terendah berbeda tiap bulan dan tersebar di berbagai kabupaten. Peta prediksi menunjukkan bahwa titik panas dengan intensitas tinggi cenderung bergeser antarwilayah pada setiap bulan, dengan konsentrasi tertentu muncul di beberapa kabupaten.</p> <p><strong>Kata kunci: </strong><em>Fire Radiative Power</em>, <em>Kriging</em>, Semivariogram, Kebakaran Hutan</p> Gita Fitriyana ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/448 Thu, 24 Jul 2025 02:30:04 +0000 Pengelompokan Provinsi di Indonesia Berdasarkan Indikator Kesehatan Lingkungan Menggunakan Metode K-Harmonic Means dengan Optimasi Particle Swarm Optimization https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/479 <p><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">Lingkungan memiliki peran penting dalam mencapai kesehatan masyarakat yang optimal, dengan indikator kesehatan lingkungan sebagai faktor penentu dalam pencegahan penyakit dan peningkatan kualitas hidup. Penelitian ini bertujuan untuk mengelompokkan provinsi di Indonesia berdasarkan Indikator Kesehatan Lingkungan tahun 2023 menggunakan dua metode, yaitu </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">K-Harmonic Means</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> (KHM) dan metode </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">Particle Swarm Optimization K-Harmonic Means</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> (PSOKHM). Hasil </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">cluster</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> divalidasi menggunakan </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">Silhouette Index</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> , </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">Dunn Index</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> , dan </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">Connectivity Index</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> untuk menentukan nilai parameter yang optimal setiap </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">cluster</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> . Kemudian, menghitung rasio simpangan baku untuk menentukan banyaknya </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">cluster</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> yang optimal. Metode KHM menghasilkan </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">cluster</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> optimal yaitu 4 </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">cluster</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> dengan nilai parameter yaitu 4, sedangkan PSOKHM </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">cluster</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> optimal yaitu 4 </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">cluster</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> dengan nilai parameter yaitu 4. Hasil perbandingan rasio simpangan baku menunjukkan bahwa PSOKHM memiliki nilai rasio terkecil yaitu 0.1829759, menjadikan metode yang lebih optimal dibandingkan KHM. Berdasarkan hasil interpretasi terhadap karakteristik dan profilisasi </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">cluster</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> , terdapat variasi kondisi kesehatan lingkungan di Indonesia, dengan </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">cluster</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> 1 baik pengawasan udara dan sanitasi tetapi perlunya perbaikan rumah layak huni, </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">cluster</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> 2 kuat kebijakan hidup sehat tetapi ada masalah sanitasi, </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">cluster</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> 3 perlu tingkatkan pengawasan fasilitas dan </span></span><em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;">cluster</span></span></em><span style="vertical-align: inherit;"><span style="vertical-align: inherit;"> 4 memiliki akses air dan sanitasi yang masih rendah.</span></span></p> Nida Faoziatun Khusna, Rochdi Wasono, Ariska Fitriyana Ningrum ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/479 Thu, 24 Jul 2025 02:31:38 +0000 PENGEMBANGAN DASHBOARD KEUANGAN DAN PREDIKSI PEMASUKAN YAYASAN X DENGAN PENDEKATAN AUTOREGRESSION MOVING AVERAGE (ARMA) 2024-2025 https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/480 <p class="Abstract" style="text-indent: 0cm;"><span lang="EN-US" style="font-weight: normal;">Prediksi pemasukan harian sangat penting dalam membantu Yayasan X merencanakan anggaran dan strategi keuangan yang lebih tepat. Penelitian ini bertujuan membangun model prediksi pemasukan menggunakan prediksi time series ARMA berdasarkan data pemasukan harian selama September 2024 hingga Maret 2025. Proses meliputi pengumpulan data, eksplorasi, pemrosesan data, pembangunan model, serta evaluasi performa model. Variabel yang di prediksi merupakan variabel KP (Kotak Peduli) karena mempunyai pendapatan yang paling besar. Hasil evaluasi menunjukkan bahwa model menghasilkan Mean Absolute Error (MAE) sebesar Rp781.971, Mean Squared Error (MSE) sebesar Rp894 miliar, dan Root Mean Squared Error (RMSE) sebesar Rp945.793. Nilai RMSE yang mendekati Rp1 juta menunjukkan deviasi rata-rata prediksi dari nilai aktual harian cukup tinggi. Hal ini menandakan bahwa meskipun model mampu mengikuti tren umum pemasukan, akurasinya terhadap fluktuasi harian masih rendah. Oleh karena itu, model perlu disempurnakan agar dapat menangkap variabilitas data secara lebih baik. Visualisasi hasil prediksi dan data aktual juga ditampilkan dalam dashboard interaktif untuk membantu pengambilan Keputusan.</span></p> <p class="Abstract" style="text-indent: 0cm;"><span lang="EN-US">Kata kunci: Prediksi time series, evaluasi model, visualisasi data</span></p> Shefira Eka Purtri ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/480 Thu, 24 Jul 2025 02:33:03 +0000 Peramalan Luas Area Kebakaran Menggunakan Metode Particle Swarm Optimization Extreme Learning Machine https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/481 Latisa Alifa Maura, Fatkhurokhman Fauzi, Ali Imron ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/481 Thu, 24 Jul 2025 02:35:39 +0000 Regresi Nonparametrik Kernel Triangle dan Gaussian dengan Estimator Priestley-Chao untuk Pemodelan Kasus AIDS di Pulau Jawa https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/482 <p><em>Infection with the Human Immunodeficiency Virus (HIV). In Indonesia, the number of AIDS cases increased in 2023, with the highest cases recorded in provinces on the island of Java. This study aims to model the relationship between socioeconomic factors and the number of AIDS cases in Java using the Priestley-Chao kernel nonparametric regression. The nonparametric approach was chosen for its flexibility and because it does not require assumptions about the form of the relationship. The Priestley-Chao estimator has the advantage of producing smooth estimates even with limited data. This study compares two kernel functions: the triangle kernel, which performs well in modeling fluctuating data, and the Gaussian kernel, which is defined over all real numbers. The analysis showed that the best triangle kernel model was obtained with a bandwidth combination of h1 = 0.10, h2 = 0.20, and h3 = 0.25, resulting in a minimum GCV value of 0.003178. The best Gaussian kernel model was found at h1 = 0.10, h2 = 0.14, and h3 = 0.10, with a minimum GCV value of 0.008402. Based on MSE and R² values, the triangle kernel demonstrated better performance (MSE = 0.003129; R² = 0.887730) compared to the Gaussian kernel (MSE = 0.008247; R² = 0.704080).</em></p> Alfidha Rahmah, Tiani Wahyu Utami, Alwan Fadlurohman ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/482 Thu, 24 Jul 2025 02:39:39 +0000 Optimasi Segmentasi Tingkat Biaya Hidup Provinsi di Indonesia Berdasarkan Harga Komoditas dan Layanan https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/483 <p><span style="font-weight: 400;">Tingkat biaya hidup di Indonesia menunjukkan variasi signifikan antarprovinsi, dipengaruhi oleh harga komoditas pokok (beras, telur ayam, daging sapi, cabai merah, minyak goreng), tarif listrik, upah minimum provinsi (UMP), garis kemiskinan, dan indeks kemahalan konstruksi (IKK). Penelitian ini bertujuan mengelompokkan provinsi berdasarkan kesamaan karakteristik biaya hidup menggunakan dua pendekatan </span><em><span style="font-weight: 400;">clustering</span></em><span style="font-weight: 400;">: </span><em><span style="font-weight: 400;">K-Means</span></em><span style="font-weight: 400;"> dan </span><em><span style="font-weight: 400;">Hierarchical Clustering</span></em><span style="font-weight: 400;"> dengan </span><em><span style="font-weight: 400;">Ward linkage</span></em><span style="font-weight: 400;"> dengan klaster yang terpilih sejumlah 3 klaster. Data distandardisasi menggunakan </span><em><span style="font-weight: 400;">Z-Score</span></em><span style="font-weight: 400;"> dan direduksi dimensinya dengan </span><em><span style="font-weight: 400;">Principal Component Analysis</span></em><span style="font-weight: 400;"> (PCA). Hasil analisis menunjukkan bahwa PCA meningkatkan kualitas </span><em><span style="font-weight: 400;">clustering</span></em><span style="font-weight: 400;"> dengan </span><em><span style="font-weight: 400;">Silhouette Score</span></em><span style="font-weight: 400;"> tertinggi 0.44 pada metode </span><em><span style="font-weight: 400;">Ward</span></em><span style="font-weight: 400;">. Di sisi lain, </span><em><span style="font-weight: 400;">K-Means</span></em><span style="font-weight: 400;"> menghasilkan </span><em><span style="font-weight: 400;">Silhouette Score</span></em><span style="font-weight: 400;"> 0.41 dengan distribusi klaster yang lebih stabil dan tanpa </span><em><span style="font-weight: 400;">outlier</span></em><span style="font-weight: 400;">. Karakteristik pada metode </span><em><span style="font-weight: 400;">K-Means clustering</span></em><span style="font-weight: 400;"> menunjukkan tiga pola klaster berbeda. Klaster 0 mencakup wilayah dengan biaya hidup menengah terutama di Indonesia bagian Timur seperti Papua dan Maluku, klaster 2 mencakup wilayah dengan dengan biaya hidup rendah seperti Jawa, Bali, dan Sulawesi, sementara klaster 1 mencakup provinsi </span><em><span style="font-weight: 400;">outlier</span></em><span style="font-weight: 400;"> dengan biaya hidup yang sangat tinggi. Berdasarkan pertimbangan ini, penelitian memilih metode </span><em><span style="font-weight: 400;">K-Means</span></em><span style="font-weight: 400;"> sebagai pendekatan </span><em><span style="font-weight: 400;">clustering</span></em><span style="font-weight: 400;"> yang lebih andal untuk analisis segmentasi biaya hidup. Temuan ini memberikan dasar penting bagi penyusunan kebijakan publik yang lebih tepat sasaran sesuai karakteristik ekonomi masing-masing wilayah.</span></p> Muhammad Erlangga Kurniawan, Muhammad Cahya Raka Anugrah, Aditya Putra Ananta, Shindi Sheila May Wara, Wahyu Syaifullah Jauharis Saputra ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/483 Thu, 24 Jul 2025 02:37:57 +0000 Penerapan Geographically and Temporally Weighted Regression (GTWR) dalam Menganalisis Tingkat Pengangguran Terbuka di Indonesia https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/484 <p><em>The Open Unemployment Rate (OUR) is a key indicator for measuring labor market absorption and reflects the employment condition of a region. A high OUR in Indonesia indicates an imbalance between labor supply and demand, which may impact economic growth and societal welfare. This study aims to analyze the influence of social, economic, and environmental factors on OUR across 34 provinces in Indonesia during the 2019–2023 period using a spatio-temporal approach. The Geographically Weighted Regression (GWR) method is employed to capture spatial variation, while the Geographically and Temporally Weighted Regression (GTWR) method is applied to simultaneously account for spatial and temporal variation. The best model is selected based on the lowest Akaike Information Criterion (AIC), the highest R², and the lowest Cross-Validation (CV) value. The GTWR model with an adaptive tricube kernel weighting shows the best performance with an AIC of 196.8463, R² of 0.9776, and a MAPE of 3.1626. These results indicate that the GTWR model provides more accurate and context-sensitive estimates, making it a valuable tool for policymakers in formulating more effective and region-specific strategies to reduce unemployment.</em></p> Arya Praditya, Prizka Rismawati Arum, Alwan Fadlurohman ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/484 Thu, 24 Jul 2025 02:41:13 +0000 Implementasi Metode XGBoost dan SHAP untuk Klasifikasi dan Analisis Faktor Risiko Penyakit Diabetes Mellitus https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/487 <p>Diabetes Mellitus (DM) adalah penyakit tidak menular dengan prevalensi yang terus meningkat. Deteksi dini dan pemahaman terhadap faktor risiko menjadi langkah penting untuk mencegah komplikasi yang lebih serius. Penelitian ini bertujuan membangun model klasifikasi risiko diabetes serta mengidentifikasi faktor-faktor yang paling berpengaruh terhadap hasil prediksi. Metode yang digunakan adalah algoritma <em>Extreme Gradient Boosting</em> (XGBoost) untuk klasifikasi dan <em>Shapley Additive Explanations</em> (SHAP) untuk menilai pengaruh masing-masing variabel. Dataset yang digunakan adalah <em>Early Stage Diabetes Risk Prediction Dataset</em> dari <em>UCI Machine Learning Repository</em> yang berisi 520 observasi dengan 16 variabel prediktor. Hasil penelitian menunjukkan bahwa model XGBoost mampu mengklasifikasikan risiko diabetes dengan baik, dengan akurasi 98,7%. SHAP mengidentifikasi gejala <em>polyuria</em>, <em>polydipsia</em>, serta faktor <em>gender</em> sebagai variabel yang paling berkontribusi terhadap klasifikasi risiko diabetes. Kombinasi XGBoost dan SHAP tidak hanya mampu memberikan prediksi yang akurat, tetapi juga menjelaskan alasan di balik keputusan model, sehingga dapat menjadi alat bantu yang potensial dalam deteksi dini dan pengambilan keputusan medis berbasis data.</p> Fatika Lovina Febrianti, Indah Manfaati Nur, M. Al Haris, Saeful Amri ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/487 Thu, 24 Jul 2025 03:25:35 +0000 Pengelompokan Kabupaten/Kota di Jawa Tengah Berdasarkan Rasio Tenaga Kesehatan Menggunakan Metode Fuzzy Gustafson Kessel https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/488 <p>Pelayanan kesehatan yang memadai sangat dibutuhkan oleh masyarakat, salah satunya adalah ketersediaan tenaga kesehatan. Berdasarkan data dari BPS, sebagian besar daerah di Jawa Tengah tidak memenuhi target rasio tenaga kesehatan yang ditetapkan oleh Kementrian Kesehatan. Padahal jumlah tenaga kesehatan Provinsi Jawa Tengah merupakan jumlah terbanyak ketiga pada 10 dari 13 jenis tenaga kesehatan. Hal ini menandakan bahwa distribusi tenaga kesehatan di Jawa Tengah belum merata dengan baik. Hal ini bisa berdampak pada pelayanan kesehatan kepada masyarakat menjadi tidak optimal. Oleh karena itu dilakukan pengelompokan kabupaten/kota dengan analisis klaster, sehingga bisa menjadi bahan pertimbangan bagi pemerintah agar distribusi tenaga kesehatan lebih baik. Metode klastering yang digunakan yaitu <em>fuzzy Gustafson Kessel</em>. Metode ini mampu menjaga kualitas klaster meski dengan adanya pencilan. Data yang digunakan yaitu data rasio tenaga kesehatan Kabupaten/Kota di Jawa Tengah tahun 2023 yang terdiri atas 9 jenis tenaga kesehatan. Penelitian ini bertujuan mengetahui hasil dan karakteristik pengelompokan kabupaten/kota berdasarkan rasio tenaga kesehatan. Hasil analisis data menunjukkan jumlah klaster terbaik yaitu 5 klaster berdasarkan nilai Indeks <em>Xie-Beni</em> terkecil yaitu 6,8726. Klaster 1 memiliki 1 anggota, klaster 2 memiliki 24 anggota, klaster 3 memiliki 3 anggota, klaster 4 memiliki 6 anggota, dan klaster 5 memiliki 1 anggota.</p> M. Al Haris, Abid Makarim Dyfa, Ali Imron ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/488 Thu, 24 Jul 2025 03:28:34 +0000 Analisis Sentimen Aplikasi Sapawarga Menggunakan Web Scraping pada Jabar Super App https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/489 <p><span style="font-weight: 400;">Kemajuan teknologi informasi telah mendorong digitalisasi layanan publik, salah satunya melalui aplikasi </span><em><span style="font-weight: 400;">mobile </span></em><span style="font-weight: 400;">seperti Sapawarga milik Pemerintah Provinsi Jawa Barat. Penelitian ini bertujuan untuk menganalisis sentimen pengguna terhadap aplikasi Sapawarga dengan menerapkan teknik analisis sentimen menggunakan algoritma </span><em><span style="font-weight: 400;">machine learning</span></em><span style="font-weight: 400;">. Data ulasan pengguna dikumpulkan dari Google Play Store melalui teknik </span><em><span style="font-weight: 400;">web scraping </span></em><span style="font-weight: 400;">dan diberi label berdasarkan rating bintang. Tahapan </span><em><span style="font-weight: 400;">preprocessing</span></em><span style="font-weight: 400;"> mencakup pembersihan teks, </span><em><span style="font-weight: 400;">case folding</span></em><span style="font-weight: 400;">, tokenisasi, </span><em><span style="font-weight: 400;">stopword removal</span></em><span style="font-weight: 400;">, dan </span><em><span style="font-weight: 400;">stemming</span></em><span style="font-weight: 400;">. Teks kemudian direpresentasikan menggunakan metode TF-IDF dan diklasifikasikan dengan algoritma </span><em><span style="font-weight: 400;">Support Vector Machine (SVM)</span></em><span style="font-weight: 400;"> dan </span><em><span style="font-weight: 400;">Logistic Regression</span></em><span style="font-weight: 400;">. Evaluasi dilakukan menggunakan akurasi, presisi, </span><em><span style="font-weight: 400;">recall</span></em><span style="font-weight: 400;">, dan </span><em><span style="font-weight: 400;">F1-score</span></em><span style="font-weight: 400;"> dengan teknik </span><em><span style="font-weight: 400;">5-fold cross-validation</span></em><span style="font-weight: 400;">. </span><em><span style="font-weight: 400;">Logistic Regression</span></em><span style="font-weight: 400;"> menunjukkan performa terbaik dengan akurasi 84,4%, presisi 84,1%, </span><em><span style="font-weight: 400;">recall </span></em><span style="font-weight: 400;">82,8%, dan </span><em><span style="font-weight: 400;">F1-score</span></em><span style="font-weight: 400;"> 83,3%. Mayoritas ulasan pengguna termasuk dalam kategori positif, menunjukkan kepuasan pengguna secara umum, meskipun masih terdapat keluhan teknis. Hasil ini menunjukkan pentingnya analisis sentimen dalam peningkatan layanan publik digital serta memberikan wawasan berbasis data untuk pengembangan aplikasi Sapawarga agar lebih responsif terhadap kebutuhan masyarakat Jawa Barat.</span></p> Kevin Brema Saputra Sinulingga, Hana Titania Sastrian, Shindi Shella May Wara ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/489 Thu, 24 Jul 2025 03:31:06 +0000 Sentiment Analysis of KA Bandara Application Using Support Vector Machine and Random Forest Methods https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/491 <p><strong><em>&nbsp;</em></strong><em><span style="font-weight: 400;">Digital transformation has significantly impacted public transportation services, including the adoption of the KA Bandara application that facilitates ticket booking and travel information access. User reviews on the Google Play Store serve as a valuable source for analyzing user perceptions regarding service quality. This study performs sentiment analysis on 1,000 KA Bandara app reviews using two classification algorithms: Support Vector Machine (SVM) and Random Forest (RF). The review data were collected via web scraping and preprocessed through steps such as case folding, tokenization, stopword removal, and stemming. Text features were extracted using TF-IDF, and sentiment labels were assigned based on star ratings (positive: 4–5; negative: 1–3). The models were evaluated using accuracy, precision, recall, and F1-score metrics. The results indicate that SVM outperforms RF, achieving an accuracy of 89%, while RF recorded 86.5%. This research confirms the superior performance of SVM for sentiment classification of digital app reviews. The findings offer actionable insights for developers to enhance service quality by leveraging user feedback.&nbsp;</span></em></p> Muhammad Hilmy Maulana ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/491 Thu, 24 Jul 2025 00:00:00 +0000 Analisis Diskriminan Terhadap Angka Partisipasi Kasar Perguruan Tinggi berdasarkan Faktor Pendidikan dan Sosial Ekonomi https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/492 <p><em>The level of participation in higher education or GER, reflects the key to developing superior and competitive human resources. GER serves as a primary measure to evaluate the effectiveness of education equity policies, considering socioeconomic factors such as income level, poverty rate, and education budget allocation. In addition, GER is influenced by educational factors, particularly the number of higher education institutions, the percentage of college graduates, and the completion rate of senior secondary education. The secondary data used in this study was sourced from the Central Statistics Agency (BPS) and covers all provinces in Indonesia. The objective is to identify characteristics that differentiate provinces based on GER levels. The primary method used is discriminant analysis, which enables classification modeling based on key educational variables. The results show that the percentage of college graduates and the senior secondary completion rate are the most influential in distinguishing provincial GER levels. The resulting discriminant function is: </em> <em>−8.217 + 0.394</em> <em>&nbsp;(</em><em>percentage of college graduates) + 0.055</em> <em>&nbsp;(</em><em>senior secondary completion rate), with a classification accuracy of 81,6%. These findings provide an essential basis for designing more targeted higher education policies to address disparities in access across regions.</em></p> Muhammad Arsyad Alzam, Shifa Elmaliyasari, Nanda Aulia Pratiwi, Aviolla Terza Damaliana, Shindi Shella May Wara ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/492 Thu, 24 Jul 2025 03:35:40 +0000 Pemanfaatan Hybrid Molecular Fingerprints dan XGBoost untuk Identifikasi Senyawa Herbal Antimalaria https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/493 <p>Malaria masih menjadi tantangan kesehatan global, terutama di daerah tropis, dengan resistensi obat dan efek samping yang mendorong pencarian alternatif lebih aman. Senyawa herbal berpotensi karena keanekaragaman hayati dan sifatnya yang ramah lingkungan. Penelitian ini menggunakan pendekatan supervised learning dengan Extreme Gradient Boosting (XGBoost) untuk memprediksi senyawa herbal antimalaria. Data senyawa aktif diperoleh dari PuChem, ChEMBL, DUDE, dan OMIM, sedangkan data senyawa herbal diambil dari HerbalDB dan IJAH Analytics. Metodologi meliputi pengumpulan data, ekstraksi fitur menggunakan hybrid molecular fingerprint (PubChem + Klekota-Roth), pelabelan kelas, pemodelan XGBoost, evaluasi, dan prediksi. Model XGBoost mencapai akurasi 0,75 dan mengidentifikasi kandidat potensial seperti Anacardic Acid dan Emetine dengan probabilitas tinggi. Senyawa lain seperti Cannabigerolic Acid dan Ginkgolic Acid juga menunjukkan potensi, tetapi memerlukan penelitian lebih lanjut terkait toksisitas dan mekanisme kerjanya. Penelitian ini membuktikan bahwa kombinasi hybrid molecular fingerprint dan XGBoost dapat mempercepat penemuan senyawa herbal antimalaria berbasis data ilmiah secara lebih efisien.</p> Mediliadita Dwi Dimastia ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/493 Thu, 24 Jul 2025 03:37:36 +0000 Segmentasi Wilayah Provinsi di Indonesia Berdasarkan Indeks Penanganan Stunting Menggunakan PCA dan Partition Clustering https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/498 <p><em>Stunting is a public health issue that has long-term impacts on children's cognitive development, productivity, and quality of life. This study aims to cluster provinces in Indonesia based on stunting-related indicators using two partition clustering methods: K-Means and K-Medoids. The analysis involved nine indicators, including immunization coverage, delivery assistance by health professionals, use of modern contraception, exclusive breastfeeding, access to safe drinking water, proper sanitation, food insecurity rate, early childhood education (PAUD) participation, and the percentage of young children from poor families. Dimensionality reduction was performed using Principal Component Analysis (PCA) to improve clustering efficiency and visualization. The clustering performance was evaluated using four internal metrics: Silhouette Coefficient, Davies-Bouldin</em> Index,<em> Calinski-Harabasz Index, and Dunn Index. The results showed that K-Means produced more optimal segmentation than K-Medoids, forming two main clusters. The first cluster includes provinces with strong performance across the indicators, while the second cluster represents provinces with lower performance and higher stunting vulnerability. These findings can serve as a basis for the government to design more targeted stunting interventions tailored to the specific characteristics of each region.</em></p> Farhan Syah Putra Wiyono, Laisal Kaffi, Mohammad Hikmal Maulana, Aviolla Terza Damaliana, Shindi Shella May Wara ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/498 Thu, 24 Jul 2025 03:39:46 +0000 Analisis_Faktor-Faktor_yang_Mempengaruhi_Angka_Harapan_Hidup_(AHH)_di_Papua_Menggunakan_Regresi_Logis https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/499 <p>Angka Harapan Hidup (AHH) menjadi salah satu indikator utama untuk menilai tingkat kesehatan dan kesejahteraan suatu daerah. Di Provinsi Papua, nilai AHH masih berada di bawah rata-rata nasional, yang mengindikasikan adanya tantangan tersendiri dalam upaya meningkatkan kualitas hidup penduduknya. Penelitian ini menganalisis faktor-faktor yang mempengaruhi AHH menggunakan model regresi logistik biner untuk mengklasifikasikan kategori AHH tinggi atau rendah. Hasil analisis menunjukkan bahwa variabel seperti persentase penduduk miskin, cakupan imunisasi lengkap, jumlah tenaga medis dan layanan kesehatan, tingkat buta huruf, serta Produk Domestik Regional Bruto (PDRB) per kapita berpengaruh signifikan terhadap AHH di Papua. Temuan ini dapat menjadi dasar bagi perumusan kebijakan untuk meningkatkan derajat kesehatan dan kesejahteraan masyarakat di Provinsi Papua.</p> Nur Aida Rahmasari, Indah Rahma Abdillah, Fretty Novelyna Ramadhani, Aviolla Terza Damaliana, Shindi Shella May Wara ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/499 Thu, 24 Jul 2025 03:42:17 +0000 Text Summarization Berita Online Menggunakan Named Entity Recognition (NER) dan Part of Speech (POS) Tagging https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/500 <p><em>The objective of this research is to develop an automated online news system using Named Entity Recognition (NER) and several voice-based technologies. This system will help readers quickly and efficiently grasp core information by extracting key message texts. The methods employed include data collection preparation (case folding, tokenization, stopword removal, filtering, stemming) from CNN Indonesia news pages, as well as utilizing NER and POS tagging to identify entity structures and important statements. Summary Quality Assessment was conducted using the BERTScore metric. The results indicate that the combination of NER and POS Tagging yields the best performance, with an F1-score of 0.74, surpassing the use of NER (0.709) or POS Tagging (0.734) individually. This combination improves precision (0.732) without affecting recall (0.7486), demonstrating its effectiveness in gathering essential information. The study proves that integrating NER and POS tags is effective for text summarization and can serve as a solution for presenting concise and relevant information to users.</em></p> Mediliadita Dwi Dimastia ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/500 Thu, 24 Jul 2025 03:44:28 +0000 Pemetaan Topik Percakapan Terkait Fenomena “#KaburAjaDulu” di Twitter Menggunakan IndoBERT dan Klasterisasi Hirarki https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/501 <p>Fenomena "#KaburAjaDulu" di Twitter mencerminkan respons masyarakat terhadap tekanan sosial, <br>ekonomi, dan politik yang dirasakan dalam kehidupan sehari-hari. Penelitian ini bertujuan untuk memetakan topik <br>percakapan publik yang muncul melalui tagar tersebut sebagai bentuk wacana kolektif digital. Sebanyak 855 tweet <br>dikumpulkan melalui proses crawling dari Twitter, kemudian diproses dengan tahapan text preprocessing dan <br>dikonversi menjadi representasi vektor menggunakan model IndoBERT. Selanjutnya, dilakukan klasterisasi <br>menggunakan metode Hierarchical Clustering berbasis cosine distance dan average linkage. Hasil penelitian <br>menunjukkan tiga klaster utama yang mencerminkan variasi makna dalam penggunaan tagar, mulai dari ungkapan <br>emosional, pertimbangan rasional, hingga kritik sosial-politik. Temuan ini menunjukkan bahwa media sosial <br>berperan sebagai ruang artikulasi keresahan publik dan bahwa pendekatan NLP berbasis IndoBERT efektif dalam <br>mengungkap pola wacana yang tersembunyi dalam percakapan daring.</p> Galuh Andini, I Putu Krishna Deny Deny Suadnyana, Garudo Puji Sandiyudho ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/501 Thu, 24 Jul 2025 03:46:13 +0000 Pendekatan Design Thinking dalam Perancangan Desain Antarmuka dan Pengalaman Pengguna Sistem Informasi Akuntansi Yayasan Pendidikan https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/438 <p>Pengelolaan data keuangan pada saat ini yang efisien dan akurat menjadi sangat penting bagi institusi pendidikan. Sistem informasi akuntansi yang baik dapat membantu yayasan pendidikan dalam mengelola data keuangan secara lebih efektif, mengurangi risiko kesalahan, dan meningkatkan transparansi. Penelitian ini bertujuan untuk merancang sistem informasi akuntansi yang efektif dan efisien untuk Yayasan Pendidikan dengan menerapkan metode Design Thinking. Metode ini terdiri dari lima tahapan: Empathize, Define, Ideate, Prototype, dan Testing, yang berfokus pada pemahaman kebutuhan pengguna dan pengembangan solusi yang inovatif. Melalui tahap Empathize, informasi dikumpulkan melalui observasi dan wawancara untuk memahami kebutuhan pengguna. Tahap Define menganalisis data yang diperoleh untuk merumuskan masalah, sedangkan tahap Ideate melibatkan pengembangan ide-ide untuk desain antarmuka. Pembuatan prototype dilakukan berdasarkan hasil ideasi, yang kemudian diuji untuk memastikan kesesuaian dengan kebutuhan pengguna. Pengujian yang di gunakan dalam penelitian kali ini adalah User Acceptance Testing untuk mengevaluasi sejauh mana sistem prototipe yang dikembangkan dapat diterima oleh pengguna akhir. Penelitian ini diharapkan dapat meningkatkan akurasi dan efisiensi dalam pengelolaan data keuangan, serta memberikan solusi yang lebih modern dan user-friendly bagi yayasan pendidikan.</p> Intan Dzikria, Nurul Duwi Putri Lestari ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/438 Thu, 24 Jul 2025 04:14:02 +0000 Sistem Informasi Corporate Social Responsibility https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/442 <p>Perusahaan saat ini dihadapkan pada tuntutan untuk menjalankan tanggung jawab sosial dan lingkungan secara lebih aktif guna menciptakan nilai berkelanjutan. Corporate Social Responsibility (CSR) menjadi bagian integral dari praktik tata kelola perusahaan yang baik (<em>good corporate governance</em>), sebagaimana diamanatkan dalam Undang-Undang Nomor 40 Tahun 2007. Namun, implementasi CSR sering kali masih bersifat formalitas, tanpa integrasi dalam proses bisnis dan minim partisipasi pemangku kepentingan. Penelitian ini bertujuan untuk merancang antarmuka dan pengalaman pengguna sistem informasi CSR perusahaan menggunakan pendekatan design thinking. Metode ini menekankan pemahaman mendalam terhadap kebutuhan pengguna melalui lima tahap iteratif. Dengan pendekatan ini, diharapkan sistem informasi CSR yang dikembangkan dapat meningkatkan keterlibatan pemangku kepentingan, mendorong transparansi, serta memperkuat dampak sosial dan lingkungan secara berkelanjutan.</p> Intan Dzikria, Mirza Azzahra Kisworo ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/442 Thu, 24 Jul 2025 03:52:12 +0000 ANALYSIS OF REACTANT VELOCITY DIFFERENCES ON BUNSEN BURNER FLAME IN ANSYS FLUENT SIMULATION METHOD https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/439 <p><em>Renewable and new green energy utilization such as the effect of H<sub>2</sub>-air combustion by using tools to measure laminar flame speed, one of which is Bunsen burner. Measurements in the study were carried out through CFD simulations that varied the reactant speed against the Bunsen flame speed. The highest reactant velocity of 3 m/s from the H<sub>2</sub>-air mixture produces the greatest flame height, temperature, and laminar flame speed. This is because the combustion process of the H<sub>2</sub>-air mixture occurs so quickly that it produces stable combustion under stoichiometric conditions</em></p> Muharman muharman ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/439 Thu, 24 Jul 2025 04:03:08 +0000 Kustomisasi Odoo 16 Community Edition untuk Proses Pengadaan Barang Berbasis Evaluasi ISO 9241-11 https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/444 <p><em>In the digital era, companies are required to apply information technology to improve operational&nbsp;</em><em>efficiency and support data-driven decision-making. One of the common challenges in the procurement process,&nbsp;</em><em>which involves multiple departments, is the inefficiency in data recording and verification. This can lead to&nbsp;</em><em>budget overruns and potential price manipulation. This study aims to implement and customize an open-source&nbsp;</em><em>Enterprise Resource Planning (ERP) system, namely Odoo 16 Community Edition, to align with the specific&nbsp;</em><em>needs of the company's procurement process. The customization focuses on the Procurement Process module&nbsp;</em><em>and is evaluated based on usability aspects according to the ISO 9241-11 standard, which includes&nbsp;</em><em>effectiveness, efficiency, and user satisfaction. Data were collected through surveys and interviews with users&nbsp;</em><em>directly involved in the procurement activities. The evaluation results show that the customized system enhances&nbsp;</em><em>efficiency and transparency in the procurement process. This study is expected to contribute to the existing&nbsp;</em><em>literature on ERP implementation, particularly in the traditional herbal medicine industry, and serve as a&nbsp;</em><em>reference for other companies considering the adoption of Odoo 16 to improve their operational efficiency.</em></p> Nifil Afrisma ##submission.copyrightStatement## https://prosiding-senada.upnjatim.ac.id/index.php/senada/article/view/444 Thu, 24 Jul 2025 04:11:02 +0000