Algoritma Alternating Least Squares Untuk Mesin Rekomendasi Film
Abstract
Abstract: The entertainment world is inseparable from the rapidly growing movie industry and is accompanied by huge data growth. The rapid growth of data has brought about a new era of information. These data are utilized to build innovative, efficient and more effective systems. This research implements a movie recommendation system using the Alternating Least Squares (ALS) algorithm from Apache Spark MLlib with the MovieLens 25M dataset. A collaborative filtering approach with matrix factorization is used to model user preferences and movie characteristics. The evaluation is done by calculating the Root Mean Squared Error (RMSE) on the test data. The first ALS model with default parameters produced the best RMSE of 0.811671, while the second model with different parameters produced an RMSE of 0.839577. The results show that the ALS model with default parameters is able to provide accurate and relevant movie recommendations according to user preferences
Keywords: Film, Recommendation, Big Data, Alternating Least Square, Pyspark
Abstrak: Dunia hiburan tak terlepas dari industri film yang berkembang sangat pesat dan disertai dengan pertumbuhan data yang sangat besar. Pesatnya pertumbuhan data telah membawa era baru informasi. Data-data ini dimanfaatkan untuk membangun sistem-sistem yang inovatif, efisien dan lebih efektif. Penelitian ini mengimplementasikan sistem rekomendasi film menggunakan algoritma Alternating Least Squares (ALS) dari Apache Spark MLlib dengan dataset MovieLens 25M. Pendekatan collaborative filtering dengan matrix factorization digunakan untuk memodelkan preferensi pengguna dan karakteristik film. Evaluasi dilakukan dengan menghitung Root Mean Squared Error (RMSE) pada data uji. Model ALS pertama dengan parameter default menghasilkan RMSE terbaik sebesar 0.811671, sementara model kedua dengan parameter yang berbeda menghasilkan RMSE 0.839577. Hasil menunjukkan bahwa model ALS dengan parameter default mampu memberikan rekomendasi film yang akurat dan relevan sesuai preferensi pengguna
Kata kunci: Alternating Least Square, Big Data, Film, Pyspark, Rekomendasi