Analisis Sentimen Sederhana Menggunakan Algoritma LSTM dan BERT untuk Klasifikasi Data Spam dan Non-Spam

  • Prismahardi Aji Riyantoko UPN "Veteran" Jawa Timur
  • Tresna Maulana Fahrudin UPN "Veteran" Jawa Timur
  • Dwi Arman Prasetya UPN "Veteran" Jawa Timur
  • Trimono Trimono UPN "Veteran" Jawa Timur
  • Tahta Dari Timur Gains Associate
Keywords: Analisis Model, LSTM, BERT, Pembobotan

Abstract

Analisis sentimen menjadi dasar untuk melakukan analisis dan klasifikasi data berdasarkan kata, frasa, atau dokumen. Penelitian terkait analisis sentimen telah banyak dilakukan oleh peneliti sebelumnya dengan menggunakan berbagai algoritma dan jenis model. Berdasarkan penelitian sebelumnya hasil analisis sentimen dipengaruhi performansi model dan jenis data. Saat ini peneliti menggunakan model LSTM dan BERT untuk menyelesaikan klasifikasi pada data sms yang terdiri dari spam dan non-spam. Untuk mengoptimalkan hasil pada akurasi nilai, peneliti menggunakan algoritma TD-IDF dan GloVe untuk menentukan pembobotan nilai yang direpresentasikan dalam vektor pada setiap kata. Adapun hasil yang sudah kami peroleh, metode BERT dan LSTM memiliki tingkat keakurasian nilai secara terurut sebesar 99,35% dan 98,22%. Hal tersebut menunjukkan bahwa dalam penyelesaian klasifikasi dataset spam dan non-spam sangat efektif dan efisien. Pengujian juga dilakukan dengan menggunakan data disaster twitter, tetapi tingkat keakurasian nilai mengalami penurunan. Oleh karena itu, dapat disimpulkan bahwa perbedaan jenis dataset sangat mempengaruhi performansi model uji coba.

Downloads

Download data is not yet available.
Published
2022-12-03
How to Cite
Riyantoko, P., Fahrudin, T., Prasetya, D., Trimono, T., & Timur, T. (2022, December 3). Analisis Sentimen Sederhana Menggunakan Algoritma LSTM dan BERT untuk Klasifikasi Data Spam dan Non-Spam. PROSIDING SEMINAR NASIONAL SAINS DATA, 2(1), 103-111. https://doi.org/https://doi.org/10.33005/senada.v2i1.53