Pendeteksian Spam pada E-mail menggunakan Pendekatan Natural Language Processing

  • Amri Muhaimin Universitas Pembangunan Nasional "Veteran" Jawa Timur
  • Ikbar Athallah Taufik Universitas Pembangunan Nasional "Veteran" Jawa Timur
  • Dimas Dzaky Daniswara Universitas Pembangunan Nasional "Veteran" Jawa Timur
Keywords: NLP, Spam, Email, Pembelajaran Mesin, Pendeteksian

Abstract

Natural Language Processing (NLP) adalah sebuah cabang ilmu komputer yang berkaitan dengan pemrosesan bahasa alami manusia oleh mesin atau komputer, pada penelitian ini telah dilakukan pendeteksian pada sebuah dataset yang berisikan spam dan bukan spam pada email. Email atau surel adalah media komunikasi yang umum digunakan dalam internet sebagai sarana seseorang untuk bertukar informasi. Metode yang digunakan dalam pendekatan NLP ini meliputi preprocessing data, seperti penghapusan tanda baca, kata- kata umum yang tidak relevan, tokenize, stemming, dan lainnya, serta teknik-teknik klasifikasi, seperti Support Vector Classifier (SVC), Naive Bayes, dll. Dari berbagai model yang telah dilakukan uji, terdapat satu model yang menunjukan angka lebih tinggi dari model lainnya dengan presisi 0,98. Penelitian menunjukkan bahwa pendekatan NLP menghasilkan kinerja yang lebih baik dalam mendeteksi spam dibandingkan dengan metode- metode lain. Namun, peningkatan teknologi dan pengembangan metode deteksi yang lebih kompleks masih diperlukan untuk meningkatkan kinerja dan akurasi dari model deteksi spam email.

Downloads

Download data is not yet available.
Published
2023-11-06
How to Cite
Muhaimin, A., Taufik, I., & Daniswara, D. (2023, November 6). Pendeteksian Spam pada E-mail menggunakan Pendekatan Natural Language Processing. PROSIDING SEMINAR NASIONAL SAINS DATA, 3(1), 116-121. https://doi.org/https://doi.org/10.33005/senada.v3i1.90