Pendeteksian Spam pada E-mail menggunakan Pendekatan Natural Language Processing
Abstract
Natural Language Processing (NLP) adalah sebuah cabang ilmu komputer yang berkaitan dengan pemrosesan bahasa alami manusia oleh mesin atau komputer, pada penelitian ini telah dilakukan pendeteksian pada sebuah dataset yang berisikan spam dan bukan spam pada email. Email atau surel adalah media komunikasi yang umum digunakan dalam internet sebagai sarana seseorang untuk bertukar informasi. Metode yang digunakan dalam pendekatan NLP ini meliputi preprocessing data, seperti penghapusan tanda baca, kata- kata umum yang tidak relevan, tokenize, stemming, dan lainnya, serta teknik-teknik klasifikasi, seperti Support Vector Classifier (SVC), Naive Bayes, dll. Dari berbagai model yang telah dilakukan uji, terdapat satu model yang menunjukan angka lebih tinggi dari model lainnya dengan presisi 0,98. Penelitian menunjukkan bahwa pendekatan NLP menghasilkan kinerja yang lebih baik dalam mendeteksi spam dibandingkan dengan metode- metode lain. Namun, peningkatan teknologi dan pengembangan metode deteksi yang lebih kompleks masih diperlukan untuk meningkatkan kinerja dan akurasi dari model deteksi spam email.