Analisis Performansi Model Machine Learning dalam Klasifikasi Email Spam dan Ham (TA.2.25.029)

Dwiifanka, Echa (2025) Analisis Performansi Model Machine Learning dalam Klasifikasi Email Spam dan Ham (TA.2.25.029). Diploma thesis, UNIVERSITAS LOGISTIK DAN BISNIS INTERNASIONAL.

Full text not available from this repository.
Official URL: https://drive.google.com/open?id=1uMSlXkAf_N9JStcP...

Abstract

Pertumbuhan teknologi informasi menjadikan email sebagai media komunikasi utama, namun juga memicu meningkatnya spam yang mengganggu dan berpotensi membahayakan keamanan. Penelitian ini membandingkan tiga algoritma machine learning, yaitu Multinomial Naïve Bayes (MNB), Support Vector Machine (SVM), dan Random Forest (RF) dengan dataset publik Kaggle dan dataset pribadi Google Takeout. Proses preprocessing meliputi pembersihan teks, tokenisasi, penghapusan stopword, stemming, dan TF-IDF.Eksperimen dilakukan dalam dua tahap. Tahap pertama adalah baseline dengan pembagian data 90:10, 80:20, dan 70:30. Hasil menunjukkan akurasi internal tinggi (0,98–0,99), namun menurun pada validasi eksternal sehingga terjadi overfitting. Skema 90:10 memberikan performa eksternal terbaik, sedangkan 70:30 terendah.Tahap kedua adalah penambahan data pribadi ke dataset publik dengan rasio 10%–90%. Hasilnya, seluruh model meningkat pada validasi eksternal. SVM menjadi model paling stabil dengan akurasi hingga 97% pada rasio 30%–90%, RF meningkat meskipun lebih kompleks, sementara MNB tetap efisien.Penelitian ini menyimpulkan bahwa SVM merupakan model terbaik, dan penambahan data pribadi efektif mengurangi overfitting serta meningkatkan generalisasi. Kata kunci: klasifikasi, machine learning, email spam, evaluasi performa

Item Type: Thesis (Diploma)
Subjects: T Technology > TA Engineering (General). Civil engineering (General)
Divisions: Sekolah Vokasi > Teknik Informatika D4
Depositing User: PKL TUJUH TUJUH
Date Deposited: 29 Sep 2025 05:30
Last Modified: 29 Sep 2025 05:30
URI: http://eprints.ulbi.ac.id/id/eprint/3643

Actions (login required)

View Item View Item