Analisis Perbandingan Korelasi Spearman Dan Maximal Information Coefficient Dalam Seleksi Fitur Website Phishing Menggunakan Algoritma Machine Learning

Phishing merupakan metode penipuan berbasis digital yang bertujuan mencuri data identitas pribadi dan kredensial keuangan konsumen. Salah satu teknik yang digunakan adalah mengarahkan korban ke situs web palsu yang menyerupai situs resmi, agar pengguna secara tidak sadar membocorkan informasi sensitif seperti nama pengguna dan kata sandi. Dataset phishing mengandung berbagai fitur yang dapat digunakan untuk mengklasifikasikan apakah suatu website tergolong phishing atau tidak. Penelitian ini bertujuan untuk membandingkan efektivitas dua metode seleksi fitur, yaitu gabungan Maximal Information Coefficient (MIC) dan Total Information Coefficient (TIC), dengan metode korelasi Spearman. Fitur-fitur yang terseleksi kemudian diuji menggunakan lima algoritma machine learning: Logistic Regression, Naive Bayes, J48, AdaBoost MI, dan Random Forest. Hasil penelitian menunjukkan bahwa metode gabungan MIC dan TIC menghasilkan akurasi tertinggi sebesar 97,25% menggunakan algoritma Random Forest, mengungguli hasil seleksi fitur dengan metode korelasi Spearman. Temuan ini menunjukkan bahwa pemilihan metode seleksi fitur yang tepat berpengaruh signifikan terhadap performa model klasifikasi dalam mendeteksi website phishing.

Unduh Jurnal Lengkap (PDF)
Download PDF

Leave a Reply

Your email address will not be published. Required fields are marked *