Penulis: Jimmy Moedjahedy, Arief Setyanto, Fawaz Khaled Alarfaj, dan Mohammed Alreshoodi
Pengguna internet terus-menerus menghadapi ancaman phishing sebagai salah satu bentuk kejahatan siber di abad ke-21. Tujuan dari phishing adalah untuk mendapatkan informasi sensitif dengan cara menipu target dan memanfaatkan informasi tersebut untuk keuntungan finansial. Informasi yang dimaksud dapat berupa data login, kata sandi, tanggal lahir, nomor kartu kredit, nomor rekening bank, hingga informasi keluarga. Salah satu cara untuk menghindari penipuan ini adalah dengan memeriksa alamat URL dari sebuah situs web. Namun, mengidentifikasi fitur URL dari situs phishing membutuhkan pengetahuan dan analisis khusus. Machine learning menjadi salah satu pendekatan yang memanfaatkan data untuk melatih mesin agar mampu membedakan antara URL situs yang sah dan yang berbahaya. Dalam penelitian ini, kami mengusulkan metode yang menggabungkan korelasi dan recursive feature elimination untuk menentukan fitur URL yang paling relevan dalam mendeteksi situs phishing dengan mengurangi jumlah fitur secara bertahap tanpa mengurangi akurasi. Tiga skenario dilakukan: pertama menggabungkan power predictive score correlation dengan recursive feature elimination, kedua menggabungkan maximal information coefficient correlation dengan recursive feature elimination, dan ketiga menggabungkan spearman correlation dengan recursive feature elimination. Hasil dari ketiga skenario menunjukkan bahwa metode gabungan yang diusulkan dapat mencapai tingkat akurasi tinggi bahkan dengan jumlah fitur yang sedikit. Pada dataset 1, akurasi dengan 10 fitur mencapai 97,06%, dan pada dataset 2 mencapai 95,88% dengan 10 fitur.
Unduh Jurnal Lengkap (PDF)
Download PDF
