Kelebihan dari Bayesian Spam Filter

Teknik pemfilteran spam Bayesian adalah cara yang bagus untuk memfilter spam agar tidak sampai ke kotak masuk Anda. M. Sahami, S. Dumais, D. Heckerman, dan E. Horvitz mengusulkan teknik ini dalam "A Bayesian approach to filtering junk e-mail" pada tahun 1998, tetapi sampai dijelaskan dalam makalah oleh Paul Graham, pada tahun 2002, tidak mendapat perhatian. Setelah itu, itu telah menjadi teknik yang hebat untuk membedakan email yang sah dari spam mail tidak sah. Program email modern menggunakan teknik pemfilteran spam Bayesian, dan begitu juga filter email sisi-server, yang kadang-kadang, menanamkan fungsi filter spam Bayesian dalam perangkat lunak server email itu sendiri.

Filter spam Bayesian berfungsi dengan menganalisis dan kemudian menghitung kemungkinan konten dalam email menjadi spam. Itu sendiri membangun daftar karakteristik spam serta unsur-unsur yang baik dalam pesan. Berdasarkan analisis, pesan diklasifikasikan sebagai spam atau sah. Setelah pesan telah diklasifikasikan, filter spam selanjutnya dilatih berdasarkan per pengguna. Ini adalah keuntungan dari filter anti spam Bayesian.

Kebanyakan spam yang diterima lebih sering daripada tidak terkait dengan aktivitas online seseorang. Anda mungkin telah berlangganan buletin online, yang dapat dianggap sebagai spam. Buletin ini, seperti buletin lain dari sumber yang sama, kemungkinan mengandung kata-kata umum, seperti nama dan alamat emailnya, dari mana asalnya. Filter Bayesian Anda akan menganalisis konten, mengidentifikasi karakteristik, dan menetapkan kemungkinan lebih tinggi untuk menjadi spam. Semua ini didasarkan pada aktivitas pengguna khusus Anda.

Email sah yang Anda terima berbeda dari spam, dan filter anti spam Bayesian akan menetapkan tingkat kemungkinan lebih rendah untuk menjadi spam. Dalam lingkungan di mana Anda menerima email perusahaan dari sumber yang sama, surat akan memiliki nama perusahaan yang sama, dan nama-nama klien atau pelanggan. Ini akan dianalisis sebagai sah oleh filter Bayesian Anda.

Ketepatan filter spam Bayesian meningkat seiring waktu. Ini menganalisis karakteristik yang memungkinkan untuk menilai probabilitas, dan setiap kali filter salah mengklasifikasikan pesan, pelatihan korektifnya mengambil alih. Probabilitas setiap kata unik untuk setiap pengguna individu.

Filter Bayesian luar biasa dalam menghindari positif palsu. Jika email yang Anda terima berisi kata 'Nigeria' atau 'lotre', yang sering dilihat dalam pesan spam, filter anti spam Bayesian Anda mungkin akan meletakkannya sebagai kemungkinan, dan tidak menolaknya secara langsung, sebagai filter spam normal mungkin. Itu akan mencari karakteristik lain untuk mengklasifikasikan pesan. Jika surat itu berasal dari pasangan Anda, itu akan menunjukkan legitimasinya, dan filter spam Bayesian Anda akan mengatasi kemungkinan kata-kata spam.

Leave a Reply

Your email address will not be published. Required fields are marked *