تشخیص ایمیل‌های هرزنامه با استفاده از الگوریتم بهینه‌سازی جهت جریان بهبودیافته

نوع مقاله : مقاله پژوهشی

نویسندگان

1 کارشناسی ارشد،گروه مهندسی کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه ، ایران

2 دانشیار،گروه مهندسی کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه ، ایران

چکیده

با پیشرفت علم و فناوری، محبوبیت روزافزون اینترنت خصوصاً ایمیل به طور گسترده‌ای افزایش یافته است. ایمیل هرزنامه یکی از مخرب‌ترین حملات توسط مهاجمان سایبری است که عمدتاً برای انتشار محتوای مخرب از جمله تبلیغات تجاری، ویروس‌های رایانه‌ای و اطلاعات گمراه‌کننده استفاده می‌شود. مهاجمان معمولاً سیستم‌ها و سرورها را با انواع مختلف بدافزارها و ویروس‌ها هدف قرار می‌دهند و هدف آنها به خطر انداختن یا دسترسی غیرمجاز به حساب‌های سیستم یا ایمیل است. در این مقاله، از الگوریتم جهت جریان بهبودیافته برای انتخاب ویژگی و الگوریتم k نزدیکترین همسایه برای طبقه‌بندی ایمیل هرزنامه استفاده شده است. الگوریتم جهت جریان معمولاً معایبی مانند گیرافتادن در بهینه محلی و عدم تنوع جمعیتی دارد. برای افزایش توانایی الگوریتم جهت جریان از عملگرهای آشوب به‌منظور تنوع جمعیتی و همگرایی سریع استفاده شده است. در روش پیشنهادی از دو نوع آشوب به نام‌های آشوب دایره‌ای و نگاشت لجستیک استفاده شده است. ارزیابی مدل پیشنهادی برروی مجموعه داده Spambase با 4601 نمونه و 57 ویژگی انجام شده است. نتایج نشان می‌دهد که درصد صحت مدل پیشنهادی با نگاشت لجستیک در مقایسه با روش‌های دیگر بیشتر است.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

An Improved Flow Direction Optimization Algorithm for Spam Email Detection

نویسندگان [English]

  • hojjat raie 1
  • Farhad Soleimanian Gharehchopogh 2
1 Master's degree, Department of Computer Engineering, Urmia Branch, Islamic Azad University, Urmia, Iran
2 Associate Professor, Department of Computer Engineering, Urmia Branch, Islamic Azad University, Urmia, Iran
چکیده [English]

With the advancement of science and technology, the popularity of the Internet, particularly email, has increased significantly. Email spam has become one of the most prevalent forms of cyberattack, primarily used to disseminate malicious content, including commercial advertisements, computer viruses, and misleading information. Cyber attackers often target systems and servers with various types of malware and viruses to compromise or gain unauthorized access to systems or email accounts. This paper presents an improved flow direction algorithm for feature selection and a k-nearest neighbor algorithm for email spam classification. The Flow Direction Algorithm (FDA) typically faces challenges such as getting stuck in local optima and lacking population diversity. To enhance the FDA's capabilities, chaos operators have been introduced to promote population diversity and expedite convergence. The proposed method employs two types of chaos: circular chaos and logistic mapping. The performance of the proposed model was evaluated using the Spambase dataset, which consists of 4601 samples and 57 features. The results demonstrate that the accuracy of the proposed model, particularly with logistic mapping, is higher than that of other methods.

کلیدواژه‌ها [English]

  • Spam email detection
  • feature selection
  • flow direction algorithm
  • chaos mapping

Smiley face

 

  • تاریخ دریافت: 10 آذر 1403
  • تاریخ بازنگری: 01 اسفند 1403
  • تاریخ پذیرش: 23 اسفند 1403
  • تاریخ انتشار: 01 اردیبهشت 1404