مدل طبقه‌بندی ترافیک شبکه‌های کامپیوتری مبتنی بر خوشه‌بندی DBScan و طبقه‌بند گاما

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری، گروه مهندسی کامپیوتر، واحد بین الملل، دانشگاه آزاد اسلامی، تبریز، ایران

2 استادیار، گروه مهندسی کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

3 دانشیار، گروه مهندسی کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

4 دانشیار،گروه مهندسی کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

چکیده

طبقه‌بندی ترافیک یکی از مهم‌ترین فرآیندهای نظارت بر شبکه است که کاربردهای گسترده‌ای در حوزه‌های امنیت، کیفیت خدمات و مدیریت شبکه دارد. با افزایش پیچیدگی و تنوع ترافیک شبکه، چالش‌های جدیدی از جمله کمبود داده‌های آموزشی برچسب‌گذاری‌شده بوجود می‌آید. به منظور رفع این چالش در این مقاله، سازوکار طبقه‌بندی ترافیک با ترکیب الگوریتم‌های یادگیری ماشین بدون نظارت و نیمه نظارتی ارائه می‌شود. این سازوکار از مجموعه محدودی از داده‌های آموزشی برچسب‌گذاری‌شده برای بهبود دقت طبقه‌بندی استفاده می‌کند. روش پیشنهادی، هر جریان ترافیک را به عنوان یک بردار ویژگی توصیف می‌کند که شامل ویژگی‌های آماری آن جریان است. تعداد ویژگی‌های ایجاد شده برای هر نمونه نیز با استفاده از تحلیل مولفه‌های اصلی کاهش می‌یابد. خوشه‌بندی DBScan برای تعیین نوع ترافیک صحیح برای هر جریان ترافیک بدون برچسب استفاده می‌شود. در نهایت، از مدل طبقه‌بند گاما برای تفکیک جریان‌های ترافیک جدید استفاده می‌شود. کارایی روش پیشنهادی با استفاده از مجموعه داده‌های واقعی ارزیابی شده است. نتایج نشان می‌دهد که روش پیشنهادی قادر به طبقه‌بندی جریان‌های ترافیکی با دقت متوسط 95.12 درصد است که حداقل 7.03 درصد بهبود را نسبت به رویکردهای قبلی نشان می‌دهد.

کلید واژه‌ها: طبقه بندی ترافیک، یادگیری ماشین، خوشه بندی DBScan، طبقه‌بند گاما.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Computer Networks traffic classification model based on DBScan clustering and gamma classification

نویسندگان [English]

  • Seyede Zohreh Majidian 1
  • Shiva TaghipourEivazi 2
  • Bahman Arasteh 3
  • Ali Ghaffari 4
1 PhD student. Department of Computer Engineering, Aras international Branch, Islamic Azad University, Tabriz, Iran
2 assistant professor. Department of Computer Engineering, Tabriz Branch, Islamic Azad University, Tabriz, Iran
3 Associate Professor. Department of Computer Engineering, Tabriz Branch, Islamic Azad University, Tabriz, Iran
4 Associate Professor . Department of Computer Engineering, Tabriz Branch, Islamic Azad University, Tabriz, Iran
چکیده [English]

Traffic classification is one of the most important network monitoring processes that has wide applications in the fields of security, quality of service, and network management. With the increasing complexity and variety of network traffic, new challenges arise, including the lack of labeled training data. In order to solve this challenge, in this paper, a traffic classification mechanism is presented by combining unsupervised and semi-supervised machine learning algorithms. This mechanism uses a limited set of labeled training data to improve classification accuracy. The proposed method describes each traffic flow as a feature vector that contains the statistical characteristics of that flow. The number of features generated for each sample is reduced using principal component analysis. DBScan clustering is used to determine the correct traffic type for each untagged traffic stream. Finally, the gamma classifier model is used to separate the new traffic flows. The efficiency of the proposed method has been evaluated using real data sets. The results show that the proposed method is able to classify traffic flows with an average accuracy of 95.12%, which shows at least 7.03% improvement over previous approaches.

کلیدواژه‌ها [English]

  • Traffic classification
  • Machine learning
  • DBScan clustering
  • Gamma classification

Smiley face

 


مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 27 خرداد 1404
  • تاریخ دریافت: 18 بهمن 1403
  • تاریخ بازنگری: 18 فروردین 1404
  • تاریخ پذیرش: 19 خرداد 1404
  • تاریخ انتشار: 27 خرداد 1404