J. Ghasemi and J. Esmaily
( Received: April 09, 2017 – Accepted in Revised Form: July 07, 2017 )

Abstract    Intrusion detection systems (IDS) by exploiting Machine learning techniques are able to diagnose attack traffics behaviors. Because of relatively large numbers of features in IDS standard benchmark dataset, like KDD CUP 99 and NSL_KDD, features selection methods play an important role. Optimization algorithms like Genetic algorithms (GA) are capable of finding near-optimum combination of the features intended for construction of the final model. This paper proposes an innovative method called chain method, for evaluation of the given test record. The main intuition of our method is to concentrate merely on one attack type at every stage. In the beginning, datasets with the proposed features by GA based on different labels will be assembled. Based on a specific sequence– which is found on different permutation of four existed labels- the test record will be entered the chain module. If the first stage –which is correlated to the input sequence-, is able to diagnose the first label, the final output has been indicated. If is not, the records will pass through the next stage until the final output be obtained. Simulations on proposed chain method, illustrate this technique is able to outperform other conventional methods especially in R2L and U2R detection with the accuracy of 98.83% and 98.88% respectively.


Keywords    Intrusion Detection Systems (IDS); Feature Selection; Genetic Algorithms (GA)


چکیده    سیستم های تشخیص نفوذ با بهره گیری از روش های یادگیری ماشین، قادر به شناسایی رفتار ترافیک های مشکوک به حمله هستند. به علت وجود تعداد نسبتا زیادی ویژگی در دیتاست های استاندارد این حوزه، مثل دیتاست های KDD و NSL، روش های استخراج ویژگی بسیار می‌توانند مفید بعمل آیند. روش های بهینه سازی ترکیبی مثل ژنتیک نیز قادر به یافتن یک راه حل نزدیک به بهینه در مورد ویژگی های مفید استخراجی هستند. این مقاله یک روش خلاقانه به نام "زنجیر" ارائه می‌دهد. تمرکز اصلی ما توجه به یک نوع حمله در هر مرحله است. در شروع کار، ویژگی های استخراجی توسط ژنتیک بدست می‌آیند. بر اساس دنباله ورودی – که از جایگشت ترتیب برچسب ها بدست می‌آید- یک نمونه از ترافیک وارد تابع زنجیر می‌گردد. در هر مرحله یک برچسب – بر اساس ترتیب وارده- شناسایی می‌شود. در صورت موفقیت در مرحله، نمونه به عنوان حمله شناخته شده و در غیر این صورت نمونه سالم تشخیص داده می‌شود. شبیه سازی انجام شده حاکی از برتری روش پیشنهادی نسبت به روش های سنتی است. روش پیشنهادی قادر به تشخیص حملات پیچیده R2L و U2R با دقت بترتیب 98.83% و 98.88% است.


