تحليل داده هاي ترافيکي با هدف تشخيص ازدحام با بهره گيري از الگوريتم هاي يادگيري ماشين
محورهای موضوعی : هوش مصنوعی و رباتیکناهید امانی 1 , محمدحسین عامری مهر 2 , سارا افاضاتی 3 * , علی جاویدانی 4
1 - گروه مدیریت یکپارچه شبکه، پژوهشکده فناوری ارتباطات، پژوهشگاه ارتباطات و فناوری اطلاعات ، تهران، ایران
2 - گروه مدیریت یکپارچه شبکه، پژوهشکده فناوری ارتباطات، پژوهشگاه ارتباطات و فناوری اطلاعات ، تهران، ایران
3 - گروه مدیریت یکپارچه شبکه، پژوهشکده فناوری ارتباطات، پژوهشگاه ارتباطات و فناوری اطلاعات ، تهران، ایران
4 - دانشکده مهندسی برق و کامپیوتر، دانشکدگان فنی، دانشگاه تهران
کلید واژه:
چکیده مقاله :
شناسايي ازدحام يکي از ارکان پايه اي در تضمين کيفيت خدمت به عنوان مهمترين معيار سنجش کارايي در شبکه هاي مخابراتي نسل جديد است. ازدحام منجر به از دست رفتن بسته هاي اطلاعاتي در شبکه مي شود که به دليل بالاتر بودن نرخ ارسال از ظرفيت در برخي از لينکهاي شبکه رخ مي دهد. براي کنترل ازدحام در شبکه گام نخست تمايز ميان از دست رفتن اطلاعات در اثر ازدحام و يا در اثر ساير موارد از جمله خرابي لينک است زيرا در صورتي که منشا از دست رفتن بسته به اشتباه ازدحام تشخيص داده شود کاهش نرخ ارسال در فرستنده کمکي به کاهش ازدحام نکرده و تنها موجب کاهش گذردهي و کيفيت سرويس مي شود. از اين رو مسئله اصلي اين مقاله شناسايي ازدحام و تفکیک آن از خطاي ناشي از لينک هاي ارتباطي در يک نمونه داده ترافيکي است. در اين مقاله براي حل مسئله مذکور از الگوريتم هاي مختلف يادگيري ماشين نظارتشده از جمله درخت تصميم، جنگل تصادفي، ماشين بردار پشتيبان، لجيستيک رگرسيون، K-نزديکترين همسايه، XGBoost، شبکه عصبي و تقويت درخت تصميم بهره گرفته شده است. الگوريتم هاي مذکور بر اساس معيارهاي مختلف از جمله دقت، درستی، F1-measure، حساسیت و AUC مورد ارزيابي قرار گرفته و با يکديگر مقايسه شده اند. اين ارزيابي بر اساس روش K-fold Cross Validation انجام شده است. نتایج شبیهسازی نشان میدهد که الگوریتم XGBoost به لحاظ تمام معیارهای ارزیابی نسبت به دیگر الگوریتمها عملکرد بهتری در زمینه تشخیص ازدحام دارد.
Congestion detection is one of the basic elements in guaranteeing the quality of service and is one of the most important measures of efficiency in new-generation telecommunication networks. Congestion leads to the loss of information packets in the network because the sending rate is higher than the capacity in some network links. To control congestion in the network, the first step is to distinguish between the loss of packets due to congestion with the packet loss introduced by other cases, including link failure. Because if the source of the loss is mistakenly identified as congestion, reducing the sending rate in the transmitter does not mitigate the congestion and only reduces throughput and quality of service. Therefore, the main problem of this paper is to identify congestion and distinguish it from the error caused by communication links in a traffic data sample. In solving this problem, various supervised machine learning algorithms including decision tree, random forest, support vector machine, logistic regression, K-nearest neighbor, XGBoost, and neural network have been used. The mentioned algorithms have been evaluated based on different criteria and compared with each other.