869
TEXNIKA
“RAQAMLI IQTISODIYOT” ILMIY-ELEKTRON JURNALI | 8-SON
WWW.INFOCOM.UZ
TARMOQ TRAFIGINI SINFLASHTIRISH VA FILTRLASH UCHUN
BOSHQARUV DASTURINI ISHLAB CHIQISH
Tojiyeva Feruza Qobiljon qizi
Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalari universiteti
doktaranti
11feruza@gmail.com
Annotatsiya:
Bugungi kunda internet foydalanuvchilarining soni keskin ortib
borishi, tarmoq administratorlari va internet xizmat provayderlari uchun kundan-kun
ortib borayotgan katta hajmdagi internet trafigini boshqarish hamda nazorat qilishda
murakkabliklarni keltirib chiqaradi. Shu bilan birga internet tarmog‘i orqali taqdim
etilayotgan xizmat turlarini ortib borishi orqali, tarmoq xavfsizligini taminlashda,
hamda tarmoqni samarali boshqarishda paydo bo‘lgan muammolarni, tarmoq trafigini
sinflashtirish va filtrlash orqali samarali yechish mumkin. Ushbu maqolada
telekommunikatsiya tarmoq trafigini sinflashtirish va filtrlash uchun dasturiy ta’minot
ishlab chiqildi va dasturiy ta’minot natijalalar olinib, taqqoslandi.
Kalit so‘zlar: Telekommunikatsiya tarmoqlari, ilova trafiklarini aniqlash,
tarmoq trafigi, traffik xususiyatlari, algoritm.
РАЗРАБОТКА ПРОГРАММНОГО УПРАВЛЕНИЯ ДЛЯ
КЛАССИФИКАЦИИ И ФИЛЬТРАЦИИ СЕТЕВОГО ТРАФИКА
Тажиева Феруза Кабулжан кизи
Ташкентский университет информационных технологий имени Мухаммада ал-
Хоразмий доктарант
11feruza@gmail.com
Аннотация
:
Быстрый рост числа пользователей интернета сегодня
усложняет сетевым администраторам и поставщикам Интернет
-
услуг
управление и контроль постоянно растущего объема Интернет
-
трафика. В то же
время, в связи с увеличением видов услуг, предлагаемых через Интернет,
проблемы, возникающие в обеспечении сетевой безопасности и эффективном
управлении сетью, могут быть эффективно решены путем классификации и
фильтрации сетевого трафика. В данной работе разработано программное
обеспечение для классификации и фильтрации трафика телекоммуникационной
870
TEXNIKA
“RAQAMLI IQTISODIYOT” ILMIY-ELEKTRON JURNALI | 8-SON
WWW.INFOCOM.UZ
сети,
а также получены и сопоставлены результаты работы программного
обеспечения.
Ключевые слова:
Телекоммуникационные сети, обнаружения трафика
приложений, сетевой трафик, характеристики трафика, алгоритм.
DEVELOPMENT OF SOFTWARE FOR TRAFFIC CLASSIFICATION AND
FILTERING
Tajieva Feruza Kobiljon kizi
Tashkent University of Information Technologies named after Muhammad al-
Khwarizmi PhD student
11feruza@gmail.com
Abstract:
The rapid growth in the number of internet users today complicates
the management and control of the ever-increasing volume of internet traffic for
network administrators and Internet service providers. At the same time, with the
expansion of the range of services offered over the Internet, issues arising in network
security and efficient network management can be effectively addressed through traffic
classification and filtering. This paper presents the development of software for traffic
classification and filtering in telecommunication networks, and also provides and
compares the results of the software's performance.
Keywords:
Telecommunication networks, application traffic detection, network
traffic, traffic characteristics, algorithm.
KIRISH
Bugungi kunda internet tarmog‘i taqdim etayotgan xizmatlarning turli xilligi,
butun dunyo bo‘ylab biznes va tashkilotlarning yangi rivojlanish bosqichiga o‘tishda
yangi imkoniyatlarni yaratmoqda. Internet xizmatlariga bo‘lgan ehtiyoj kundan-kun
ortib bormoqda. Ijtimoiy tarmoqlarda ma’lumotlar almashinuvidan tortib, global
tarmoqlarda kerakli ma’lumotlarni qidirishdagi barcha amallar internet tarmog‘i bilan
bog‘liqdir. Youtube, Netflix va MegaUpload kabi ilovalar internet tarmoq tuzilishini
butunlay o‘zgartirdi. Bog‘liq ravishda internet foydalanuvchilarining soni ham keskin
ortib bormoqda. ITU (International Telecommunication Union) ning 2023 yilgi
statistik tadqiqotlariga ko‘ra, internet foydalanuvchilarining soni 5.4 milliard, ya’ni
dunyo aholisining 67 foizini tashkil qiladi. Bu ko‘rsatgich 2022 yilga nisbatan 4.7
foizga, 2021 yildan 2022 yilga nisbatan 3.5 foizga yuqorilagan.
Internet foydalanuvchilarining soni keskin ortib borishi, tarmoq
administratorlari va internet xizmat provayderlari uchun kundan-kun ortib borayotgan
katta hajmdagi internet trafigini boshqarish hamda nazorat qilishda murakkabliklarni
871
TEXNIKA
“RAQAMLI IQTISODIYOT” ILMIY-ELEKTRON JURNALI | 8-SON
WWW.INFOCOM.UZ
keltirib chiqaradi. Shu bilan birga internet tarmog‘i orqali taqdim etilayotgan xizmat
turlarini ortib borishi orqali, tarmoq xavfsizligini ta’minlashda, hamda tarmoqni
samarali boshqarishda paydo bo‘lgan muammolarni, tarmoq trafigini sinflashtirish va
filtrlash orqali samarali yechish mumkin. Trafigni sinflashtirish va filtrlash tarmoq
unumdorligini oshirishda, muhim va dolzarb hal qiluvchi omil hisoblanadi.
ADABIYOTLAR TAHLILI
Tarmoq trafigini sinflashtirish va filtrlash masalalarini samarali yechish
maqsadida ko‘plab olimlar tadqiqot ishlarini olib borganlar. Olib borilgan tahlillar
shuni ko‘rsatadiki, hozirgi kunda tarmoq unumdorligini oshirishda, tarmoqdan
o‘tayotgan trafiklarni samarali sinflashtirish va filtrlashda juda ko‘p usullari, vositalari
va metodologiyalari ishlab chiqilgan.
Xususan, A.Madhukar, C. Williamson tadqiqitchilar portga asoslangan
yondashuv asosida tarmoq trafigini tahlil qilib chiqishgan [1]. Maqolada ikki yil
davomida Calgary universitetining internet tarmog‘idan o‘tgan p2p ilovalarining
trafiklari tahlil qilingan. Olingan natijalar trafikni sinflashtirish va filtrlashda portga
asoslangan yondashuvdan foydalanish 30% dan, maxsimal 70% gachan aniqlikga
erishilgan. Natija P2P ilovalar uchun portga asoslangan yondashuvning bugungi kunda
samarasiz ekanlgini ko‘rsatdi.
Moore va Papagiannaki tadqiqotchilar tomonidan portga asoslangan
yondashuvning bir qancha kamchiliklari ko‘rildi [2]. Ular Genome - biologiya
sohasidagi ilmiy tadqiqot kompusi tarmog‘idan o‘tayotgan traffikni o‘nta parameter
asosida tasniflashgan. Natijada umumiy trafikdan 30-70% to‘g‘ri aniqlanmagan.
Hamda, IP pog‘onasida shifirlanish TCP va UDP headerlarini adashtirilishiga olib
kelgan va ularni aniq port raqamlarini aniqlash imkoni bo‘lmagan.
Moore A., Zuev D., Crogan M., tadqiqotchilar tomonidan trafikni statik usul
yordamida sinflashtirish va filtirlash ko‘rib chiqilgan [3]. TCP oqim trafiklarini
xarakterlaydigan umumiy 248 ta parametrlari asosida tarmoqdan o‘tayotgan trafik
aniqlashga xarakat qilingan. Natija shuni ko‘rsatdiki, parametrlarning sonini ko‘pligi
trafikni aniqlashda juda murakkab va yuqori natijaga olib kelmaydi. Shuning uchun
ularni yuqori tezlikdagi tarmoqlarda qo‘llab bo‘lmaydi.
T. Yildirim and P. Radeliffe tadqiqotchilar IPsec ulanishi yordamida tarmoqdan
o‘tayotgan VoIP traffigining QoS ko‘rsatgichini osirishga qaratilgan oddiy metod
taklif qilishdi [4]. Mualliflar faqat bitta parameter asosida tarmoqdan o‘tayotgan
trafikni qaysi ilovaga tegishli ekanligini aniqlashdi. Ular 60-150 o‘lcham oraliqdagi
baytlarni VoIP paketi deb belgilashgan. Kam biroq asosiy bo‘lgan parametrlardan
foydalanish, shifrlangan VoIP trafigining QoS darajasini oshirishi mumkin. Ushbu
metod ayrim trafiklar uchun samarali, ammo tarmoqdan o‘tayotgan boshqa ilovalar
uchun samarasizdir. Bundan tashqari ko‘p uchraydigan TCP nazorat paketlari (SYN,
872
TEXNIKA
“RAQAMLI IQTISODIYOT” ILMIY-ELEKTRON JURNALI | 8-SON
WWW.INFOCOM.UZ
ACK, FIN, RST), DNS so‘rovlari va boshqa bir qancha paketlarning o‘lchamlari 60-
150 bayt oralig‘ida ekanligi ma’lum. Bu esa, ushbu metod samarasizligini ko‘rsatadi
[5].
Liu trafikni klassifikatsiya qilishda oddiy DPI (Deep Packet Inspection)
algoritmini taklif qilgan [6]. Ushbu algoritm paket tarkibidagi foydali xabarning
boshlanish qismi (header) orqali trafikni klassifikatsiyalashga asoslangan. Bu
algoritmni faqat oldindan belgilab qo‘yilgan aniq trafik oqimlari (BitTorrent, eDonkey
va boshq.) uchun ishlatish mumkin. Chunki tarmoqda uzatiladigan barcha xabarlarda
ham trafikni identifikatsiyalovchi bitlar qo‘yilmaydi.
METODOLOGIYA
Ushbu maqolada tarmoq trafigini sinflashtirish va filtrlash masalalarini samarali
yechish uchun qo‘llanilinadigan usullar,algoritmlar va mavjud dasturlar o‘rganib
chiqildi va shu asosida Python dasturi yordamida “tasodifiy o‘rmon” algoritmini
qo‘llagan holda dastur ishlab chiqildi va dasturiy ta’minot natijalar olinib, taqqoslandi.
MUHOKAMA VA NATIJALAR
Yuqorida ko‘rsatilgan, portga va foydali yuklamaga asoslangan
yondashuvlarning mavjud bir qancha kamchiliklari sababli, so‘nggi tadqiqotlar
paketlarni sinflashtirish va filtrlash uchun transport va oqim pog‘onalarining statistik
xatti-harakatlari o‘rganish orqali trafikni aniqlashga asoslangan. Izlanishlar davomida
ko‘p tadqiqotchilar ushbu yondashuvni qo‘llashda mashinali o‘qitish (machine
learning) metodlaridan keng foydalanganlar.
Tasodifiy o‘rmon algoritmini ishlash tamoyili ikki bosqichda amalga oshiriladi.
Birinchi bosqichda tasodifiy o‘rmonning daraxtlari hosil qilinadi. Ikkinchi bosqichda
esa birinchi bosqichda ishlab chiqilgan algoritmlar yordamida testlash jarayoni amalga
oshiriladi. Quyida ushbu jarayonlarning batafsil bayoni keltirilgan:
1. Berilgan “m” xususiyatlar ichidan “k” tasodifiy ravishda tanlanadi. Bu yerda
k << m;
2. Tanlangan “k” hususiyatlar ichida “d” uzel hisoblanadi;
3. Ushbu “d” uzel yana boshqa uzellarga bo‘linadi.
4. 1-3 qadamlar toki uzellar soni “l” ga yetgunga qadar davom etadi.
5. 1-4 qadamlar yana “n” marta takrorlanib o‘rmon hosil qilinadi.
Demak, birinchi bosqichda ma’lumotlar oqimidan foydalanilgan holda tasodifiy
o‘rmon hosil qilinadi. Ikkinchi bosqichda esa birinchi bosqichda hosil qilingan
algoritm samaradorligi aniqlanadi. Ikkinchi bosqichda bajariladigan amallar
quyidagilar:
1. Trafikdan ajratib olingan xususiyatlar yordamida tasodifiy o‘rmon algoritmini
tuzib chiqamiz.
2. Olingan natijalarni umumiylashtiramiz.
873
TEXNIKA
“RAQAMLI IQTISODIYOT” ILMIY-ELEKTRON JURNALI | 8-SON
WWW.INFOCOM.UZ
3. Tasodifiy daraxtlar tomonidan eng ko‘p taklif etilgan natija, tasodifiy o‘rmon
algoritmini natija, tasodifiy o‘rmon algoritmini natijasi sifatida taqdim etilgan.
Boshqa klassifikatsiya texnologiyalari bilan solishtirilganda tasodifiy o‘rmon
quyidagi afzalliklarga ega:
1. Klassifikatsiya masalasida ishlatuvchi ilovalarda, tasodifiy o‘rmon algoritmi
to‘lib ketishi oldini oladi.
2. Klassifikatsiya va regressiya masalalarida bitta tasodifiy o‘rmon algoritmi
ishlatiladi.
3. Tasodifiy o‘rmon algoritmi o‘rgatuvchi ma’lumotlar to‘plamidan eng muhim
xususiyatlarni identifikatsiya qilishda ishlatilishi mumkin.
Tasodifiy o‘rmon algoritmining asosiy kamchiligi qilib, unda aniq natija olish
uchun ko‘proq daraxtlar talab qilinishi, daraxtlar sonini ortishi esa algoritmning ishlash
vaqtini oshirib yuboradi.
Scapy kutubxonasi – bu tarmoq paketlari hosil qiluvchi va ular ustida amal
bajaruvchi Python kutubxonasidir.
Ushbu kutubxonani tarmoq jarayonlaridagi imkoniyati cheksiz – paketlarni
to‘plash, ularni tarmoq bo‘ylab ketma-ket yuborilishi, paketlarni ushlab qolish, ular
tarkibini o‘qish, bloklash va boshqa amallarni bajaradi. Ushbu kutubxonadan
foydalangan holda biz trafik bilan ishladi. Scapy kutubxonasi yordamida real vaqt
davomida paketlar file.pcap formatda saqlandi. Model maker dasturi yordamida .pcap
file nDPI qo‘llanilgan holda, oqimlarga ajratildi. So‘ng Python dasturlash tilining
Skitlearn kutubxonasi yordamida “Tasodifiy o‘rmon” algoritmining o‘qitish modeli
yaratildi (1-rasm).
1-rasm. Dasturning ishlash algoritmi
“Tasodifiy o‘rmon” algoritmi keltirilgan ma’lumotlardan o‘z klassifikatsiya
daraxtini hosil qilishda foydalanildi. Yig‘ilgan ma’lumotlar to‘plamini “Tasodifiy
o‘rmon” algoritmiga bog‘lagan holda klassifikatsiyalovchi model yaratildi. Alogoritm
ikki bosqichdan iborat bo‘lib, birinchi bosqichda taqdim etilgan ma’lumotlar ichidan
bir qismini daraxtlarni qurish uchun ishlatildi.Olingan statistik ma’lumotlar natijasi
TCP va UDP da mavjum ma’lumotlar muhimligi aniqlandi. Natija 1-jadvalda berilgan.
Natija eng ko‘p aniqlik DNS va QUIC protokollarida va eng kam aniqlik ko‘rsatgichi
BitTorrent trafigi bo‘lib, bu ko‘rsatgich 77% ni tashkil qildi. Olingan natijalar quyidagi
1-jadvalda keltirilgan.
874
TEXNIKA
“RAQAMLI IQTISODIYOT” ILMIY-ELEKTRON JURNALI | 8-SON
WWW.INFOCOM.UZ
1-jadval
O‘qitish va testlash uchun olingan oqimlar soni
Protokol turi
Oqimlar soni
(o‘qitishda)
Oqimlar soni (testda)
DNS
2170
4338
HTTP
875
1750
SSL
290
760
QUIC
37
75
BitTorrent
31
62
Yuqoridagi jadvaldan ko‘rinib turibdiki, “Tasodifiy o‘rmon” algoritmi, testlash
uchun sarflangan oqimlar soni o‘rganish uchun, o‘qitish uchun ajratilgan oqimlardan
ikki marotaba ko‘proq. Quyidagi 2-jadvalda protokollarning aniqlanish imkoniyati eng
kichik ko‘rsatgichga BitTorrent trafigi tegishli ekanligini ko‘rishimiz mumkin. Qolgan
oqimlarni aniqlanganlik ko‘rsatgichi deyarli 100% ni tashkil etganligini ko‘rishimiz
mumkin. Ushbu ko‘rsatgichlardan kelib chiqib, biz qo‘llagan “tasodifiy o‘rmon”
algoritmi yordamida yaratilgan dastur, bizning tarmoq oqimlarini aniqlashda 99%
foizga ega aniqlikni ko‘rsatdi.
2-jadval
Ilova protokollarini aniqlanishi
Protokol turi
Aniqlilik ko‘rsatgichi
DNS
1.00
HTTP
0.99
SSL
1.00
QUIC
0.99
BitTorrent
0.98
Model orqali klassifikatsiya qilingan paketlar oqimini tekshiruv oqimiga
tekshiruv qismiga va foydalanuvchi interfeysiga yuboriladi. Agar oqimga hech qanday
cheklanish qo‘yilmagan bo‘lsa u tarmoqga kirdi yoki chiqib ketdi. Agar oqimga
cheklovlar qo‘yilgan bo‘lsa unday paketlar inkor qilinadi.
XULOSA
Ushbu maqolada tarmoq trafigini amaliy pog‘ona protokolini transport
pog‘onasidagi segmentlar xususiyatlariga asoslangan statistik ma’lumotlar yordamida
aniqlash orqali klassifikatsiya qilish dasturiy ta’minoti ishlab chiqildi. Amaliy pog‘ona
protokolini aniqlashda transport pog‘onasidagi bir necha segmentlarni tekshirish
yetarli. Bu esa, shifrlangan trafikni klassifikatsiyalash imkoniyatini yuzaga keltiradi.
Ishlab chiqilgan dasturiy ta’minotining samaradorlik ko‘rsatgichlari hisoblab
ko‘rsatgichlari hisoblab ko‘rsatildi. Bundan tashqari tarmoq trafigini klassifikatsiya
qiluvchi dastur ilova protokollarini aniqlash va boshqa ilova protokollari bilan
875
TEXNIKA
“RAQAMLI IQTISODIYOT” ILMIY-ELEKTRON JURNALI | 8-SON
WWW.INFOCOM.UZ
almashtirib
yuborayotganligi
to‘g‘risida
natijalar
olindi.
Umumiy
qilib
hisoblaganimizda dasturimizning ishlash samaradorligi 99% ni tashkil etadi.
FOYDALANILGAN ADABIYOTLAR RO‘YXATI
1.
A.Madhukar, C.Williamson, A longitudinal study of p2p traffic
classification, in: 14
th
IEEE International Symposium on Modeling, and Simulation,
2006, pp.179-188. doi: 10.1109/MASCOTS.2006.6.
2.
A.W.Moore, K.Papagiannaki, Toward the accurate identification of
network applications, in: C. Dovrolis (Ed.), Passive and Active Network Measurement,
Springer Berlin Heidelberg, Berlin, Heidelberg, 2005, pp.41-54.
3.
Moore A., Zuev D., Crogan M.Discriminators for use in flow-based
classification. Technical Report RR-05-13, Department of Computer Science, Queen
Mary, University of London, 2005.
4.
T. Yildirim and P. Radeliffe, “VoIP traffic classification in IPsec tunnels”,
in Electronics and Information Engineering (ICEIE), 2010 International Conference
On, vol. 1, 2010, pp. V1-151-V1-157.
5.
Al Khater, N., Overill, R.E., “Network Traffic Classification Techniques
and Challenges”. In the 10th International Conference on Digital Information
Management, ICDIM 2015. pp. 43-48, October 2015.
6.
Yu Liu, “A survey of machine learning based packet classification”
Published 2012; Computer Science.