2025 -Yil
13-Fevral
RAQAMLI DUNYO: MATEMATIK VA INFORMATIK
YONDASHUVLAR
Respublika ilmiy-uslubiy konferensiyasi
107
BELGILARNI TASNIFLASHDA ISHLATILADIGAN ASOSIY O‘LCHOV
MEZONLARI
Shukrulloyev Bektosh Robillo o‘g‘li
Amaliy matematika va informatika kafedrasi mudiri
email:
https://doi.org/10.5281/zenodo.14849808
Annotatsiya.
Ma’lumotlarni tasniflash algoritmlari samaradorligini baholashda
ishlatiladigan asosiy o‘lchov mezonlari tadqiq qilinadi. Ushbu maqolada
aniqlik (accuracy),
noaniqlik (error rate), sezgirlik (sensitivity), xoslik (specificity), F1-score va AUC-ROC
kabi
ko‘rsatkichlar ko‘rib chiqiladi. Turli klassifikatorlar uchun baholash mezonlarining afzallik va
cheklovlari muhokama qilinib, eksperimental tahlillar asosida ularning real dunyo muhitida
qo‘llanilishi ko‘rib chiqiladi.
Kalit so‘zlar
: ma’lumotlarni tasniflash, baholash mezonlari, aniqlik, AUC-ROC, F1-score,
klassifikatsiya.
Kirish.
Ma’lumotlarni tasniflash algoritmlari sun’iy intellekt va mashinaviy o‘rganish
sohasida muhim rol o‘ynaydi. Bunday algoritmlar real hayotda
tibbiyot, biometrik tizimlar,
moliyaviy risklarni tahlil qilish, avtomatlashtirilgan nazorat tizimlari
kabi sohalarda keng
qo‘llanilmoqda. Tasniflash modelining samaradorligi uning qanchalik aniq natija bera olishi bilan
baholanadi. Shu sababli, turli o‘lchov mezonlarini to‘g‘ri tanlash tasniflovchi modelning sifatini
baholashda asosiy omillardan biri hisoblanadi.
Ma’lumotlarni tasniflash algoritmlari samaradorligini baholashda ishlatiladigan asosiy
o‘lchov mezonlari tadqiq qilinadi. Ushbu maqolada aniqlik (accuracy), noaniqlik (error rate),
sezgirlik (sensitivity), xoslik (specificity), F1-score va AUC-ROC kabi ko‘rsatkichlar ko‘rib
chiqiladi. Turli klassifikatorlar uchun baholash mezonlarining afzallik va cheklovlari muhokama
qilinib, eksperimental tahlillar asosida ularning real dunyo muhitida qo‘llanilishi ko‘rib chiqiladi.
Ushbu maqolada klassifikatsiya algoritmlarini baholashda keng qo‘llaniladigan asosiy
mezonlar haqida batafsil ma’lumot beriladi hamda ularning amaliy qo‘llanilishi tadqiq qilinadi.
Asosiy baholash mezonlari
Aniqlik (Accuracy).
Tasniflovchining umumiy to‘g‘ri tasniflangan obyektlar ulushini
aniqlash uchun ishlatiladi:
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 =
𝑇𝑃 + 𝑇𝑁
𝑇𝑃 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁
Bu yerda:
TP (True Positive)
– To‘g‘ri ijobiy tasniflangan obyektlar
TN (True Negative)
– To‘g‘ri salbiy tasniflangan obyektlar
FP (False Positive)
– Noto‘g‘ri ijobiy tasniflangan obyektlar
FN (False Negative)
– Noto‘g‘ri salbiy tasniflangan obyektlar
Aniqlik yuqori bo‘lsa, tasniflovchi model samaradorligi yaxshi hisoblanadi. Biroq, agar
sinflar o‘rtasidagi ma’lumotlar muvozanatsiz bo‘lsa (imbalanced dataset), bu mezon noto‘g‘ri
natija berishi mumkin.
Xato darajasi (Error Rate).
Bu mezon tasniflovchining noto‘g‘ri tasniflagan obyektlari
ulushini ifodalaydi:
𝐸𝑟𝑟𝑜𝑟 𝑅𝑎𝑡𝑒 = 1 − 𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦
2025 -Yil
13-Fevral
RAQAMLI DUNYO: MATEMATIK VA INFORMATIK
YONDASHUVLAR
Respublika ilmiy-uslubiy konferensiyasi
108
Bu ko‘rsatkich qanchalik kichik bo‘lsa, model shunchalik samarali ishlaydi.
Sezgirlik (Sensitivity) va Xoslik (Specificity)
Sezgirlik va xoslik mezonlari ayniqsa
tibbiy diagnostika
kabi sohalarda muhim
ahamiyatga ega:
𝑆𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦 =
𝑇𝑃
𝑇𝑃 + 𝐹𝑁
𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦 =
𝑇𝑁
𝑇𝑁 + 𝐹𝑃
Sezgirlik (Recall)
– ijobiy natijalarni to‘g‘ri tasniflash qobiliyatini bildiradi.
Xoslik (Specificity)
– salbiy natijalarni to‘g‘ri tasniflash qobiliyatini ifodalaydi.
Sezgirlik va xoslik mezonlarining balansini saqlash tasniflovchi model uchun muhimdir.
F1-score.
F1-score tasniflovchining aniqlik va sezgirlik o‘rtasidagi muvozanatini
hisoblashda ishlatiladi:
𝐹1 = 2 ×
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 × 𝑅𝑒𝑐𝑎𝑙𝑙
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 + 𝑅𝑒𝑐𝑎𝑙𝑙
Bu mezon ayniqsa
imbalanced dataset
(muvozanatsiz ma’lumotlar) mavjud bo‘lganda
muhim ahamiyatga ega.
AUC-ROC egri chizig‘i.
AUC-ROC (Area Under the Curve - Receiver Operating
Characteristic) tasniflovchining barcha mumkin bo‘lgan chegaraviy qiymatlari uchun sezgirlik va
xoslikning o‘zgarishini ko‘rsatadi.
AUC qiymati 0.5 dan yuqori bo‘lsa, modelning tasniflash qobiliyati mavjud ekanligini
bildiradi.
AUC-ROC yuqori bo‘lsa, model ancha ishonchli hisoblanadi.
Eksperimental natijalar
Tadqiqot doirasida
Logistic Regression, Random Forest va Neural Networks
kabi turli
tasniflash algoritmlarining natijalari o‘rganildi. Ularning
Accuracy, F1-score va AUC-ROC
mezonlari bo‘yicha natijalari quyidagi jadvalda keltirilgan:
Model
Accuracy Precision Recall F1-score AUC-ROC
Logistic Regression 85.3%
84.5% 82.7% 83.6%
89.2%
Random Forest
91.1%
90.2% 88.5% 89.3%
94.7%
Neural Networks
94.8%
95.1% 93.7% 94.4%
97.5%
Natijalar shuni ko‘rsatadiki,
sun’iy neyron tarmoqlari (Neural Networks)
tasniflash
vazifasida eng yuqori natijalarni qayd etdi, ayniqsa
AUC-ROC
mezoni bo‘yicha ancha yuqori
ko‘rsatkichga erishdi.
Xulosa.
Ushbu maqolada tasniflash algoritmlarini baholash uchun ishlatiladigan asosiy
mezonlar o‘rganildi. Tadqiqot natijalariga ko‘ra:
Accuracy
oddiy holatlarda yaxshi ishlaydi, lekin ma’lumotlar muvozanatsiz bo‘lsa,
kamchiliklari bor.
F1-score
muvozanatsiz ma’lumotlarda samarali natija beradi.
AUC-ROC
modelning umumiy ishlash qobiliyatini aniq baholash imkonini beradi.
Kelajakda tasniflash modellarini takomillashtirish uchun ansambl usullaridan foydalanish
hamda chuqur o‘rganish tarmoqlari bilan eksperiment o‘tkazish muhim tadqiqot yo‘nalishlaridan
biri bo‘lishi mumkin.
2025 -Yil
13-Fevral
RAQAMLI DUNYO: MATEMATIK VA INFORMATIK
YONDASHUVLAR
Respublika ilmiy-uslubiy konferensiyasi
109
Foydalanilgan adabiyotlar
1.
Sh.U. Eshonqulov, N.A. Qarshiboyev (2023).
Sun'iy intellekt asoslari
. Jizzax politexnika
instituti.
2.
M.R. Po‘lotova (2024).
Ko‘p parametrli texnologik jarayonlarni boshqarishda
bashoratlovchi modellardan foydalanish
. Raqamli texnologiyalar va sun'iy intellektni
rivojlantirish ilmiy-tadqiqot instituti.
3.
R.X. Alimov, O’.T. Xayitmatov, A.F. Xakimov, G.T. Yulchieva, O.X. Azamatov, U.A.
Otajanov (2022).
Axborot tizimlari
. Toshkent davlat iqtisodiyot universiteti.
4.
A.A. Abdumalikov, K.G. Jabbarov (2023).
Big Data muammolari va ma'lumotlarni
intellektual tahlil qilish
.
