Authors

  • Mansur Safarov
  • Bektosh Shukrulloyev

DOI:

https://doi.org/10.71337/inlibrary.uz.science-research.65164

Keywords:

ma’lumotlarni tasniflash mashinaviy o‘rganish validatsiya tasniflash algoritmlari baholash mezonlari.

Abstract

Ma’lumotlarni tasniflash sun’iy intellekt va mashinaviy o‘rganishning asosiy yo‘nalishlaridan biri hisoblanadi. Ushbu maqolada ma’lumotlarni tasniflash jarayoni va uning asosiy bosqichlari batafsil tahlil qilinadi. Ma’lumotlarni oldindan tayyorlash, xususiyatlarni tanlash, modellarni o‘rgatish, validatsiya va baholash jarayonlari har tomonlama yoritiladi. Shuningdek, tasniflash jarayonida yuzaga keladigan muammolar va ularning echimlari muhokama qilinadi. Ushbu maqola, ayniqsa, katta hajmdagi ma’lumotlarni qayta ishlash va samarali tasniflash metodlari ustida ishlayotgan tadqiqotchilar va muhandislar uchun muhim ahamiyat kasb etadi.

background image

2025 -Yil

13-Fevral

RAQAMLI DUNYO: MATEMATIK VA INFORMATIK

YONDASHUVLAR

Respublika ilmiy-uslubiy konferensiyasi

27


MA’LUMOTLAR TASNIFLASH JARAYONI VA ASOSIY BOSQICHLARI

Safarov Mansur Abdurashid o'g'li

Shukrulloyev Bektosh Robillo o‘g‘li

TMC instituti

Email:

safarov.mansur@tmci.uz

https://doi.org/10.5281/zenodo.14845342

Annotatsiya.

Ma’lumotlarni tasniflash sun’iy intellekt va mashinaviy o‘rganishning asosiy

yo‘nalishlaridan biri hisoblanadi. Ushbu maqolada ma’lumotlarni tasniflash jarayoni va uning
asosiy bosqichlari batafsil tahlil qilinadi. Ma’lumotlarni oldindan tayyorlash, xususiyatlarni
tanlash, modellarni o‘rgatish, validatsiya va baholash jarayonlari har tomonlama yoritiladi.

Shuningdek, tasniflash jarayonida yuzaga keladigan muammolar va ularning echimlari

muhokama qilinadi. Ushbu maqola, ayniqsa, katta hajmdagi ma’lumotlarni qayta ishlash va
samarali tasniflash metodlari ustida ishlayotgan tadqiqotchilar va muhandislar uchun muhim
ahamiyat kasb etadi.

Kalit so‘zlar:

ma’lumotlarni tasniflash, mashinaviy o‘rganish, validatsiya, tasniflash

algoritmlari, baholash mezonlari.

Kirish.

Ma’lumotlarni tasniflash bugungi kunda turli sohalarda, jumladan, tibbiyot,

moliya, sanoat va tabiiy tilni qayta ishlash sohalarida muhim rol o‘ynaydi. Tasniflash algoritmlari
yordamida ma’lumotlarni ma’lum sinflarga ajratish va ularni samarali boshqarish imkoniyati
mavjud. Ushbu jarayon samarali ishlashi uchun bir nechta bosqichlar talab etiladi.

Tasniflash jarayoni quyidagi asosiy bosqichlardan iborat:

1.

Ma’lumotlarni yig‘ish va oldindan qayta ishlash.

2.

Belgilarni tanlash va optimallashtirish.

3.

Modelni yaratish va mashg‘ulotdan o‘tkazish.

4.

Validatsiya va baholash.

5.

Modelni ishlab chiqarish jarayoniga integratsiya qilish.
Har bir bosqichda o‘ziga xos metodologiyalar mavjud bo‘lib, ular tasniflash jarayonining

samaradorligiga ta’sir ko‘rsatadi. Ushbu maqolada har bir bosqich alohida yoritiladi.

Ma’lumotlarni yig‘ish va oldindan qayta ishlash.

Ma’lumotlarni tasniflash jarayoni

yaxshi natijalarga erishish uchun sifatli ma’lumotlar yig‘ishni talab qiladi. Ma’lumot yig‘ish
jarayonida quyidagilar muhim hisoblanadi:

Ma’lumot manbalarini aniqlash

: Sensorlar, veb-saytlar, tibbiy yozuvlar yoki boshqa

manbalardan olingan ma’lumotlar.

Tozalanish jarayoni

: Ma’lumotlar to‘g‘ri formatda bo‘lishi uchun kamchiliklar,

takrorlanishlar va noto‘g‘ri qiymatlar yo‘q qilinadi.

Ma’lumotlarni normallashtirish

: Ma’lumotlar turli diapazonlarga ega bo‘lishi mumkin,

ularni bir xil diapazonga keltirish kerak.

Muvozanatli sinflar yaratish

: Ma’lumotlar muvozanatsiz bo‘lsa, tasniflash natijalari

noto‘g‘ri bo‘lishi mumkin. Sinflar balansini saqlash muhim ahamiyatga ega.

Belgilarni tanlash va optimallashtirish.

Ma’lumotlar tasniflash natijalarini yaxshilash

uchun eng muhim belgilarni tanlash va optimallashtirish muhimdir.


background image

2025 -Yil

13-Fevral

RAQAMLI DUNYO: MATEMATIK VA INFORMATIK

YONDASHUVLAR

Respublika ilmiy-uslubiy konferensiyasi

28


Filtr usullari

: Belgilarni statistik mezonlar asosida baholash va muhim bo‘lganlarini

tanlash.

Wrapper usullari

: Model asosida belgilarni tanlab olish va ularning natijalarini tekshirish.

Ansambl usullari

: Bir nechta algoritmlar natijalarini birlashtirish orqali optimal belgilar

to‘plamini aniqlash.

Dimensional Reduction

: Belgilar sonini kamaytirish orqali modelning samaradorligini

oshirish.

Modelni yaratish va mashg‘ulotdan o‘tkazish.

Modelni yaratish jarayoni tasniflash

algoritmiga bog‘liq. Mashhur tasniflash algoritmlariga quyidagilar kiradi:

Naive Bayes

: Soddaligi va tezkorligi bilan ajralib turadi.

Qaror daraxtlari

: Oson tushunarli bo‘lib, murakkab xususiyatlarni yaxshi ifodalaydi.

Support Vector Machines (SVM)

: Chiziqli bo‘lmagan tasniflash masalalarida samarali

ishlaydi.

Neyron tarmoqlar

: Chuqur o‘rganish usullari yordamida yuqori samarali natijalarga

erishish imkonini beradi.

Ansambl usullari

: Random Forest va Gradient Boosting kabi algoritmlar model

natijalarini yaxshilash uchun ishlatiladi.

Validatsiya va baholash.

Modelning samaradorligini baholash uchun quyidagi mezonlar

ishlatiladi:

Aniqlik (Accuracy)

: Modelning to‘g‘ri tasniflash foizini o‘lchaydi.

F1-score

: Precision va Recall ko‘rsatkichlari asosida aniqlanadi.

AUC-ROC

: Modelning turli chegaraviy qiymatlar bo‘yicha qanday ishlashini baholaydi.

Cross-validation

: Modelning umumiy ishlash qobiliyatini tekshirish uchun ishlatiladi.

Modelni ishlab chiqish jarayoniga integratsiya qilish.

Oxirgi bosqichda model

amaliyotga joriy etiladi. Bu jarayonda quyidagi qadamlar amalga oshiriladi:

Modelni serverga joylashtirish

Real vaqt rejimida tahlil qilish

Modelning doimiy yangilanishi va optimallashtirilishi

Xulosa.

Ma’lumotlarni tasniflash jarayoni bir nechta bosqichlarni o‘z ichiga oladi va har

bir bosqich model samaradorligiga ta’sir ko‘rsatadi. Ma’lumotlarni oldindan qayta ishlash,
belgilarni optimallashtirish, model yaratish va validatsiya qilish bosqichlari to‘g‘ri bajarilsa,
modelning umumiy natijalari yuqori bo‘ladi. Kelajakda yangi algoritmlarni qo‘llash va katta
hajmdagi ma’lumotlar bilan ishlashga moslashuvchan yondashuvlar ishlab chiqish muhim
tadqiqot yo‘nalishlaridan biri bo‘lib qoladi.


Foydalanilgan Adabiyotlar

1.

Bishop, C. M. (2023).

Pattern Recognition and Machine Learning

. Springer.

2.

Goodfellow, I., Bengio, Y., & Courville, A. (2022).

Deep Learning

. MIT Press.

3.

Kuhn, M., & Johnson, K. (2023).

Applied Predictive Modeling

. Springer.

4.

Pedregosa, F., Varoquaux, G., Gramfort, A., et al. (2023).

Scikit-learn: Machine Learning

in Python

. Journal of Machine Learning Research.

5.

Hastie, T., Tibshirani, R., & Friedman, J. (2022).

The Elements of Statistical Learning:

Data Mining, Inference, and Prediction

. Springer.

References

Bishop, C. M. (2023). Pattern Recognition and Machine Learning. Springer.

Goodfellow, I., Bengio, Y., & Courville, A. (2022). Deep Learning. MIT Press.

Kuhn, M., & Johnson, K. (2023). Applied Predictive Modeling. Springer.

Pedregosa, F., Varoquaux, G., Gramfort, A., et al. (2023). Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research.

Hastie, T., Tibshirani, R., & Friedman, J. (2022). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer.