Авторы

  • Israiljon Tojimamatov
    Farg‘ona davlat unversiteti amaliy matematika va informatika kafedrasi katta o‘qituvchisi,
  • Shohjahon Tohirov
    Farg’ona davlat universiteti 2-bosqich talabasi

DOI:

https://doi.org/10.71337/inlibrary.uz.sies.50879

Ключевые слова:

Klasterlash O'rtacha algoritm Maksimum masofa algoritmi ISODATA algoritmi Maksimallashtirishni kutish algoritmi Ma'lumotlar tahlili Sun'iy intellekt.

Аннотация

Ushbu maqola klasterlash metodlari va ularning turli sohalarda qo'llanilishini tahlil etadi. Klasterlash - bu ma'lumotlar to'plamini o'xshashlik yoki masofa asosida bir-biriga yaqin guruhlarga ajratish jarayoni. Bizning tadqiqotimiz klasterlashning o'rtacha algoritmi, maksimum masofa algoritmi, ISODATA algoritmi va maksimallashtirishni kutish algoritmi kabi asosiy usullariga qaratilgan. Har bir algoritmning matematik asoslari, afzalliklari va cheklovlari ko'rib chiqiladi, shuningdek ularning amaliy dasturlari misollar orqali tushuntiriladi.


background image

SCIENCE AND INNOVATION IN THE

EDUCATION SYSTEM

International scientific-online conference

95

KLASTERLASH. K –O’RTACHA ALGORITIMI. MAKSIMUM MASOFA

ALGORITMI. ISODATA ALGORITMI. MAKSIMALLASHTIRISHNI

QUTISH ALGARITMI.

Tojimamatov Israiljon Nurmamatovich

Farg‘ona davlat unversiteti amaliy matematika

va informatika kafedrasi katta o‘qituvchisi,

israiltojimamatov@gmail.com

Tohirov Shohjahon Ilhomjon og’li

Farg’ona davlat universiteti 2-bosqich talabasi

shohjahontohirov31@gmail.com

https://doi.org/10.5281/zenodo.11198157

Annotatsiya

Ushbu maqola klasterlash metodlari va ularning turli sohalarda

qo'llanilishini tahlil etadi. Klasterlash - bu ma'lumotlar to'plamini o'xshashlik
yoki masofa asosida bir-biriga yaqin guruhlarga ajratish jarayoni. Bizning
tadqiqotimiz klasterlashning o'rtacha algoritmi, maksimum masofa algoritmi,
ISODATA algoritmi va maksimallashtirishni kutish algoritmi kabi asosiy
usullariga qaratilgan. Har bir algoritmning matematik asoslari, afzalliklari va
cheklovlari ko'rib chiqiladi, shuningdek ularning amaliy dasturlari misollar
orqali tushuntiriladi.

Kalit So'zlar:

Klasterlash, O'rtacha algoritm, Maksimum masofa algoritmi, ISODATA

algoritmi, Maksimallashtirishni kutish algoritmi, Ma'lumotlar tahlili, Sun'iy
intellekt.

Аннотация

В данной статье анализируются методы кластеризации и их

применение в различных областях. Кластеризация — это процесс
разделения набора данных на тесно связанные группы на основе сходства
или расстояния. Наши исследования сосредоточены на основных методах
кластеризации, таких как алгоритм усреднения, алгоритм максимального
расстояния, алгоритм ISODATA и алгоритм ожидания максимизации.
Рассмотрены математическая основа, преимущества и ограничения
каждого алгоритма, а их практическое применение объяснено на
примерах.

Ключевые слова:

Кластеризация,

алгоритм

среднего

значения,

алгоритм

максимального расстояния, алгоритм ISODATA, алгоритм максимизации
ожидания, анализ данных, искусственный интеллект.


background image

SCIENCE AND INNOVATION IN THE

EDUCATION SYSTEM

International scientific-online conference

96

Annotation

This article analyzes clustering methods and their applications in various

fields. Clustering is the process of dividing a set of data into closely related
groups based on similarity or distance. Our research focuses on the main
methods of clustering, such as the averaging algorithm, the maximum distance
algorithm, the ISODATA algorithm, and the maximization expectation algorithm.
The mathematical basis, advantages, and limitations of each algorithm are
reviewed, and their practical applications are explained through examples.

Key words:

Clustering, Average Algorithm, Maximum Distance Algorithm, ISODATA

Algorithm, Maximization Expectation Algorithm, Data Analysis, Artificial
Intelligence.

Kirish

Klasterlash - bu katta hajmdagi ma'lumotlar to'plamida mantiqiy guruhlar

yoki "klasterlar"ni aniqlash uchun ishlatiladigan usullardan biridir. Bu jarayon
ma'lumotlarni tahlil qilish, tasniflash va ular orasidagi o'xshashliklarni
aniqlashda muhim ahamiyatga ega. Klasterlashning turli algoritmlari mavjud
bo'lib, har biri ma'lum bir vazifani yechish uchun mo'ljallangan.

O'rtacha algoritm

O'rtacha algoritm (K-means algoritmi deb ham tanilgan) eng ko'p

qo'llaniladigan klasterlash usullaridan biridir. Ushbu algoritm har bir klaster
uchun markaz (centroid) hisoblaydi va har bir nuqta uchun eng yaqin markazga
asoslanib klasterlarni shakllantiradi. Algoritmning asosiy qadamlari
quyidagicha:
1. Tasodifiy markazlarni tanlash.
2. Har bir nuqtani eng yaqin markazga ajratish.
3. Har bir klaster uchun yangi markazlarni hisoblash.
4. 2-3 qadamlarni klasterlar o'zgarmaguncha takrorlash.

Maksimum masofa algoritmi

Maksimum masofa algoritmi (Maximum distance algorithm), klasterlarni

shakllantirishda nuqtalar orasidagi maksimal masofadan foydalanadi. Bu usul,
o'rtacha algoritmdan farqli o'laroq, klasterlarning chegaralarini aniqroq
belgilash imkonini beradi, ayniqsa ma'lumotlar to'plamida aniq ajratilgan
guruhlar mavjud bo'lsa.

ISODATA algoritmi

ISODATA (Iterative Self-Organizing Data Analysis Technique Algorithm)

algoritmi o'rtacha algoritmning kengaytirilgan versiyasi hisoblanadi. U


background image

SCIENCE AND INNOVATION IN THE

EDUCATION SYSTEM

International scientific-online conference

97

ma'lumotlar to'plamining o'zgaruvchan tabiatini hisobga oladi va klasterlarni
birlashtirish yoki bo'lish orqali dinamik ravishda moslashadi. Bu, murakkab
ma'lumotlar to'plamlari bilan ishlashda qo'shimcha moslashuvchanlik beradi.

Maksimallashtirishni kutish algoritmi

Maksimallashtirishni kutish (Expectation Maximization, EM) algoritmi,

ma'lum bir taqsimotga ega bo'lgan ma'lumotlar to'plamida klasterlarni topish
uchun ishlatiladi. Bu yondashuv, har bir nuqtaning klasterga tegishliligini
ehtimoliylik asosida baholaydi va bu ehtimollarni maksimallashtirish orqali
klasterlar markazlarini yangilaydi. EM algoritmi, ayniqsa, statistik
modellashtirish sohasida keng qo'llaniladi.

Xulosa

Klasterlash algoritmlari ma'lumotlar tahlilida muhim rol o'ynaydi va turli xil
ilmiy va amaliy sohalarda keng qo'llaniladi. Har bir algoritmning o'ziga xos
xususiyatlari mavjud bo'lib, ularning qo'llanilishi ma'lumotlar to'plamining
xususiyatlariga va tadqiqot maqsadlariga bog'liq. Ushbu algoritmlar sun'iy
intellekt va ma'lumotlar tahlilining turli sohalarida muhim qo'llanma
hisoblanadi.

Foydalanilgan adabiyotlar:

1. Jain, A. K., Murty, M. N., & Flynn, P. J. (1999). Data clustering: A review. ACM
Computing Surveys (CSUR), 31(3), 264-323.
2. MacQueen, J. (1967). Some methods for classification and analysis of
multivariate observations. Proceedings of the 5th Berkeley Symposium on
Mathematical Statistics and Probability, 1(14), 281-297.
3. Ball, G. H., & Hall, D. J. (1965). ISODATA, a novel method of data analysis and
pattern classification. Stanford Research Institute.
4. Dempster, A. P., Laird, N. M., & Rubin, D. B. (1977). Maximum likelihood from
incomplete data via the EM algorithm. Journal of the Royal Statistical Society:
Series B (Methodological), 39(1), 1-38.

Библиографические ссылки

Jain, A. K., Murty, M. N., & Flynn, P. J. (1999). Data clustering: A review. ACM Computing Surveys (CSUR), 31(3), 264-323.

MacQueen, J. (1967). Some methods for classification and analysis of multivariate observations. Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability, 1(14), 281-297.

Ball, G. H., & Hall, D. J. (1965). ISODATA, a novel method of data analysis and pattern classification. Stanford Research Institute.

Dempster, A. P., Laird, N. M., & Rubin, D. B. (1977). Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society: Series B (Methodological), 39(1), 1-38.

Наиболее читаемые статьи этого автора (авторов)