Авторы

  • Feruza Jo’rayeva
    (Shahrisabz davlat pedagogika instituti)
  • Aziza Normataova
    (Shahrisabz davlat pedagogika instituti 4-kurs talabasi)

DOI:

https://doi.org/10.71337/inlibrary.uz.zdit.52284

Ключевые слова:

Katta ma’lumotlar NoSQL SQL gibrid ma’lumotlar bazalari Apache Cassandra Amazon DynamoDB MongoDB Apache Spark Microsoft Azure Cosmos DB bulut texnologiyalari ma’lumotlar tahlili parallel qayta ishlash.

Аннотация

Bugungi kunda ma’lumotlarning hajmi va xilma-xilligi sezilarli darajada oshib bormoqda. Shu sababli, katta ma’lumotlar (Big Data) bilan samarali ishlash uchun moslashuvchan, kengayuvchan va yuqori samaradorlikka ega ma’lumotlar bazasi boshqaruv tizimlari talab qilinmoqda. Ushbu maqolada katta ma’lumotlar uchun NoSQL, SQL va gibrid ma’lumotlar bazalari tahlil qilinib, Apache Cassandra, Amazon DynamoDB, MongoDB, Apache Spark va Microsoft Azure Cosmos DB kabi tizimlarning xususiyatlari va qo‘llanilishi yoritilgan. Katta ma’lumotlar tizimlarining afzalliklari, kamchiliklari, va kelajakdagi rivojlanish istiqbollari, jumladan sun’iy intellekt va IoT texnologiyalari bilan integratsiya masalalari ko‘rib chiqiladi.


background image

31

KATTA MA’LUMOTLAR (BIG DATA) UCHUN DBMS TIZIMLARI

Jo’rayeva Feruza Baxtiyor qizi

(Shahrisabz davlat pedagogika instituti)

jorayevaferuzaasila@mail.ru

Normataova Aziza

(Shahrisabz davlat pedagogika instituti 4-kurs talabasi)

azizanormatova610@gmail.com

https://doi.org/10.5281/zenodo.14325715

Annotatsiya.

Bugungi kunda ma’lumotlarning hajmi va xilma-xilligi sezilarli darajada

oshib bormoqda. Shu sababli, katta ma’lumotlar (Big Data) bilan samarali ishlash uchun
moslashuvchan, kengayuvchan va yuqori samaradorlikka ega ma’lumotlar bazasi boshqaruv
tizimlari talab qilinmoqda. Ushbu maqolada katta ma’lumotlar uchun NoSQL, SQL va gibrid
ma’lumotlar bazalari tahlil qilinib, Apache Cassandra, Amazon DynamoDB, MongoDB, Apache
Spark va Microsoft Azure Cosmos DB kabi tizimlarning xususiyatlari va qo‘llanilishi yoritilgan.
Katta ma’lumotlar tizimlarining afzalliklari, kamchiliklari, va kelajakdagi rivojlanish
istiqbollari, jumladan sun’iy intellekt va IoT texnologiyalari bilan integratsiya masalalari ko‘rib
chiqiladi.

Kalit so‘zlar:

Katta ma’lumotlar, NoSQL, SQL, gibrid ma’lumotlar bazalari, Apache

Cassandra, Amazon DynamoDB, MongoDB, Apache Spark, Microsoft Azure Cosmos DB, bulut
texnologiyalari, ma’lumotlar tahlili, parallel qayta ishlash.

Abstract:

Today, the volume and variety of information is increasing significantly.

Therefore, flexible, scalable and high-performance database management systems are required
to effectively work with big data. This article analyzes NoSQL, SQL, and hybrid databases for big
data, covering the features and applications of systems such as Apache Cassandra, Amazon
DynamoDB, MongoDB, Apache Spark, and Microsoft Azure Cosmos DB. Advantages,
disadvantages, and future development prospects of big data systems, including integration
with artificial intelligence and IoT technologies, are considered.

Keywords:

Big data, NoSQL, SQL, hybrid databases, Apache Cassandra, Amazon

DynamoDB, MongoDB, Apache Spark, Microsoft Azure Cosmos DB, cloud technologies, data
analysis, parallel processing.

Аннотация:

Сегодня объем и разнообразие информации значительно

увеличивается. Поэтому для эффективной работы с большими данными необходимы
гибкие, масштабируемые и высокопроизводительные системы управления базами
данных. В этой статье анализируются NoSQL, SQL и гибридные базы данных на предмет
больших данных, охватывая функции и приложения таких систем, как Apache Cassandra,
Amazon DynamoDB, MongoDB, Apache Spark и Microsoft Azure Cosmos DB. Рассмотрены
преимущества, недостатки и перспективы дальнейшего развития систем больших
данных, включая интеграцию с технологиями искусственного интеллекта и Интернета
вещей.

Ключевые слова:

Большие данные, NoSQL, SQL, гибридные базы данных, Apache

Cassandra, Amazon DynamoDB, MongoDB, Apache Spark, Microsoft Azure Cosmos DB,
облачные технологии, анализ данных, параллельная обработка.

Kirish

Bugungi raqamli dunyoda ma’lumot hajmi har soniyada eksponensial sur’atda oshib

bormoqda. Bu o'sish

Katta ma'lumotlar” tushunchasining tobora ahamiyatini oshiradi.

“Katta


background image

32

ma’lumotlar - bu biz juda katta hajmdagi ma’lumotlarni to‘plash va ularni ma’lumotlar
omborida saqlash uchun ishlatadigan atama. Bu shuni anglatadiki, vaqt o‘tishi bilan hajm ham
eksponent ravishda o‘sishi mumkin. Bunda ma’lumotlar miqdori shunchalik katta va
murakkabki, uni saqlash yoki samarali qayta ishlash uchun an’anaviy ma’lumotlar bazasini
boshqarish tizimlari bunday hajmdagi ma’lumotlarni samarali boshqarishga mos emas.Big Data
nafaqat katta hajmdagi ma’lumotlarni, balki ularga ishlov berish tezligi va xilma-xilligini ham
o‘z ichiga oladi. Ma’lumot hajmi juda katta bo‘lib, terabaytdan zetabaytgacha yetishi mumkin.
Ma’lumotlar turli formatlarda bo‘ladi hamda Ma’lumotlar oqimi real vaqt rejimida yangilanadi
va tezkor tahlil talab etiladi.

Klassik DBMS tizimlari katta hajmdagi ma’lumotlarni saqlashda va qayta ishlashda

qiyinchiliklarga duch keladi. Shu sababli, zamonaviy texnologiyalar asosida maxsus
optimallashtirilgan DBMS tizimlari ishlab chiqilgan.

“Katta ma'lumotlar bazasi tizimi” - bu katta hajmdagi ma’lumotlarni saqlash va tahlil

qilish imkonini beruvchi onlayn ma’lumotlar bazasini boshqarish tizimi. Katta ma’lumotlar
bazalari o‘zining xususiyatlari bilan an’anaviy tizimlardan farq qiladi. Bunda, ma’lumotlar
shunchaki saqlanib qolmaydi, balki ularni tezda qayta ishlash, tahlil qilish va yangi
tushunchalar hosil qilish imkoniyatlari ham mavjud. Katta hajmdagi ma’lumotlar odatda
parallel qayta ishlashni talab qiladi, chunki bir nechta ma’lumotlar manbalaridan ma’lumotlarni
yig‘ish, saqlash va tahlil qilishni an’anaviy usullar bilan amalga oshirish juda katta vaqt talab
etadi. Shuning uchun Katta ma’lumotlar bazalari yuqori darajadagi parallelizmga, shuningdek,
yuqori samarali algoritmlarga ega bo‘lib, tezkor tahlil qilish imkonini beradi. Katta ma’lumotlar
bazalari yordamida kompaniyalar yoki tashkilotlar tezkor qarorlar qabul qilish,
ma’lumotlardan yangi bilimlar chiqarish va strategik rejalar tuzish imkoniyatiga ega bo‘lishadi.
Misol uchun, tibbiyotda, moliya sohasida yoki elektron tijoratda ma’lumotlar bazalaridan
foydalanib, mijozlar xatti-harakatlarini tahlil qilish, tavsiyalar berish yoki muammolarni
oldindan bashorat qilish mumkin.

Katta ma’lumotlar (Big Data) uchun ma’lumotlar bazalari tizimlari asosan bulutga

asoslangan, chunki bulutli platformalar katta hajmdagi ma'lumotlarni saqlash, boshqarish va
tahlil qilish uchun moslashuvchan va samarali yechimlar taqdim etadi.

Bulutli platformalar katta ma’lumotlarni boshqarish va tahlil qilish uchun samarali

yechimlar taqdim etadi. Ular SQL, NoSQL va gibrid ma’lumotlar bazalarini taklif qilmoqda, bu
esa turli xil ma’lumotlar modellarini va ilovalarni qo‘llab-quvvatlaydi. Quyida eng mashhur
bulutli platformalar va ularning SQL, NoSQL va gibrid tizimlari bo‘yicha tasnifi keltirilgan.

Bulutli texnologiyalar katta hajmdagi ma’lumotlarni saqlash va boshqarishda samarali va

moslashuvchan yechimlarni taqdim etadi. Amazon Web Services (AWS), Microsoft Azure kabi
bulutli xizmatlar orqali, ma’lumotlar boshqaruv tizimlari optimallashtirilgan va zaxiralash
imkoniyatiga ega bo‘ladi. Bulutli DBMS tizimlari, shuningdek, yuqori hajmdagi ma’lumotlarni
kengaytirish va zarur bo‘lganda tezkor tahlil qiloladi.

Katta ma’lumotlarni boshqarish tizimlari quyidagilarga asoslangan asosiy guruhlarga

bo‘linadi:

NoSQL ma’lumotlar bazalari tizimlarida

real vaqtda va paralel ishlov berish

imkoniyatlarini taqdim etadigan texnologiyalar qo‘llaniladi. NoSQL tizimlari katta hajmdagi
ma’lumotlarni boshqarish uchun juda mos keladi, chunki ular ma’lumotlarni turli formatda
saqlash va tahlil qilish imkoniyatini taqdim etadi.


background image

33

Apache Cassandra

– bu katta hajmdagi ma’lumotlarni boshqarish va tahlil qilish uchun

mo‘ljallangan NoSQL ma’lumotlar bazasi tizimi bo‘lib, yuqori mavjudlik va nosozliklarga
chidamlilikni ta’minlaydi. Cassandra, ma’lumotlar bazasining kengayishini qulaylashtiruvchi va
yuqori tezlikda ma’lumotlarni qabul qilish hamda real vaqt tahlilini amalga oshiruvchi tizim
sifatida ishlatiladi. Bu tizim sensor ma’lumotlarini monitoring qilish, vaqt seriyalarini tahlil
qilish va kontent boshqarish kabi sohalarda keng qo‘llaniladi. Masalan, Apple, Netflix va
Instagram kabi kompaniyalar katta hajmdagi ma'lumotlarni boshqarish uchun Apache
Cassandra'dan foydalanadilar.

Amazon DynamoDB — bu Amazon Web Services (AWS) tomonidan taqdim etilgan to‘liq

boshqariladigan, yuqori darajadagi NoSQL ma’lumotlar bazasi xizmati. DynamoDB yuqori
ishlash va kengayish imkoniyatlari bilan ajralib turadi. Bu xizmat foydalanuvchilarga katta
hajmdagi ma’lumotlarni tez va samarali tarzda saqlash, boshqarish va tahlil qilish imkonini
beradi. DynamoDB avtomatik kengayish, imkoniyatlariga ega bo‘lib, e-tijorat, o‘yinlar va real
vaqt analitikasi kabi ilovalar uchun juda mos keladi. U xavfsizlikni ta’minlash uchun bir qator
vositalar bilan jihozlangan va ma’lumotlarni bir nechta serverlarda replikatsiya qilish orqali
yuqori mavjudlikni ta’minlaydi. Biroq, katta ma’lumotlar bazalarini ishlatishda narxlar yuqori
bo‘lishi mumkin va ba’zi cheklangan so‘rov funksiyalari mavjud.

MongoDB – bu mashhur hujjatga yo‘naltirilgan NoSQL ma’lumotlar bazasi bo‘lib, u

tuzilmagan va yarim tuzilgan ma’lumotlar bilan ishlashda yuqori moslashuvchanlikka ega..
MongoDB, shuningdek, arxitekturasi orqali gorizontal kengayishni qo'llab-quvvatlaydi, ya'ni
ma'lumotlar hajmi oshgan sari yangi serverlar qo‘shish orqali tizimning samaradorligini
oshirish mumkin. MongoDB kontentni boshqarish tizimlari, real vaqt tahlillari, IoT (Internet of
Things) ma’lumotlar bazasi va foydalanuvchi tomonidan yaratilgan kontent bilan ishlovchi
dasturlar uchun juda mos keladi. Bu ma'lumotlar bazasi rivojlanayotgan ma’lumot sxemalariga
moslashishga qodir bo‘lib, uni tezda o‘zgartirish va yangilash talab qilinadigan ilovalar uchun
juda qulay qiladi. Dastur ishlab chiqishda tizimning moslashuvchanligi va kengayish qobiliyati
uni eBay, Adobe va Bosch kabi yirik kompaniyalar tomonidan keng qo‘llashga imkon beradi

Apache Spark – bu katta ma’lumotlarni qayta ishlashda inqilobiy o‘zgarish kiritgan

tizimdir. An’anaviy ma’lumotlar bazalaridan farqli o‘laroq, Spark faqat katta ma’lumotlar bazasi
bo‘lib qolmay, balki xotiradagi ma’lumotlarni tez va samarali qayta ishlashning kuchli vositasi
sifatida ishlaydi. U ommaviy ishlov berish, interaktiv so'rovlar va real vaqt ma'lumotlarini qayta
ishlashni qo‘llab-quvvatlaydi, bu esa uni turli ma’lumotlarni qayta ishlash ehtiyojlariga javob
beradigan ko‘p qirrali platformaga aylantiradi.

Apache Spark mashinani o‘rganish, grafik tahlil, ETL (Extract, Transform, Load)

jarayonlari, shuningdek, real vaqt ma’lumotlarini qayta ishlashda keng qo‘llaniladi. U
ma’lumotlarni xotirada qayta ishlash imkoniyatiga ega bo‘lib, bu ishlov berish tezligini sezilarli
darajada oshiradi. Bu esa tashkilotlarga ma’lumotlardan tezda tushuncha olish va qarorlar
qabul qilish jarayonini jadallashtiradi. Spark, shuningdek, katta hajmdagi ma’lumotlarni tez va
samarali tahlil qilish imkonini yaratadi, bu esa uni ilmiy tadqiqotlar, sanoat tahlillari va biznes
qarorlar qabul qilishda foydalidir.

Microsoft Azure Cosmos DB – bu Microsoft Azure tomonidan taqdim etilgan mashhur,

butun dunyo bo‘ylab tarqatilgan, ko‘p modelga asoslangan ma’lumotlar bazasi xizmatidir. U
turli xil Ma'lumotlar Boshqaruv Tizimlari (API)ni qo'llab-quvvatlaydi, jumladan, hujjat, kalit-
qiymat, grafik va ustunlar oilasi. Bu, ishlab chiquvchilarga turli ma'lumotlar modellari bilan


background image

34

ishlovchi ilovalarni yaratishga imkon beradi. Cosmos DB ning global tarqatilishi va avtomatik
kengayishi yuqori mavjudlikni va past kechikishli ma'lumotlarga kirishni ta'minlaydi.

Azure Cosmos DB ilovalar uchun ideal bo‘lib, ular global miqyosda kengayishni, yuqori

mavjudlikni va turli ma’lumotlar modellari qo‘llab-quvvatlashni talab qiladi. Cosmos DB,
shuningdek, turli geografik hududlardagi ma'lumotlarga tezkor kirishni talab qiladigan ilovalar
uchun juda mos keladi. Masalan, o‘yinlar, Internet of Things (IoT) tizimlari va
shaxsiylashtirilgan kontent taqdimoti kabi sohalarda keng qo‘llaniladi. U global miqyosda
yuqori

darajada

optimallashtirilgan

ma’lumotlarga

kirishni

ta’minlash

orqali

foydalanuvchilarga tez va samarali xizmat ko‘rsatish imkoniyatini yaratadi. Cosmos DB ning
global distribyutiv xususiyatlari va ko‘p modelni qo‘llab-quvvatlashi, uni keng qamrovli va
yuqori talabga ega ilovalar uchun afzalroq tanlovga aylantiradi.

Katta ma’lumotlar bazasini tanlash korxonalar uchun muhim qarordir, chunki to‘g‘ri

tanlov ma’lumotlarni boshqarish, tahlil qilish va ulardan qiymat olish imkoniyatlarini sezilarli
darajada yaxshilaydi. Quyidagilarni hisobga olish orqali to‘g‘ri ma’lumotlar bazasini tanlashda
yordam beradi:

Big Data DBMS tizimlarining afzalliklari:

Katta hajmdagi va xilma-xil ma’lumotlar bilan tezkor ishlash imkoniyati.

Moslashuvchanlik va kengayuvchanlik.

Ma’lumotlarga real vaqtda ishlov berish imkoniyati.

Kiberxavfsizlik va ma’lumotlarni zaxiralashning yuqori darajasi.
Endi esa Big Data DBMS tizimlarining kamchiliklarini ko‘rib o‘tamiz:

Murakkab arxitektura va boshqaruvni talab qiladi.

O‘rnatish va texnik xizmat ko‘rsatish qimmat bo‘lishi mumkin.

Katta hajmdagi ma’lumotlar bilan ishlashda yuqori darajadagi texnik bilim talab etiladi.

Xulosa.

Katta ma’lumotlar tizimlari zamonaviy korxonalar uchun strategik ahamiyat kasb

etmoqda. Maqolada katta hajmdagi ma’lumotlarni samarali boshqarish uchun
optimallashtirilgan Apache Cassandra, DynamoDB, MongoDB, va Cosmos DB kabi tizimlar tahlil
qilindi. Ushbu tizimlar yuqori darajadagi parallelizm, real vaqt tahlili va global kengayish
imkoniyatlari bilan ajralib turadi. Shu bilan birga, katta ma’lumotlarni boshqarishda texnik
murakkablik va texnologik xarajatlarning yuqori ekanligi ham ko‘rsatib o‘tildi. Kelajakda sun’iy
intellekt va IoT texnologiyalaridan foydalanish katta ma’lumotlarni boshqarish imkoniyatlarini
yanada kengaytiradi.

References:

1.

Karimov, F. "Axborot texnologiyalari va ma’lumotlar bazasi boshqaruvi." Toshkent:

O‘zbekiston Milliy Ensiklopediyasi nashriyoti, 2020.
2.

Qodirov, S. "Raqamli iqtisodiyotda katta ma’lumotlarning ahamiyati." Iqtisodiyot va

Innovatsiya jurnali, 2021, №3, 45-56-betlar.
3.

Tursunov, A. va Ahmedov, O. "NoSQL texnologiyalari va ularning qo‘llanilishi." Kompyuter

Ilmlari va Muhandislik jurnali, 2022, №5, 34-42-betlar.
4.

Axmedova, D. "Bulutli hisoblash texnologiyalari va DBMS tizimlarining integratsiyasi."

Toshkent: Innovatsiya nashriyoti, 2021.
5.

Yusupov, N. "Ma’lumotlar bazalari va xavfsizlik muammolari." Texnika Fanlari


background image

35

Akademiyasi Ilmiy To‘plami, 2020, №7, 23-31-betlar.
6.

Sh, Mavlonov Sh, and F. B. Jurayeva. "ZAMONAVIY TEXNOLOGIYALAR YORDAMIDA

MINTAQALAR IQTISODIYOTINI RIVOJLANTIRISH." Экономика и социум 10 (125) (2024):
234-238.
7.

Aliqulov, Sh. "M. Yaxiyaxonova. Taʻlim samaradorligini oshirishda kreativ va zamonaviy

metodlarning ahamiyati. Raqamli ta’lim muhitida fanlararo integratsiyani Qoʻllashning ta’lim
samaradorligiga ta’siri: xalqaro Tajribalar va rivojlanish istiqbollari." (2024).
8.

ShukurulloFayzullo o‘g‘li, Aliqulov. "TA ‘LIMDA MULTIMEDIYA TEXNOLOGIYALARINI

QO‘LLASH." PEDAGOGS 50.2 (2024): 51-55.
9.

Shamsiddinov, G‘iyosjon, Barchin Ro‘ziqulova, and Laziza Inatillayeva. "BOSHLANG ‘ICH

TA’LIMDA AXBOROT TEXNOLOGIYALARIDAN FOYDALANISH USULLARI VA AFZALLIKLARI."
Педагогика и психология в современном мире: теоретические и практические
исследования 3.10 (2024): 39-41.
10.

Shamsiddinov, G‘iyosjon, Jasmina Murodulloyeva, and Umida Nurmaxmatova. "YASHIL

IQTISODIYOT VA YO ‘NALISHLARI BO ‘YICHA TA’LIM DASTURLARINI RIVOJLANTIRISH
MEXANIZMLARI." Models and methods in modern science 3.5 (2024): 44-49.
11.

Shamsiddinov, G‘iyosjon, and Temurbek Zarifov. "GLOBAL TARMOQ QURISHDA TARMOQ

QURILMALARIDAN FOYDALANISH VA TARMOQ TOPOLOGIYALARINING O’RNI." Science and
innovation in the education system 3.5 (2024): 50-60.
12.

Raxmatov Sherqo'zi Akbar Kodirov. “Ta'lim jarayonida bulutli texnalogiyalardan

foydalanishning samaradorligi” Pedagogis Internatsianal researcg ISSN:281-4027_SJIF:4.995.
2023/5/15

Библиографические ссылки

Karimov, F. "Axborot texnologiyalari va ma’lumotlar bazasi boshqaruvi." Toshkent: O‘zbekiston Milliy Ensiklopediyasi nashriyoti, 2020.

Qodirov, S. "Raqamli iqtisodiyotda katta ma’lumotlarning ahamiyati." Iqtisodiyot va Innovatsiya jurnali, 2021, №3, 45-56-betlar.

Tursunov, A. va Ahmedov, O. "NoSQL texnologiyalari va ularning qo‘llanilishi." Kompyuter Ilmlari va Muhandislik jurnali, 2022, №5, 34-42-betlar.

Axmedova, D. "Bulutli hisoblash texnologiyalari va DBMS tizimlarining integratsiyasi." Toshkent: Innovatsiya nashriyoti, 2021.

Yusupov, N. "Ma’lumotlar bazalari va xavfsizlik muammolari." Texnika Fanlari Akademiyasi Ilmiy To‘plami, 2020, №7, 23-31-betlar.

Sh, Mavlonov Sh, and F. B. Jurayeva. "ZAMONAVIY TEXNOLOGIYALAR YORDAMIDA MINTAQALAR IQTISODIYOTINI RIVOJLANTIRISH." Экономика и социум 10 (125) (2024): 234-238.

Aliqulov, Sh. "M. Yaxiyaxonova. Taʻlim samaradorligini oshirishda kreativ va zamonaviy metodlarning ahamiyati. Raqamli ta’lim muhitida fanlararo integratsiyani Qoʻllashning ta’lim samaradorligiga ta’siri: xalqaro Tajribalar va rivojlanish istiqbollari." (2024).

ShukurulloFayzullo o‘g‘li, Aliqulov. "TA ‘LIMDA MULTIMEDIYA TEXNOLOGIYALARINI QO‘LLASH." PEDAGOGS 50.2 (2024): 51-55.

Shamsiddinov, G‘iyosjon, Barchin Ro‘ziqulova, and Laziza Inatillayeva. "BOSHLANG ‘ICH TA’LIMDA AXBOROT TEXNOLOGIYALARIDAN FOYDALANISH USULLARI VA AFZALLIKLARI." Педагогика и психология в современном мире: теоретические и практические исследования 3.10 (2024): 39-41.

Shamsiddinov, G‘iyosjon, Jasmina Murodulloyeva, and Umida Nurmaxmatova. "YASHIL IQTISODIYOT VA YO ‘NALISHLARI BO ‘YICHA TA’LIM DASTURLARINI RIVOJLANTIRISH MEXANIZMLARI." Models and methods in modern science 3.5 (2024): 44-49.

Shamsiddinov, G‘iyosjon, and Temurbek Zarifov. "GLOBAL TARMOQ QURISHDA TARMOQ QURILMALARIDAN FOYDALANISH VA TARMOQ TOPOLOGIYALARINING O’RNI." Science and innovation in the education system 3.5 (2024): 50-60.

Raxmatov Sherqo'zi Akbar Kodirov. “Ta'lim jarayonida bulutli texnalogiyalardan foydalanishning samaradorligi” Pedagogis Internatsianal researcg ISSN:281-4027_SJIF:4.995. 2023/5/15