INNOVATIVE RESEARCH IN SCIENCE
International scientific-online conference
5
O’ZBEK LUG’ATCHILIGI TARIXIDA SHAKLDOSH SO’ZLAR TAVSIFI
Murtazoyev G'olibjon Husen o'gli
Qarshi shahar 48-maktab ona tili va adabiyot fani oʻqituvchisi
https://doi.org/10.5281/zenodo.14053752
Annotatsiya.
Mazkur maqolada oʻzbek lug’atchiligi tarixida shakldosh
so’zlar tavsifi haqida fikr-mulohazalar bildirildi.
Kalit soʻzlar
: omonim, turkum, vazifa, shakl, til, leksik, analiz
Matnlarni avtomatik qayta ishlash bir necha bosqichga bo’linadi va ulardan
biri morfologik tahlil bosqichi hisoblanadi. Mazkur bosqichda har bir so’zga
morfologik tavsif beriladi: lemmasi (asosi), kelishigi, soni, darajasi, nisbati,
shaxsi va hk. Morfoanalizning so’zlarni morfologik teglash vazifasi
omonimshakllar bilan murakkablashadi. Ma’lumki, omonim so’zlar shakli bir xil,
ammo semantikasi turfa xil bo’lgan leksik birliklar hisoblanadi. Avtomatik qayta
ishlashda omonimlik hodisasi quyidagi birliklarda mavjud: 1. so’z omonimligi
shakldoshlik so’z asosida bo’ladi, ya’ni muayyan so’z bir so’z turkumi yoki bir
necha turkumga mansub ma’no beradi. Masalan: Avval birliklarni, keyin
o’nliklarni qo’shamiz. Modal:
Suv bor joyda hayot bor. Ruchkang bormi ?
ot
Kuch
birlikda
. Hisob so’z Bir necha bor taklif yubordim. ot Og’irlik birliklari .Til
birliklari ot Bor kimyoviy element. Fe’l Ishga bormoq . Maktabga bor moq .
Birinchi ustunda birlik so’zi bir so’z turkumi doirasida omonim hisoblanadi: 1)
o’ngacha bo’lgan butun son; grammatik ko’plik aksi (ot); 2) birlashish,
hamjihatlik (ot); 3) bir turdagi miqdorlarni o’zaro baholash uchun qabul
qilingan o’lchov; til qurilishiga xos termin (ot). Ikkinchi ustunda bor so’zi ikki xil
turkumga mansub shakldoshlikni yuzaga keltirgan: 1) mavjud (modal); 2)
marta, dafa, bora (hisob so’z) 2. Qo’shimcha omonimligi muayyan qo’shimcha
vazifasiga ko’ra qo’shimchalarning turli guruhiga mansub bo’ladi. Masalan: -ki
ko’chki, tepki, turtki (ot yasaydi) ustki, ichki, kechki (sifat yasaydi) - (i)ng uying,
kitobing, ishing (shakl yasaydi: sintaktik mun.shakli egalik qo’shimchasi)
ko’ring, boring, tayyyorlang (shakl yasaydi: sintaktik mun.shakli shaxs-son
qo’shimchasi) 3. Ibora omonimligi shakli, ya’ni tuzilishi bir xil, ammo
semantikasi turlicha bo’lgan frazeologik birliklar. qattiq shovqin soldi uyni
boshiga ko’tarmoq yuksak darajada izzat-hurmat qildi onasini boshiga
ko’tarmoq 4. Gap omonimligi muayyan gap ifoda maqsadi yoki mazmuniga ko’ra
farqlanadi. darak gap Ishni bajarmadim. so’roq gap Ishni bajarmadim?
Rus tilida
omonimlik turlarida so’zlarning turkumligi bo’yicha omonimlik, morfologik
omonimlik va leksik omonimlik farqlanadi. E’tiborli jihati shundaki so’zlarni
morfologik va leksik omonimligi bo’yicha guruhlanishi tabiiy tilni qayta
ishlashda muhim ahamiyat kasb etadi. Morfologik omonimlikda bir turkumga
INNOVATIVE RESEARCH IN SCIENCE
International scientific-online conference
6
mansub bo’lgan shakldosh so’zlar lemma (asosi)si turlicha, ammo muayyan
shakllaridagina omonimlikni yuzaga keltiruvchi so’zshakllar etiborga olinadi.
Masalan: lemmasi ter terim mening terim (-im egalik qo’shimchasi: I shaxs,
birlik) lemmasi terim terim hosil Leksik omonimlikda bir lemmaga mansub so’z
turli ma’nolarni beradi: ot bog’ to’dalab bog’langan holat Bog’lamoq, bog’lam.
Bir bog’ piyoz ot bog’ o’simlik va daraxtlar ko’p ekilgan joy bog’-rog’, bog’-
bo’ston; Uzumini ye, bog’ini surishtirma. Omonimshakllarning morfologik va
leksik guruhlanishi matnlarni qayta ishlovchi dasturiy ta’minot va tizimlarda
lemmatizatsiya va stemming jarayonlari uchun muhim sanaladi. Har ikki
texnologiya so’z yoki so’zshaklning asosini topishga yo’naltirilgan bo’lib,
Takidlash o’rinliki, omonimlik hodisasi avtomatik qayta ishlash jarayonida eng
dolzarb masala hisoblanadi. Shu bois NLPda omonimshakllarni aniqlash va
ularni tahlil qilish maxsus o’rganiladi, hatto bir necha usullar ham ishlab
chiqilgan.
Omonimlikni aniqlash metodlarining barchasi ikki guruhga bo’linadi: 1.
Qoidalarga asoslangan usullar. O’z navbatida, ular quyidagilarga bo’linadi: a)
Qoidalarni qo’lda kiritish usullari. b) Qoidalarni avtomatik ishlab chiqarish
usullari. 2. Statistikaga asoslangan usullar. Ushbu guruhlarning har birining
o’ziga xos afzalliklari va kamchiliklari mavjud. Bunday vaziyatlarda tez-tez sodir
bo’ladiganidek, ikkala guruhning xususiyatlarini (va afzalliklarini) bir usulda
birlashtirish avval erishilgan natijalarga qaraganda yaxshiroq natijani ko’rsatishi
mumkin. Bunday usul gibrid usuli deb nomlanadi. 1-sxema. Omonimlikni
aniqlash usullari. Mazkur usullarga tayananuvchi tizimlar o’z navbatida quyidagi
guruhni tashkil etadi: 1. Qo’lda yaratilgan qoidalarga asoslangan tizimlar. 2.
Ehtimoliy modellar asosida yaratilgan va tavsiflangan korpuslarga tayanadigan
tizimlar. 3. Ehtimollik modellari va qoidalarga asoslangan gibrid tizimlar.
Omonimiyani aniqlash uchun har bir so’zshaklni tasniflash kerak, ya’ni uning
lemmasi, so’z turkumi va bir tegga birlashuvchi morfologik xususiyatlar to’plami
bilan bog’lab qo’yiladi. Yashirin Markov modeli Baum L.E. va uning hamkasblari
tomonidan ishlab chiqilgan mazkur model omonimlikni aniqlashning statistik
metodi statistik jarayonda yuzaga keladigan barcha variantlar ehtimolligini
hisobga olishga yordam beradi. Masalan, ma’lum bir matnda ot turkumiga oid
so’zlar bog’lovchiga nisbatan tez-tez va ko’p uchrasa unda ayni kontekstda
mavjud omonim katta ehtimollik bilan bog’lovchi emas, ot turkumiga oid so’z
bo’ladi, keyingi ehtimollikda bog’lovchi sifatida hisobga olinadi. Kontekstni
tavsiflash uchun N-grammadan foydalaniladi. Ngramma matnlarga avtomatik
ishlov berishda keng qo’llaniladigan matematik hisob vositasidir. O’zbek
INNOVATIVE RESEARCH IN SCIENCE
International scientific-online conference
7
kompyuter lingvistikasida S.Rizayev harf birikmalarini bigramm,
trigramm
terminlari bilan ifodalagan. N-gramma so’zlar yoki teglar kabi N-identifikator
elementlarning ketmaketligini ifodalaydi. Ikki element ketma-ketligi bigramma,
uch element ketmaketligi esa trigramma, deyiladi. Masalan, old qo’shimcha+ot
holati bigrammaga misol bo’ladi.
Omonimlikni aniqlashning oddiy statistik
metodi va boshqa shu kabi metodlarning tavsifini keltirish uchun quyidagi
usullar ishlatiladi:
wi jumladagi i-o’rinda joylashgan so’z, ti ushbu so’zning
identifikatori (tegi).
D (w) = {t1 w ,t2 w ,tk w } w so’zining barcha mumkin
bo’lgan belgilar majmui. Ushbu malumotlarni morfologik lug’at yordamida olish
mumkin. Agar so’z lug’atda bo’lmasa uni Brill usulida bajarilganidek, ot so’z
turkumi sifatida hisoblash mumkin, ammo lingvistik ta’minot ishonchli bo’lishi
uchun barcha mumkin bo’lgan teglarni qo’yib chiqish kerak.
C korpusdagi
muayyan holatlar soni (n-gramm). Bunda C(t) t teglar soni; va C(t1,t2)
bigrammalar soni (t1,t2).
Ct(w,t) t tegli w so’zlar soni.
F(w,t) w so’zida t tegi
mavjudligi ehtimoli. Tavsiflar quyidagi formula bo’yicha hisoblanadi: P(ti|ti1) -
bu ti-1 tegidan keyin ti tegining kelish ehtimollik holati. Bunda i = 1 bo’lganda ti
tegi gapda birinchi teg hisoblanadi. Hisoblash formulasi quyidagicha: Yashirin
Markov modeliga asoslanib, omonimlikni aniqlashning statistik metodi
yordamida ishlash natijasida n uzunlikdagi jumlada Ti
∈
D(wi) bo‘lganda
T={T1,T2,...,Tn} teglarning ehtimoliy ketma-ketligi topiladi.
Xulosa qilib aytganda, dunyo kompyuter lingvistikasida omonimlikni bartaraf
etish usullari o‘rganilganida, bu xususdagi tajribadan foydalanib o‘zbekcha
matnlardagi so‘zshakllarning tegishli tekshirish formulasi yaratildi. Omonimlikni
bartaraf etish uchun har bir so‘zni “tasniflash” kerak, yaʼni uni lemma – gap
bo‘lagi va morfologik xususiyatlar majmui bilan taqqoslash mumkin, ular
qulaylik uchun bir tegga qo‘shiladi. Barcha mumkin bo’lgan teglarni o’rganish
uchun morfologik lug’atdagi so’zlarga tegishli havolalarni topish yoki MyStem
kabi morfologik analizatorni ishlatish yetarli bo’lib, u so’z teglarini topishda
yordam beradi. Shundan so’ng bir nechta teglar orasidan faqat tegishli tegni
tanlash kerak bo’ladi.
Omonim so’zshakllarni tahlil qilishda qo’llanilgan optimal
lingvistik usul matnlarni tahrir va tahlil qilish, mashina tarjimasi, matnlarni
qayta ishlash jarayonlarida muhim omil bo’ladi.
Foydalanilgan adabiyotlar ro’yxati:
1.Mengliyev B.M. Bahriddinova B.M. O’zbek tilining so’z tarkibi o’quv
lug’ati2007-2009.;
2.O.Shukurov, B.Boymatova O’zbek tilining ma'nodosh so’zlar o’quv lug’ati 2007-
2009.;
INNOVATIVE RESEARCH IN SCIENCE
International scientific-online conference
8
3.Mengliyev B.M. Bahriddinova B.M., Xoliyorov O’. O’zbek tilining so’z yasalishi
o’quv lug’ati 2008.;
4.To’rayeva U., Shodmonova D. O’zbek tilining zid ma'noli so’zlar o’quv lug’ati
2007-2009.;
5.Islomov I. Bobojonov Sh. O’zbek tilining so’zlar darajalanishi o’quv lug’ati
2007-2009.;
6.Xamrayeva Y. O’zbek tilining o’zlashma so’zlar o’quv lug’ati 2007-2009.;
Mengliyev B. Xudoyberdiyeva M. O’zbek tili iboralari o’quv lug’ati 2007-2009.;