YOSH OLIMLAR
ILMIY-AMALIY KONFERENSIYASI
in-academy.uz/index.php/yo
61
MATNLARNI TAHRIR VA TAHLIL QILISHDAGI AVTOMATIK LINGVOTIZIM
VA TEXNOLOGIYALAR
Sobirova Nazira G‘anijon qizi
Alisher Navoiy nomidagi Toshkent davlat o'zbek tili va adabiyoti universitet
1-bosqich tayanch doktoranti
Sobirova Zarnigor G‘anijon qizi
Shayxontohur TIM ona tili va adabiyoti o`qituvchisi
https://doi.org/10.5281/zenodo.13879674
Annotatsiya:
Til va matn muammolari bilan bog
‘
liq masalalar kompyuter
texnologiyalari yordamida XX asrning 50-yillaridan boshlab hal qilina boshladi.
Tilshunoslikda avtomatik tahlil va tahrir qilish yo‘nalishidagi morfoanalizator, parsing,
spellchecker tizimlarning lingvistik ta’minoti dunyo bo`ylab ishlab chiqildi. Ular tezkorligi,
vaqtni tejashi, qulayligi hamda avtomatik tarjima sifatini oshirishda muhim ahamiyat kasb
etadi. Ushbu maqolada imlo tekshiruvchi, morfologik, sintaktik tahlil qiluvchi tizimlar, ularni
tashkil qiluvchi tarkibiy qismlar haqida ma’lumot berildi.
Kalit so`zlar:
avtomatik tahrir, morfoanalizator, parser, avtokorrektor/orfokorrektor,
lemmatizatsiya, tokenizatsiya,stemming
Yozish - bu odamlar o‘z fikrlarini bildirishlari mumkin bo‘lgan asosiy va hayotiy aloqa
usullaridan biridir. Ayniqsa, hozirgi kompyuter texnologiyalari asrida ma’lumotlarni tez
qidirish, uzatish, va ularni tahlil qilish juda muhim jarayondir. Innovatsion yangiliklar
hayotimizni zabt etmoqda desak hech ham mubolag`a bo`lmaydi. Bugun yaratilgan yangilik
ertaga o‘z o‘rnini o‘zidan ham mukammlarog`iga bo`shatib bermoqda.
Matnlarga ishlov berishning avtomatik tahrir yo‘nalishi XX asrning 60-yillariga kelib
shakllandi. U matn muharrir dasturlari bilan birgalikda yangicha imkoniyatlar asosida
rivojlanmoqda. Oddiy muharrirlardan farqi shundaki, unda tahrir avtomatik tarzda qisqa vaqt
ichida katta hajmli matnlar tez tekshirilib, xatolarni samarali to‘g‘rilash imkoniyatlari bo‘ladi.
Avtomatik tahrirning pragmatik jihati shundaki, u kelajakda taraqqiy etsa, yetarli
ma’lumotlar bazasi yaratilsa va maxsus dasturlar ishlab chiqilsa, muharrir kasbi uchun ehtiyoj
qolmaydi. Bu esa matn bilan ishlashni osonlashtiradi
.
1
Kompyuter dasturi 2 ta’minoti asosida ishlaydi:
a)
texnik;
b)
lingvistik
Ushbu qismlar o‘zaro bir-biriga bog’liq holatda ishlaydi.
Lingvistik ta’minot
lingvistik protsessor
deb ham ataladi. U mustaqil tarkibiy qismlarga
ega, bir nechta lingvistik modullardan tashkil topgan.
Kompyuter lingvistikasida
lingvistik modul
termini bugungi kunda muhim ahamiyat
kasb etmoqda. Boisi tabiiy tilning kompyuter tiliga o‘tkazilishi, ya’ni kompyuter tizimi orqali
matnga ishlov berish yo‘llarining yaratilishi kuzatilmoqda. Buning uchun chet tillarning
lingvistik dasturlari ishlab chiqilgan va bugungi kunda ular takomillashtirilmoqda .
2
1
Rahimov A. Kompyuter lingvistikasi asoslari. – Toshkent, 2011. – В. 98.
2
Abjalova M.A. Tahrir va tahlil dasturlarining lingvistik modullari /monografiya / Toshkent: Nodirabegim, 2020. – 176
b.
YOSH OLIMLAR
ILMIY-AMALIY KONFERENSIYASI
in-academy.uz/index.php/yo
62
Lingvistik modul ana shunday lingvistik dasturlarning
mustaqil tarkibiy qismlari
3
dir.
Kompyuter orqali matnni analiz qilish bosqichlari:
3
Демьянков В.З. Когнитивная лингвистика как разновидность интерпретирующего подхода //
Вопросы языкознания. – Москва, 1994. – № 4. – С. 22.
LEKSIK
GRAFEMATIK
ORFOGRAFIK
MORFOLOGIK
SINTAKTIK
LINGVISTIK
TA'MINOT
grafematik
modulda
ramzlar,
tinish belgilar,
harfiy va
boshqa
belgilar tahrir
qilinadi
sintaktik
modulda
supersintakti
k birlik
morfologik
modulda
so‘zshakllar
analizi va
ssintezi
orfografik
modulda imlo
qoidalari
Leksik
modulda
lug‘at qatlami
qamrab
olinadi.
MODUL TURLARI
YOSH OLIMLAR
ILMIY-AMALIY KONFERENSIYASI
in-academy.uz/index.php/yo
63
Matnni normallashtirish jarayoni morfologik analizga bog`liq.
Xulosa qilib aytganda, bugungi globallashuv davrida barcha imkoniyatlardan unumli
foydalanish darkor. Dunyoning samarali lingvotizim va texnologiyalari andozasini o‘zbek tili
uchun ham tatbiq qilish kerak. O‘zbek tilining barcha nozik qirralarini qamrab olgan holda
lingvistik ta’minotini mukammal yaratish shart. Lingvistik ta’minot qanchalik to‘liq,
mukammal qilib ishlab chiqilsa, kelgusida yaratiladigan lingvistik dasturlar shunchalik aniq
natijada ishlaydi.
semantik
sintaktik
morfologik
grafematik
fonetik
morfologik analiz jarayoni
bosqichlari
•
Tokenizatsiya
Matndagi so‘z shakllarini aniqlash jarayoni,
kiritilayotgan belgilar, ramzlar va so‘zlarni ajratib
chiqish jarayoni
•
Lemmatizatsiya
So‘zlarning lug`atdagi ifodasini aniqlash, lemmaga
keltirish jarayoni
•
Stemmizatsiya
kiritilgan so‘zning o`zagini topish jarayoni, affiksal
morfemalarni kesib chiqish texnologiyasi
YOSH OLIMLAR
ILMIY-AMALIY KONFERENSIYASI
in-academy.uz/index.php/yo
64
References:
1.
Abjalova M.A. Tahrir va tahlil dasturlarining lingvistik modullari /monografiya /
Toshkent: Nodirabegim, 2020. – 176 b.
2.
ХАМРОЕВА
ШАҲЛО
ЎЗБЕК
ТИЛИ
МОРФОЛОГИК
АНАЛИЗАТОРИНИНГ
ЛИНГВИСТИК ТАЪМИНОТИ
: филол.фан. доктори (DSc)…дис. автореф. – Фаргона, 2021.–
76б.
3.
Rahimov A. Kompyuter lingvistikasi asoslari. -Toshkent, 2011.
4.
Po‘latov A., Muhamedova S. Kompyuter lingvistikasi.-Toshkent, 2007