Kompyuter lingvistikasi va korpus lingvistikasi muammolari matnni avtomatik qayta ishlash xususida

inLibrary
Google Scholar
Журнал:
Выпуск:
CC BY f
91-94
0
0
Поделиться
Тоирова, Г. (2022). Kompyuter lingvistikasi va korpus lingvistikasi muammolari matnni avtomatik qayta ishlash xususida. in Library, 22(2), 91–94. извлечено от https://inlibrary.uz/index.php/archive/article/view/30008
Гули Тоирова, Бухарский Государственный Университет
доцент, доктор филологических наук
Crossref
Сrossref
Scopus
Scopus

Аннотация

Oxirgi o‘n yilliklarda matnning avtomatik tahlil instrumentlarini ishlab chiqishda va matnni tabiiy tilida razmetka (belgilash) sohasiga oid yangiliklarda misli ko‘rilmagan darajada sifatli o‘zgarishlar yuz berdi [1,2,8,9]. Bu hodisani soha mutaxasisslari sifatiy sakrash deb baholashdi. Bu sakrash zamonaviy kompyuter lingvistikasi sohasida erishilgan yutuqlar, usullarni faol o‘zlashtirish va kompyuter fani hamda statistikasi, mashina o‘qiydigan matn ma’lumotlari hajmining eksponensial o‘sishi, shuningdek elektron lingvistik resurslarning rivojlanishi sababli yuz berdi. Lingvistik tahlilning zamonaviy instrumentlari matnning nafaqat grammatik (morfologik, sintaktik) xususiyatlarini, balki matnning ba’zi semantik va pragmatik xususiyatlarini ham avtomatik tarzda razmetka (belgilash)ga imkon berdi. Tabiiy tilni mashina to‘laqonli tushunishi, avvalgidek futurologiya sohasi zimmasiga qolyapti, ammo komyuter lingvistikasi texnologiyasi matn materiallarini tadqiq qilishning yangi imkoniyatlarini ochib berdi.

Похожие статьи


background image

91

3-

SHO‘BA.

KOMPYUTER LINGVISTIKASI VA KORPUS

LINGVISTIKASI MUAMMOLARI

MATNNI AVTOMATIK QAYTA ISHLASH XUSUSIDA

Toirova G.I.

BuxDU dotsenti, filologiya fanlari doktori


Oxirgi

o‘

n yilliklarda matnning avtomatik tahlil instrumentlarini ishlab

chiqishda va matnni tabiiy tilida razmetka (belgilash) sohasiga oid yangiliklarda
misli k

o‘

rilmagan darajada sifatli

o‘

zgarishlar yuz berdi [1,2,8,9]. Bu hodisani

soha mutaxasisslari sifatiy sakrash deb baholashdi. Bu sakrash zamonaviy
kompyuter lingvistikasi sohasida erishilgan yutuqlar, usullarni faol

o‘

zlashtirish va

kompyuter fani hamda statistikasi, mashina

o‘qiydigan matn ma’lumotlari

hajmining eksponensial

o‘

sishi, shuningdek elektron lingvistik resurslarning

rivojlanishi sababli yuz berdi. Lingvistik tahlilning zamonaviy instrumentlari
matnning nafaqat grammatik (morfologik, sintaktik) xususiyatlarini, balki

matnning ba’zi semantik v

a pragmatik xususiyatlarini ham avtomatik tarzda

razmetka (belgilash)ga imkon berdi. Tabiiy tilni mashina t

o‘

laqonli tushunishi,

avvalgidek futurologiya sohasi zimmasiga qolyapti, ammo komyuter lingvistikasi
texnologiyasi matn materiallarini tadqiq qilishning yangi imkoniyatlarini ochib
berdi.

Kompyuter lingvistikasining zamonaviy usullari q

o‘

llanilgan razmetka

(belgilash)larning avtomatlashtirilgan instrumentariysini ishlab chiqishdan va uni
miqdoriy tadqiqotlar uchun q

o‘

llashning namoyishidan iborat[7,8,9]. Mazkur

yondashuv, matn tilini avtomatik vositalar bilan va badiiy asarni filologik tadqiqot
vazifalari bilan tadqiq qilish imkoniyatlari orasida yuzaga keladigan yuqorida qayd
etilgan qiyinchiliklarni barataraf qilishga imkon yaratadi. Personajlar tizimini
miqdoriy tahlili uchun m

o‘

ljallanagan badiiy matning mashina

o‘

qiydigan

semantik razmetka (belgilash)lari, A.Navoiyning asarlari misolida semantik
razmetka ( belgilash)larni amalga oshirish mumkin. Shunday qilib, badiiy asarning
mazmuniy elementlarini tadqiq qilish uchun zamonaviy kompyuter lingvistikasi

instrumentlaridan va ma’lumotlarni statistik usulda tahlil qilishning imkoniyatlari

q

o‘

rsatib berilgan. Shu y

o‘sinda, yirik shakldagi nasriy yoki she’riy asarning

personajlar tizimining matndagi reprezentatsiyasi tadqiqot obyekti b

o‘

lib hizmat

qiladi. Personajlarning parametrik tavsiflari tadqiqotning predmeti b

o‘

lib xizmat

qilgan.

Asar personaji

bu, bir tomondan, soddalashtirilgan (sxematik, stereotipik

tarzda), va yoki

o‘

zining badiiy timsolida juda ham murakkab tuzilishga ega

b

o‘

lgan badiiy obraz, shaxsning k

o‘

lda yaratilgan modelidir. Shu bilan bir qatorda

eng murakkab badiiy obraz ham matnda aniq ketma-ketlikda tilga olinganda
vujudga keladi

Y

.V. Nedoshivina ning bu kabi funksional ta’rifini

taqqoslaymiz:

“Adabiy personaj –

bu, mohiyatan, bir matn chegarasida birta shaxsning paydo

b

o‘

lishining ketma-

ketlikdagi seriyasidir” [6]. Personajning matnga kirishlari turli

xil b

o‘

lishi mumkin: ismlarning variantlari (Farhod, Shirin, Majnun, Layli, Sulton

Husayn Boyqaro, Badiuzzamon), titullar va gonorotivlar (janobi oliylari), anaforik
eslanishlar (u), boshqa personajlarning nutqidagi murojaatlar (muhtaram zot, siz),


background image

92

rolli va vaziyatli tavsiflar (yosh yigit, kelayotgan kishi, yaralangan) va boshqalar.
Ammo

o‘

ta muhim b

o‘

lgan bu kabi kirishlar va shakllantiriladigan lingvistik

belgilar aniq chegaralarga ega (atoqli otlar, kishilik olmoshlari) va shuning uchun
ham ular kompyuter lingvistikasi vositalarida mavjud b

o‘

lgan razmetkalarga mos

tushadi. Shunday qilib, personaj badiiy asarning shunday elementi b

o‘

lib kiradiki,

u

o‘

zida badiiy murakkablik va

o‘

ta teranlik bilan matnda avtomatlashtirilgan

razmetka imkonini

o‘

zida mujassamlashtiradi.

“Personaj bir nechta sahifadan so‘

ng yana qayta paydo b

o‘

lish va

o‘

sib

borayotgan birlikka yana birta b

o‘g‘

in q

o‘

shish uchun y

o‘

qoladi,

o‘

zini

o‘

rnini

boshqalarga b

o‘

shatib beradi. Takrorlanuvchi, u yoki bu darajada barqaror belgilar

personajning xususiyatini tashkil etadi ” [6]. Matnda lingvistik nuqtai nazardan har

bir yangi kirish, uni

o‘

rab turgan kontekstning

o‘

ziga xosligiga va muvofiq

leksemalarning grammatik (s

o‘

z

o‘

zgartiruvchi) xususiyatlariga ishora qiluvchi bir

qator belgilari bilan tavsiflanishi mumkin. Bu personajlarning miqdoriy
tadqiqotlari uchun keng imkoniyatlar ochib beradi.

Badiiy asardagi personajlari nutq matnnini semantik razmetka (belgilash)ga

quyidagi usulini ishlab chiqish va uning aprobatsiyasini taklif etamiz: badiiy asar
personajlari tizimini modellashtirish; matnida personajlar q

o‘

llanilishini avtomatik

razmetka (belgilash); mavjud birta aniq personajning yagona koreferent zanjiriga
mukammal personaj identifikatori yordamida bo

g‘

langan.

Matnni avtomatik qayta ishlashning zamonaviy vositalari orqali ahamiyatli

ma’lumotlarni va badiiy asarlar personajlari tizimini semantik belgi shaklida

strukturalash uchun q

o‘

llanilishi mumkin.Tayyorlangan razmetkalar personajlar

tizimi tahlilini miqdoriy metodlar bilan amalga oshirishga imkon beradi
(takrorlanishlar tahlili, k

o‘

p omilli satistik tahlil, korrelyatsion tahlil, tarmoqli

tahlil). Razmetkalardan olingan ma’lumotlarni tahlil qilishning aniq usuli

ni

(metodini) tanlash, personajlarning aynan qaysi tizimi olingan modelda
q

o‘

llanilashga bo

g‘

liq b

o‘

ladi.

Qodiriyning “O‘tkan kunlar” romanidagi quyidagi parchaga e’tiborimizni

qaratsak:

Saroy ahli kunduzgi ish kunlaridan b

o‘

shab hujralariga qaytqanlar, ko

b

hujralar kechlik osh pishirish ila mash

g‘

ul, shuning uchun kunduzgiga qara

g‘

anda

saroy jonliq: kishilarning shaqillashib s

o‘

zlashishlari, xoxolab kulishishlari

saroyni k

o‘

kka k

o‘

targudek.

Abdulla Qodiriy “O‘tkan kunlar” asari matnini avtomatik

-semantik

razmetkalashda quyidagi modeldan foydalanadi:

t:nut.metonim: - nutqiy metonimiya

O‘zbek xalqining chin ma’noda o‘

ziga xos milliyligini aks ettiradigan mazkur

romanning ushbu parchasida metafora leksik-stilistik usuli kechlik osh pishirish ila
mash

g‘

ul, saroy jonliq, saroyni k

o‘

kka k

o‘

targudek kabi birliklarda metafora

q

o‘

llangan. Bu yerda xujralar, saroy s

o‘

zlari orqali odamlar, savdogarlar

ifodalanmoqda.

O

g‘

ir tabiatlik, ulu

g‘

g‘

avdalik, k

o‘

rkam va oq yuzlik, kelishgan, qora k

o‘

zlik,

mutanosib qora qoshliq va endigina murti sabz urgan bir yigit

Muallif mazkur

parchada romandagi bosh qahramonlardan biri Otabekni tasvirlashga harakat
qilgan. Bu yerda murti sabzi urgan tasviriy ifodasi orqali Otabekni

o‘

spirin bir


background image

93

yigit, yoshi yigirma-yigirma ikkilar atrofida ekanligini k

o‘

rsatib, badiiy

adabiyotning

o‘

ziga xos badiiy estetik qiymatini namoyon etmoqda.

t:nut.metonim: - murti sabz urgan

Qando

g‘

dir bir xayol ichida

o‘

ltur

g‘

uchi bu yigit Toshkandning mashhur

ayonlaridan b

o‘

l

g‘

an Yusufbek hojining

o‘g‘

li

Otabek.

t:nut.metonim: - xayol ichida

o‘

ltur

g‘

uchi

Bu yigit yaxshi

g‘

ina davlatmand b

o‘

lsa ham, lekin shuhrati nimauchundir

boyligi bilan b

o‘

lmay,

«Homid xotinboz» deb shuhratlangan, kishilar Homid

orqasidan s

o‘

zlashkanda uning oti

g‘

a taqil

g‘

an laqabni q

o‘

shib aytmasalar,

yol

g‘

iz

«Homidboy» deyish ila uni tanita olmaydilar

(aslida: u haqida gapirganda),

oti

g‘

a taqilgan (aslida: ismiga q

o‘

shib aytiladigan) s

o‘

z birikmalarida metafora

leksik-stilistik usul q

o‘

llagan. Romandagi salbiy qahramon b

o‘

lmish Homidga

berilgan ta’rifdan muallif badiiy tasviriy vosita, ya’ni metaforadan mohirona

foydalanish orqali yoritib bergan. Bu yerda

orqasidan s

o‘

zlashgan

t:nut.metonim: oti

g‘

a taqilgan

Manimcha, uylanishdek nozik bir ish dunyoda y

o‘

qdir,

dedi Rahmat va

Otabekka yuz

o‘

girdi.

Uylangach, xotining ta’bingga muvofiq kelsa bu juda

yaxshi; y

o‘

qsa, munchalik o

g‘

ir gap dunyoda

b

o‘lmaslanishdek nozik bir ish”

“kichik bir xato butun umrga tatigulik tashvishga aylanishi mumkin bo‘lgan amal”

kabi ma’nolarda qo‘llanilmoqda. “Og‘ir gap” birikmasi esa, yuqorida ta’kidlab

o‘tilgan “butun umrga tatigulik tashvish” ma’nosida qo‘

llanmoqda. Aslida ishning

nozigi b

o‘

lmagandek, gapning o

g‘

iri ham b

o‘

lmaydi. Bu yerda metaforik k

o‘

chma

ma’no orqali badii

y adabiyotning serjiloligi k

o‘

rsatib berilmoqda Ushbu matnda

metafora leksik-stilistik usuli uylanishdek nozik ish va o

g‘

ir gap birikmalarida

q

o‘

llangan.

t:nut.metonim: O

g‘

ir gap

Bir s

o‘

z bilan aytganda, metonimiya - bu inson bilimi va munosabatini toifaga

ajrata oladigan k

o‘

plab usullardan birini aks ettiradigan umumkognitiv jarayondir.

- Manimcha,

o‘

risning bizdan yuqoridali

g‘

i uning ittifoqidan b

o‘

lsa kerak, -

dedi Otabek, ammo bizning kundan-kunga orqa

g‘

a ketishimizga

o‘

zora nizoimiz

sabab b

o‘

lmoqda, deb

o‘

ylayman, boshqa xil aytkanda Ziyo amakining fikrlari

qisman t

o‘g‘

ri.

Ushbu parchada q

o‘

llanilgan

o‘

risning bizdan yuqoridali

g‘

i

birikmasida yuqori s

o‘

zi orqali ruslarning bizga qaraganda yuqori po

g‘

ona, yuqori

daraja, yuqori mavqeda ekanligi ma

’nolarida qo‘

llanilgan. Ushbu gapda

metonimiya s

o‘

zlardan birining tushib qolishi orqali

o‘z ma’nosini ifodalagan.

Razmetkalar, matnlarni TEI xalqaro kodlash formati asosida bajariladi[5,7].

Razmetkalar personajlarning identifikatsiya qilingan eslashlarini

o‘

z ichiga oladi,

shu jumladan anaforik ishoralar, adresat va адресантга personajning ko‘

chirma

gapidagi replikalarining bir ma’noli ishoralarini ham qamrab olish kerak bo‘

ladi.

Foydalanilgan adabiyotlar

1.

Абдурахмонова Н.З. Инглизча матнларни ўзбек тилига таржима қилиш

дастурининг

лингвистик

таъминоти

(содда

гаплар

мисолида):

Филол.фан.бўйича фалсафа доктори (PhD)…дис. афтореф. –

Тошкент, 2018.

2.

Абжалова М. Ўзбек тилидаги матнларни таҳрир ва таҳлил қилувчи

дастурнинг лингвистик модуллари

(расмий

ва илмий услубдаги матнлар


background image

94

таҳрири дастури учун)

:

Филол.фан.бўйича фалсафа доктори (PhD)…дис.–

Фарғона, 2019.–Б.22.

3.

Ванюшкин А. С.,

Гращенко Л. А.

Оценка алгоритмов извлечения

ключевых слов: инструментарий и ресурсы

// Новые информационные

технологии в автоматизированных системах.

2017.

№ 20.

С. 95–

102.

4.

Захаров В.П. Корпусная лингвистика: Учебно

-

метод. пособие. –

СПб.,

2005.

48 с.

MATN TAHRIRI VA MAHALLIY TAJRIBA:

“MUKAMMAL MAQOLA FORMULASI” HAMDA “OSh

-

MAQOLA”

METODI

Egamov N.

Qarshi DU

o‘

qituvchisi, jurnalist

“Amaliy filologiya” yo‘nalishining “Matn tahriri” fanida talabalarga

“Publitsistik matnlar tahlili va tahriri”, “Tahrir maktablari”, “Uslub va tahrir”,

“Korrektura va tahrir” singari mavzularni o‘

tishda mahalliy matbuot tajribalaridan

unumli foydalanish yaxshi samara beradi.

Bir necha yil mahalliy gazetalarda mas’ul kotib, muharrir sifatida faoliyat

yuritib, tahrir borasida t

o‘

plagan tajribam mazkur fan amaliy mash

g‘

ulotlarida

asqatmoqda.

Qashqadaryo viloyati hokimligi va xalq deputatlari viloyat kengashi

muassisligidagi “Qashqadaryo” gazetasi tahririyati –

xalqaro “Oltin qalam” tanlovi

Bosh Milliy mukofotiga birinchilardan b

o‘

lib sazovor b

o‘

lgan katta ijodiy maktab.

Bu yerda

o‘

ziga xos tahrir maktabi yaratilgan, desak, mubola

g‘

a b

o‘

lmaydi. Ayni

paytda viloyatimiz va poytaxtdagi nufuzli nashrlar hamda telekanallarda ishlab
yurgan taniqli jurnalist va muharrirlarning k

o‘pchiligi mana shu “qozonda

qaynagan”. Mazkur tahririyatda 20 yilga yaqin vaqt davomida muxbir, bo‘

lim

muharriri va mas’ul kotib sifatida faoliyat yuritib, tahrir

k

o‘

nikmalariga

bosqichma-bosqich erishib borganman.

Gazeta bosh muharririning

o‘

rinbosari,

O‘

zbekistonda xizmat k

o‘

rsatgan

jurnalist Botir Temirov

mana shu maktabning usta tahrirchilaridan. Tahririyat

qoshida bir necha yil faoliyat yuritgan “Jurnalistik mahorat maktabi”

da B.Temirov

bilan birga yoshlarga dars berib yurgan kezlarimizda u “MMF” degan formula

kashf qilgandi. “Mukammal maqola formulasi” deb ataladigan bu soddagina metod

semiz-semiz nazariy kitoblardagi uzundan uzoq qoidalardan farqli

o‘

laroq sohaga

havasmand yoshlarga saboq berishda bizga juda q

o‘

l kelgan.

B.Temirov “Mukammal maqola formulasi”ni quyidagi tarzda ifodalagan:

MMF=DSV+VEF+ETS+JT+JP…

Mazkur formuladagi shartli belgilarni birma-bir izohlashdan avval yana bir

fikrni qayd etmoqchiman. Biz tajribali jurnalist va tahrirchi hamkasbimizning
fikrlariga q

o‘

shilgan holda xuddi shu formulaga uy

g‘

un tarzda mukammal maqola

matnini tuzishni osh tayyorlashga qiyoslagan holda tushuntirishni taklif qilamiz.

Ya’ni, palov tayyorlash retsepti deyarli hammagan yaxshi ma’lum:

OSh=GURUCh+SABZI+G

O‘

ShT+Yo

G‘

+TUZ VA ZIRAVORLAR

Xuddi shu retseptni maqola matnini tuzishga qiyoslagan holda mavzuni

Библиографические ссылки

Абдурахмонова Н.З. Инглизча матнларни ўзбек тилига таржима қилиш дастурининг лингвистик таъминоти (содда гаплар мисолида): Филол.фан.бўйича фалсафа доктори (PhD)…дис. афтореф. – Тошкент, 2018.

Абжалова М. Ўзбек тилидаги матнларни таҳрир ва таҳлил қилувчи дастурнинг лингвистик модуллари (расмий ва илмий услубдаги матнлар таҳрири дастури учун): Филол.фан.бўйича фалсафа доктори (PhD)…дис.–Фарғона, 2019.–Б.22.

Ванюшкин А. С., Гращенко Л. А. Оценка алгоритмов извлечения ключевых слов: инструментарий и ресурсы // Новые информационные технологии в автоматизированных системах. – 2017. – № 20. – С. 95–102.

Захаров В.П. Корпусная лингвистика: Учебно-метод. пособие. – СПб., 2005. – 48 с.

inLibrary — это научная электронная библиотека inConference - научно-практические конференции inScience - Журнал Общество и инновации UACD - Антикоррупционный дайджест Узбекистана UZDA - Ассоциации стоматологов Узбекистана АСТ - Архитектура, строительство, транспорт Open Journal System - Престиж вашего журнала в международных базах данных inDesigner - Разработка сайта - создание сайтов под ключ в веб студии Iqtisodiy taraqqiyot va tahlil - ilmiy elektron jurnali yuridik va jismoniy shaxslarning in-Academy - Innovative Academy RSC MENC LEGIS - Адвокатское бюро SPORT-SCIENCE - Актуальные проблемы спортивной науки GLOTEC - Внедрение цифровых технологий в организации MuviPoisk - Смотрите фильмы онлайн, большая коллекция, новинки кинопроката Megatorg - Доска объявлений Megatorg.net: сайт бесплатных частных объявлений Skinormil - Космецевтика активного действия Pils - Мультибрендовый онлайн шоп METAMED - Фармацевтическая компания с полным спектром услуг Dexaflu - от симптомов гриппа и простуды SMARTY - Увеличение продаж вашей компании ELECARS - Электромобили в Ташкенте, Узбекистане CHINA MOTORS - Купи автомобиль своей мечты! PROKAT24 - Прокат и аренда строительных инструментов