Авторы

  • Nigora Tursunova
    O‘zbekiston milliy universiteti Kompyuter lingvistikasi va amaliy tilshunoslik kafedrasi o‘qituvchisi

DOI:

https://doi.org/10.71337/inlibrary.uz.arims.67470

Ключевые слова:

semantik annotatsiya zamonaviy NLP modellar ontologiyalar ma’lumotlar tahlili metama’lumotlar

Аннотация

Bugungi kunda internetda mavjud bo‘lgan ma’lumotlarning ko‘lami va xilma-xilligi jadal sur’atlarda ortib bormoqda. Ushbu ma’lumotlarni samarali hamda  tushunarli ravishda boshqarish, qidirish va tahlil qilish uchun semantik annotatsiyalar muhim ahamiyat kasb etadi. Ushbu maqolada semantik annotatsiya nima ekanligi, uning afzalliklari, qo‘llanilishi va kelajakdagi istiqbollari haqida so‘z yuritiladi.


background image

ACADEMIC RESEARCH IN MODERN SCIENCE

International scientific-online conference

37

SEMANTIK ANNOTATSIYA XUSUSIDA AYRIM MULOHAZALAR

Tursunova Nigora Komil qizi

O‘zbekiston milliy universiteti Kompyuter lingvistikasi va

amaliy tilshunoslik kafedrasi o‘qituvchisi

https://doi.org/10.5281/zenodo.14877240

Annotatsiya.

Bugungi kunda internetda mavjud bo‘lgan ma’lumotlarning ko‘lami va

xilma-xilligi jadal sur’atlarda ortib bormoqda. Ushbu ma’lumotlarni samarali
hamda tushunarli ravishda boshqarish, qidirish va tahlil qilish uchun semantik
annotatsiyalar muhim ahamiyat kasb etadi. Ushbu maqolada semantik
annotatsiya nima ekanligi, uning afzalliklari, qo‘llanilishi va kelajakdagi
istiqbollari haqida so‘z yuritiladi.

Kalit so‘zlar:

semantik annotatsiya, zamonaviy NLP modellar,

ontologiyalar, ma’lumotlar tahlili, metama’lumotlar

Semantik annotatsiya mavjud ma’lumotlarga qo‘shimcha izoh berish

jarayonidir. Bunda tegishli tushunchalar (masalan, shaxslar, joylar, tashkilotlar,
mahsulotlar yoki mavzular) haqidagi ma’lumotlarga qo‘shimcha izoh yoki matn
beriladi. Semantik annotatsiyalar tegishli tushunchalar bilan hujjatlarni teglash
jarayonidir. Semantik annotatsiyalar orqali sun’iy va tabiiy til orasida yanada
samarali aloqa o‘rnatiladi.

Semantik annotatsiya, asosan, tabiiy tilni qayta ishlash, sun’iy intellekt va

ma’lumotlar bazalarida foydalaniladi. Semantik annotatsiya nafaqat matn
so‘zlarini, balki kontekstdagi ma’nosini ham izohlab berishi bilan xarakterlanadi.
Chunki bir xil so‘z turli kontekstlarda turlicha ma’zmunda kelishi mumkin.

Ma’lumotlar o‘rtasidagi bog‘liqlikni aniqlashda ontologiyadan foydalanamiz.

Ontologiyalar ma’lumotlarni tahlil qilish va o‘zaro bog‘lash imkonini beradi.
Antans Kiryakov, Borislav Popov, Ivan Terziev, Dimitar Manov, Damyan
Ognyanofflarning “Journal of Web Semantics” jurnalining 2004-yil, 1-dekabr, 1-
sonida bergan “Semantic annotation, indexing, and retrieval” (Semantik izoh,
indekslash va qidirish) nomli

maqola e’lon qilinadi. Maqola semantik izoh va

qidiruv texnologiyalarining zaruriyati va ularni amalga oshirishdagi muhim
masalalarni muhokama qiladi. Shuningdek, kelajakdagi ishlar ko‘lamini
kengaytirish va avtomatik tizimlarning samaradorligini oshirishga qaratilgan
gʻoyalar ilgari suriladi. Ushbu yondashuv bugungi kunda mavjud bo‘lgan matnga
asoslangan vebdan semantik internetga o‘tishni osonlashtiradi. Bu, asosan, katta
hajmdagi ma’lumotlarni avtomatik qayta ishlash va tushunishni talab qiladigan
sohalar uchun muhim ahamiyatga ega.


background image

ACADEMIC RESEARCH IN MODERN SCIENCE

International scientific-online conference

38

Yuqoridagilardan

ko‘rinib

turibdiki,

semantik

izohlar,

nafaqat,

ma’lumotlarni yanada chuqurroq o‘rganish imkonini beradi, balki sun’iy
intellekt va mashinani o‘rganish sohalarida mashina tilini tushunishda va
natijalarni yanada aniqroq chiqarishda muhimdir. Har bir soha vakillari uchun
ahamiyatlidir. Sababi hech bir sohani biz sun’iy intellekt va mashinalarsiz
tasavvur etolmayapmiz, semantik annotatsiyalar ularning ish faoliyatini
samaradorligini oshirishda va yaxshilanishida yaqindan yordam beradi.

Hozirda semantik annotatsiylangan korpuslar mavjud bo‘lib, ularning

o‘ziga xosligi o‘zaro farqlanadi:

FrameNet

: (Baker et al., 1998), Semantik freym ma’lumotlarni

kontekstual struktura asosida tahlil qiladi.

PropBank

: (Palmer et al., 2005.), Predikat-argument munosabatlarining

tuzilishlarini izohlaydi.

Penn Discourse TreeBank

:(Prasad et al., 2005) Diskursiv bog‘liqlik va

o‘zaro munosabatlarni izohlaydi.

Ushbu resurslarning barchasi tilning alohida asosiy semantik jihatlarini

izohlashga qaratilgan. Biroq, ular birgalikda ishlatilganda yoki birlashtirilganda
yagona tizimni ta’minlamaydi.

Bundan tashqari bu borada turli loyihalar ham olib borilmoqda, xususan,

Groningen Meaning Bank (GMB)

Groningen bilim markazi (CLCG) tadqiqotchilari —

Valerio Basile

,

Yohan Bos

,

Kilian Evang

, va

Noortje Venhuizenlar tomonidan loyiha olib borilmoqda

va

bu guruh

Groningen

(Niderlandiya)

universiteti

da faoliyat olib boradi. Ularning

tadqiqotlari katta semantik izohli korpuslarni yaratishga qaratilgan. Ushbu
loyiha tilni chuqur semantik tahlil qilib, turli darajalardagi semantik
ma’lumotlarni yagona tizimga birlashtirishni maqsad qilgan.

Loyiha quyidagi amallarni bajaradi:

Ingliz matnlarini chuqur semantik tahlil qiladi;

Sayoz semantik izohdan voz kechib, rasmiy va tizimli uslubni qo‘llaydi;

Turli semantik qatlamlarni birlashtirib, hodisalar va boshqa elementlarni

yagona tizimda taqdim etishni ko‘zlagan.

Xulosa o‘rnida shuni aytish mumkinki, semantik annotatsiya texnologiyasi

jadal rivojlanmoqda, zamonaviy NLP modellar, ontologiyalar, bilim grafiklari
izohlash jarayonini sezilarli darajada yaxshiladi. Xususan, amaliy qo‘llanmalar,
qidiruv tizimlari, tavsiya platformalari, tibbiyotda va ilmiy tadqiqotlarning
samaradorligini

oshirishda

foydalanilmoqda.

Biroq,

sifatli

metama’lumotlarning yetishmasligi, avtomatlashtirishdagi aniqlik cheklovlari
hamda standartlarning yo‘qligi texnologiyaning rivojlanishiga to‘siq bo‘lmoqda.


background image

ACADEMIC RESEARCH IN MODERN SCIENCE

International scientific-online conference

39

Biroq, ushbu ishlar rasmiy va taklif qiluvchi yechimlarni taqdim etmaydi,
shuningdek, qarorlarni avtomatlashtirish masalalariga ham to‘liq e’tibor
bermaydi.

Kelajakda semantik izohlar, moslashuvchan ontologiyalar va o‘z-o‘zini

rivojlantiruvchi tizimlarni yaratish orqali bu sohaning imkoniyatlarini yanada
kengaytirishiz mumkin.

Foydalanilgan adabiyotlar roʻyxati:

1.

Abdurakhmonova N, Urdishev K. Corpus based teaching Uzbek as a

foreign language. Journal of Foreign Language Teaching and Applied Linguistics
(JFLTAL). 2019;6(1-2019):131-7.
2.

Системная модель комплекса требований к автоматизированной

информационной системе на основе семантической аннотациитема
диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических
наук Яковлев, Николай Николаевич
3.

J.-D. Kim, T. Ohta, Y. Tateisi, J. Tsujii GENIA corpus—a semantically

annotated corpus for bio-textminingVol. 19 Suppl. 1 2003, pages i180–i182
DOI: 10.1093/bioinformatics/btg1023
4.

Harry Bunt TiCC . On the principles of interoperable semantic annotation,

Tilburg Center for Cognition and Communication Tilburg University, The
Netherlands harry.bunt@uvt.nl
5.

Harry Bunt TiCC . A methodology for designing semantic annotations,

Tilburg University. March 14, 2013
6.

https://www.sketchengine.eu/semcor-annotated-corpus/

7.

https://www.ontotext.com/knowledgehub/fundamentals/semantic-

annotation/

Библиографические ссылки

Abdurakhmonova N, Urdishev K. Corpus based teaching Uzbek as a foreign language. Journal of Foreign Language Teaching and Applied Linguistics (JFLTAL). 2019;6(1-2019):131-7.

Системная модель комплекса требований к автоматизированной информационной системе на основе семантической аннотациитема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Яковлев, Николай Николаевич

J.-D. Kim, T. Ohta, Y. Tateisi, J. Tsujii GENIA corpus—a semantically annotated corpus for bio-textminingVol. 19 Suppl. 1 2003, pages i180–i182 DOI: 10.1093/bioinformatics/btg1023

Harry Bunt TiCC . On the principles of interoperable semantic annotation, Tilburg Center for Cognition and Communication Tilburg University, The Netherlands harry.bunt@uvt.nl

Harry Bunt TiCC . A methodology for designing semantic annotations, Tilburg University. March 14, 2013