ACADEMIC RESEARCH IN MODERN SCIENCE
International scientific-online conference
37
SEMANTIK ANNOTATSIYA XUSUSIDA AYRIM MULOHAZALAR
Tursunova Nigora Komil qizi
O‘zbekiston milliy universiteti Kompyuter lingvistikasi va
amaliy tilshunoslik kafedrasi o‘qituvchisi
https://doi.org/10.5281/zenodo.14877240
Annotatsiya.
Bugungi kunda internetda mavjud bo‘lgan ma’lumotlarning ko‘lami va
xilma-xilligi jadal sur’atlarda ortib bormoqda. Ushbu ma’lumotlarni samarali
hamda tushunarli ravishda boshqarish, qidirish va tahlil qilish uchun semantik
annotatsiyalar muhim ahamiyat kasb etadi. Ushbu maqolada semantik
annotatsiya nima ekanligi, uning afzalliklari, qo‘llanilishi va kelajakdagi
istiqbollari haqida so‘z yuritiladi.
Kalit so‘zlar:
semantik annotatsiya, zamonaviy NLP modellar,
ontologiyalar, ma’lumotlar tahlili, metama’lumotlar
Semantik annotatsiya mavjud ma’lumotlarga qo‘shimcha izoh berish
jarayonidir. Bunda tegishli tushunchalar (masalan, shaxslar, joylar, tashkilotlar,
mahsulotlar yoki mavzular) haqidagi ma’lumotlarga qo‘shimcha izoh yoki matn
beriladi. Semantik annotatsiyalar tegishli tushunchalar bilan hujjatlarni teglash
jarayonidir. Semantik annotatsiyalar orqali sun’iy va tabiiy til orasida yanada
samarali aloqa o‘rnatiladi.
Semantik annotatsiya, asosan, tabiiy tilni qayta ishlash, sun’iy intellekt va
ma’lumotlar bazalarida foydalaniladi. Semantik annotatsiya nafaqat matn
so‘zlarini, balki kontekstdagi ma’nosini ham izohlab berishi bilan xarakterlanadi.
Chunki bir xil so‘z turli kontekstlarda turlicha ma’zmunda kelishi mumkin.
Ma’lumotlar o‘rtasidagi bog‘liqlikni aniqlashda ontologiyadan foydalanamiz.
Ontologiyalar ma’lumotlarni tahlil qilish va o‘zaro bog‘lash imkonini beradi.
Antans Kiryakov, Borislav Popov, Ivan Terziev, Dimitar Manov, Damyan
Ognyanofflarning “Journal of Web Semantics” jurnalining 2004-yil, 1-dekabr, 1-
sonida bergan “Semantic annotation, indexing, and retrieval” (Semantik izoh,
indekslash va qidirish) nomli
maqola e’lon qilinadi. Maqola semantik izoh va
qidiruv texnologiyalarining zaruriyati va ularni amalga oshirishdagi muhim
masalalarni muhokama qiladi. Shuningdek, kelajakdagi ishlar ko‘lamini
kengaytirish va avtomatik tizimlarning samaradorligini oshirishga qaratilgan
gʻoyalar ilgari suriladi. Ushbu yondashuv bugungi kunda mavjud bo‘lgan matnga
asoslangan vebdan semantik internetga o‘tishni osonlashtiradi. Bu, asosan, katta
hajmdagi ma’lumotlarni avtomatik qayta ishlash va tushunishni talab qiladigan
sohalar uchun muhim ahamiyatga ega.
ACADEMIC RESEARCH IN MODERN SCIENCE
International scientific-online conference
38
Yuqoridagilardan
ko‘rinib
turibdiki,
semantik
izohlar,
nafaqat,
ma’lumotlarni yanada chuqurroq o‘rganish imkonini beradi, balki sun’iy
intellekt va mashinani o‘rganish sohalarida mashina tilini tushunishda va
natijalarni yanada aniqroq chiqarishda muhimdir. Har bir soha vakillari uchun
ahamiyatlidir. Sababi hech bir sohani biz sun’iy intellekt va mashinalarsiz
tasavvur etolmayapmiz, semantik annotatsiyalar ularning ish faoliyatini
samaradorligini oshirishda va yaxshilanishida yaqindan yordam beradi.
Hozirda semantik annotatsiylangan korpuslar mavjud bo‘lib, ularning
o‘ziga xosligi o‘zaro farqlanadi:
FrameNet
: (Baker et al., 1998), Semantik freym ma’lumotlarni
kontekstual struktura asosida tahlil qiladi.
PropBank
: (Palmer et al., 2005.), Predikat-argument munosabatlarining
tuzilishlarini izohlaydi.
Penn Discourse TreeBank
:(Prasad et al., 2005) Diskursiv bog‘liqlik va
o‘zaro munosabatlarni izohlaydi.
Ushbu resurslarning barchasi tilning alohida asosiy semantik jihatlarini
izohlashga qaratilgan. Biroq, ular birgalikda ishlatilganda yoki birlashtirilganda
yagona tizimni ta’minlamaydi.
Bundan tashqari bu borada turli loyihalar ham olib borilmoqda, xususan,
Groningen Meaning Bank (GMB)
Groningen bilim markazi (CLCG) tadqiqotchilari —
Valerio Basile
,
Yohan Bos
,
Kilian Evang
, va
Noortje Venhuizenlar tomonidan loyiha olib borilmoqda
va
bu guruh
Groningen
(Niderlandiya)
universiteti
da faoliyat olib boradi. Ularning
tadqiqotlari katta semantik izohli korpuslarni yaratishga qaratilgan. Ushbu
loyiha tilni chuqur semantik tahlil qilib, turli darajalardagi semantik
ma’lumotlarni yagona tizimga birlashtirishni maqsad qilgan.
Loyiha quyidagi amallarni bajaradi:
Ingliz matnlarini chuqur semantik tahlil qiladi;
Sayoz semantik izohdan voz kechib, rasmiy va tizimli uslubni qo‘llaydi;
Turli semantik qatlamlarni birlashtirib, hodisalar va boshqa elementlarni
yagona tizimda taqdim etishni ko‘zlagan.
Xulosa o‘rnida shuni aytish mumkinki, semantik annotatsiya texnologiyasi
jadal rivojlanmoqda, zamonaviy NLP modellar, ontologiyalar, bilim grafiklari
izohlash jarayonini sezilarli darajada yaxshiladi. Xususan, amaliy qo‘llanmalar,
qidiruv tizimlari, tavsiya platformalari, tibbiyotda va ilmiy tadqiqotlarning
samaradorligini
oshirishda
foydalanilmoqda.
Biroq,
sifatli
metama’lumotlarning yetishmasligi, avtomatlashtirishdagi aniqlik cheklovlari
hamda standartlarning yo‘qligi texnologiyaning rivojlanishiga to‘siq bo‘lmoqda.
ACADEMIC RESEARCH IN MODERN SCIENCE
International scientific-online conference
39
Biroq, ushbu ishlar rasmiy va taklif qiluvchi yechimlarni taqdim etmaydi,
shuningdek, qarorlarni avtomatlashtirish masalalariga ham to‘liq e’tibor
bermaydi.
Kelajakda semantik izohlar, moslashuvchan ontologiyalar va o‘z-o‘zini
rivojlantiruvchi tizimlarni yaratish orqali bu sohaning imkoniyatlarini yanada
kengaytirishiz mumkin.
Foydalanilgan adabiyotlar roʻyxati:
1.
Abdurakhmonova N, Urdishev K. Corpus based teaching Uzbek as a
foreign language. Journal of Foreign Language Teaching and Applied Linguistics
(JFLTAL). 2019;6(1-2019):131-7.
2.
Системная модель комплекса требований к автоматизированной
информационной системе на основе семантической аннотациитема
диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических
наук Яковлев, Николай Николаевич
3.
J.-D. Kim, T. Ohta, Y. Tateisi, J. Tsujii GENIA corpus—a semantically
annotated corpus for bio-textminingVol. 19 Suppl. 1 2003, pages i180–i182
DOI: 10.1093/bioinformatics/btg1023
4.
Harry Bunt TiCC . On the principles of interoperable semantic annotation,
Tilburg Center for Cognition and Communication Tilburg University, The
Netherlands harry.bunt@uvt.nl
5.
Harry Bunt TiCC . A methodology for designing semantic annotations,
Tilburg University. March 14, 2013
6.
https://www.sketchengine.eu/semcor-annotated-corpus/
7.
https://www.ontotext.com/knowledgehub/fundamentals/semantic-
annotation/