Авторы

  • Nargiza Xamidova
    O‘zDJTU Roman-german tillari tarjimashunosligi kafedrasi katta o‘qituvchisi

DOI:

https://doi.org/10.71337/inlibrary.uz.zdit.105163

Ключевые слова:

korpus lingvistikasi empirik tahlil kompyuter lingvistikasi parallel korpus tilshunoslikda texnologiyalar til materiallari tahlili.

Аннотация

Ushbu maqolada korpus lingvistikasi zamonaviy tilshunoslikdagi yangi va istiqbolli yo‘nalish sifatida yoritilgan. Korpuslar asosida til materiallarini empirik jihatdan tahlil qilish imkoniyati va dasturiy vositalarning roli ko‘rsatib o‘tilgan.


background image

123

KORPUS LINGVISTIKASI: ZAMONAVIY TILSHUNOSLIKDA YANGI

YONDASHUV

Xamidova Nargiza Yusufovna

O‘zDJTU Roman-german tillari tarjimashunosligi kafedrasi katta o‘qituvchisi

nargiza7480@gmail.com

https://doi.org/10.5281/zenodo.15637396

Ushbu maqolada korpus lingvistikasi zamonaviy tilshunoslikdagi yangi va istiqbolli

yo‘nalish sifatida yoritilgan. Korpuslar asosida til materiallarini empirik jihatdan tahlil qilish
imkoniyati va dasturiy vositalarning roli ko‘rsatib o‘tilgan.

В статье рассматривается корпусная лингвистика как перспективное направление

современной лингвистики. Описаны возможности эмпирического анализа языкового
материала с помощью корпусов и соответствующего программного обеспечения.

This article explores corpus linguistics as an emerging and promising field in modern

linguistics. It highlights the empirical analysis of language data through corpora and specialized
software tools.

Kalit so‘zlar:

korpus lingvistikasi, empirik tahlil, kompyuter lingvistikasi, parallel korpus,

tilshunoslikda texnologiyalar, til materiallari tahlili.


Hozirgi zamon axborot texnologiyalari yuksak sur’atlar bilan rivojlanib, inson

faoliyatining barcha jabhalariga tobora chuqurroq kirib bormoqda. Ta’lim, sog‘liqni saqlash,
sanoat, madaniyat kabi sohalarda raqamli texnologiyalar keng qo‘llanilayotgani singari,
tilshunoslik sohasi ham bu jarayondan chetda qolmayapti. Ayniqsa, kompyuter yordamida til
materiallarini tizimli o‘rganish, ularni tahlil qilish va xulosalash imkonini beradigan korpus
lingvistikasi so‘nggi yillarda tilshunoslar e’tiborini tobora ko‘proq tortmoqda. Bu yo‘nalish
zamonaviy lingvistikaning muhim va istiqbolli sohalaridan biriga aylanib bormoqda.

Korpus lingvistikasi – bu tilni empirik, ya’ni faktlarga asoslangan holda o‘rganishga imkon

beruvchi ilmiy yo‘nalish bo‘lib, u real hayotda ishlatilgan matnlar asosida tahlil olib boradi.
“Korpus” tushunchasi ostida, odatda, raqamlashtirilgan va kompyuterda saqlanadigan, maxsus
algoritmlar asosida tuzilgan katta hajmdagi matnlar majmuasi tushuniladi. Bunday matnlar
to‘plami lingvistik tadqiqotlar uchun asosiy manba vazifasini bajaradi. Korpus lingvistikasi,
an’anaviy tilshunoslikdan farqli o‘laroq, shaxsiy taxmin yoki sezgi asosida emas, balki
kuzatilgan til hodisalari va statistik tahlillarga asoslanadi. Bu esa ilmiy izlanishlarning
ishonchliligini oshiradi.

Bugungi kunda turli turdagi korpuslar ishlab chiqilmoqda. Ulardan ba’zilari umumiy til

korpuslari bo‘lib, ular har xil mavzudagi va uslubdagi matnlarni o‘z ichiga oladi. Boshqalari esa
ma’lum soha yoki maqsad uchun mo‘ljallangan ixtisoslashgan korpuslardir. Bundan tashqari,
ko‘p tilli va parallel korpuslar ham mavjud bo‘lib, ular turli tillarda yozilgan matnlar orasidagi
tarjima va semantik munosabatlarni o‘rganishga xizmat qiladi. Korpuslar, shuningdek,
teglangan (grammatik va semantik belgilangan) yoki teglanmagan bo‘lishi mumkin. Har bir
korpus o‘zining tuzilishi, hajmi, til birliklarining turlari va ularni qayta ishlash darajasiga ko‘ra
bir-biridan farq qiladi.

Korpus lingvistikasi bir qancha muhim ustunliklarga ega. Eng avvalo, u empirik

yondashuvga asoslanadi, ya’ni nazariy mulohazalardan ko‘ra, mavjud ma’lumotlarga tayanadi.
Bu esa obyektivlikni ta’minlaydi. Ikkinchidan, korpus yordamida til materiallari ustida tezkor,


background image

124

aniq va katta hajmda ishlash imkoniyati tug‘iladi. Uchinchidan, bitta korpus asosida bir necha
bor tahlil olib borish, natijalarni solishtirish va tekshirish imkoniyati mavjud, bu esa ilmiy
tadqiqotlar sifatini oshiradi.

Korpus bilan ishlash uchun zamonaviy dasturiy vositalar ishlab chiqilgan. Ulardan eng

mashhurlari: AntConc, Sketch Engine, NLTK (Natural Language Toolkit) va Corpus Workbench
hisoblanadi. Bu dasturlar orqali korpusdagi so‘zlarni qidirish, ularning chastotasini aniqlash,
kontekstda qo‘llanishini tahlil qilish, lemmatizatsiya va grammatik teglash kabi jarayonlarni
bajarish mumkin. Ayniqsa, morfologik jihatdan boy tillarda (masalan, o‘zbek yoki rus tilida) bu
dasturlar katta foyda keltiradi.

Korpus lingvistikasi keng ko‘lamli amaliy sohalarda qo‘llaniladi. Jumladan, tarjima

nazariyasi va amaliyotida, leksikografiyada (lug‘at tuzishda), xorijiy tillarni o‘qitishda, til tarixi
va stilistika tadqiqotlarida korpuslar muhim ahamiyat kasb etadi. Masalan, tarjimon korpus
yordamida biror so‘zning tarjimada qanday qo‘llanganini aniqlay oladi. Leksikograf esa real
matnlarda so‘zning ma’nolarini, qo‘llanilish chastotasini tahlil qilish orqali lug‘at uchun aniq va
to‘g‘ri definitsiyalar ishlab chiqadi.

O‘zbek tilshunosligida korpus lingvistikasi hali to‘liq shakllanmagan bo‘lsa-da, bu borada

sezilarli yutuqlarga erishilmoqda. Ayniqsa, O‘zbek Milliy Korpusi loyihasining ishga tushirilishi
o‘zbek tilini zamonaviy uslubda o‘rganish, tahlil qilish va ta’lim jarayonlariga integratsiya qilish
yo‘lida muhim qadamlardan biri bo‘ldi. Mazkur korpusga borgan sari yangi matnlar
qo‘shilmoqda, tizimi takomillashmoqda va foydalanuvchilar soni ortmoqda.

Xulosa qilib aytganda, korpus lingvistikasi bugungi kunda nafaqat ilmiy izlanishlar, balki

amaliy faoliyat uchun ham dolzarb yo‘nalish hisoblanadi. Bu soha tilni chuqur, aniq va
zamonaviy texnologiyalar yordamida o‘rganishga imkon beradi. Ayniqsa, sun’iy intellekt va
mashina tarjimasi rivojlanayotgan davrda korpuslar orqali til hodisalarini avtomatlashtirish va
modellashtirish imkoniyatlari kengaymoqda. Shu boisdan, korpus lingvistikasi kelajakda
tilshunoslikning asosiy tarmoqlaridan biriga aylanishi mumkin.

References:

Используемая литература:

Foydalanilgan adabiyotlar:

1.

McEnery, T., & Hardie, A. (2012). Corpus Linguistics: Method, Theory and Practice.

Cambridge University Press.
2.

Biber, D., Conrad, S., & Reppen, R. (1998). Corpus Linguistics: Investigating Language

Structure and Use. Cambridge University Press.
3.

Leech, G. (1992). Corpora and theories of linguistic performance. In Directions in Corpus

Linguistics.
4.

O‘zbek tilining milliy korpusi loyihasi. www.corpus.uz

Библиографические ссылки

McEnery, T., & Hardie, A. (2012). Corpus Linguistics: Method, Theory and Practice. Cambridge University Press.

Biber, D., Conrad, S., & Reppen, R. (1998). Corpus Linguistics: Investigating Language Structure and Use. Cambridge University Press.

Leech, G. (1992). Corpora and theories of linguistic performance. In Directions in Corpus Linguistics.

O‘zbek tilining milliy korpusi loyihasi. www.corpus.uz