ON CORPUS LINGUISTICS AND THE NATIONAL CORPUS

HAC
Google Scholar
Branch of knowledge
To share
Abduvohidov, B., & Abdualimova, G. (2023). ON CORPUS LINGUISTICS AND THE NATIONAL CORPUS. Modern Science and Research, 2(12), 883–885. Retrieved from https://inlibrary.uz/index.php/science-research/article/view/27264
Crossref
Сrossref
Scopus
Scopus

Abstract

Mazkur maqolada korpus lingvistikasining shakllanishi va taraqqiyoti, asosiy tushuncha va masalalar, korpuslarni tuzish, korpuslarning lingvistik bazasini shakllantirish talablari, o‘zbek tilining ta’limiy korpusi, korpus lingvistikasini rivojlanish bosqichlari, olimlarimizni korpus lingvistikasi uchun qo'shgan hissalari, milliy korpusning xususiyatlari haqida ma’lumotar berilgan.

Similar Articles


background image

ISSN:

2181-3906

2023

International scientific journal

«MODERN SCIENCE АND RESEARCH»

VOLUME 2 / ISSUE 12 / UIF:8.2 / MODERNSCIENCE.UZ

883

KORPUS LINGVISTIKASI VA MILLIY KORPUS HAQIDA

Abduvohidov Behruz

Termiz davlat universiteti

O’zbek filologiyasi fakulteti 3-bosqich 421-guruh talabasi.

Abdualimova G.H.

Ilmiy rahbar.

https://doi.org/10.5281/zenodo.10407029

Annotatsiya.

Mazkur maqolada korpus lingvistikasining shakllanishi va taraqqiyoti,

asosiy tushuncha va masalalar, korpuslarni tuzish, korpuslarning lingvistik bazasini
shakllantirish talablari, o‘zbek tilining ta’limiy korpusi, korpus lingvistikasini rivojlanish
bosqichlari, olimlarimizni korpus lingvistikasi uchun qo'shgan hissalari, milliy korpusning
xususiyatlari haqida ma’lumotar berilgan.

Kalit so’zlar:

Korpus, korpus lingvistikasi, milliy korpus, poetik matnlar korpusi, ta’limiy

korpus, muallifllik korpusi.

ON CORPUS LINGUISTICS AND THE NATIONAL CORPUS

Abstract.

In this article, the formation and development of corpus linguistics, the main

concepts and issues, the creation of corpora, the requirements for the formation of the linguistic
base of corpora, the educational corpus of the Uzbek language, the stages of development of
corpus linguistics, the contributions of our scientists to corpus linguistics, the characteristics of
the national corpus reported.

Key words:

corpus, corpus linguistics, national corpus, corpus of poetic texts, educational

corpus, corpus of authorship.

О КОРПУСНОЙ ЛИНГВИСТИКЕ И НАЦИОНАЛЬНОМ КОРПУСЕ

Аннотация.

В данной статье рассматриваются становление и развитие

корпусной лингвистики, основные понятия и вопросы, создание корпусов, требования к
формированию языковой базы корпусов, учебного корпуса узбекского языка, этапы
развития корпусная лингвистика, представлен вклад наших ученых в корпусную
лингвистику, дана характеристика национальной корпусной информации.

Ключевые слова:

корпус, корпус лингвистики, национальный корпус, корпус

поэтических текстов, учебный корпус, корпус авторства.

Kirish.

Bugungi kunda yurtimizda o ‘zbek tiliga qaratilayotgan e’tibor nihoyatda katta. Bu esa

tilshunoslarimiz, shuning bilan birga informatiklarimizning oldiga yana bir muhim vazifani
qo‘yadi-ki, u ham bo‘lsa o‘zbek tilining korpus lingvistikasini yaratishdir. Bugungi kunda dunyo
tillari bo‘lmish rus, ingliz, ispan, arab tili kabi barcha tillarda mavjud bo‘lgan ushbu baza bizning
tilshunosligimizda ham bor bo ‘lishini kutib turgan asosiy masaladir.

Korpus lingvistikasi tilshunoslik kompyuter texnologiyalaridan foydalangan holda

lingvistik maʼlumotlar korpusidan foydalanish hamda ularni yaratishning umumiy prinsiplarini
ishlab chiqarish bilan shugʼullanadi. Leksikaning korpus tavsifi leksikografiyada eng ko‘p
qo‘llaniladi. Deyarli barcha zamonaviy ingliz lugʼatlar korpuslar asosida yaratilgan. Korpus tilda


background image

ISSN:

2181-3906

2023

International scientific journal

«MODERN SCIENCE АND RESEARCH»

VOLUME 2 / ISSUE 12 / UIF:8.2 / MODERNSCIENCE.UZ

884

so ‘zlar to ‘plamini ishonchli tarzda aniqlashga yordam beradi, yangi so‘z shakllarining paydo
bo‘lishini ko‘rsatadi, bir so‘zning turli maʼnolari va uning chastotasini aniqlash uchun ishlatiladi.

Korpus haqidab so’z borar ekan, uning rivojlanishi zaminida tilshunos olimlarga

berayotgan nafi juda kata. Jumladan tillarni saqlab qolish, uni keying avlodga to’la to’kis
yetkazish, tabiiy tilning morfologik xususiyatlarini saqlab qolish va hokozolarni korpusni
vazifalari qilib ko’satsak bo’ladi. Jahonnni yetakchi mamlakatlarida korpus lingvistikasi ustida
qilinayotgan ularning Milliy korpusini boyitmoqda.

Korpus termini qo‘llanilganda doim Milliy korpus birikmasi ishlatiladi. Milliy korpus –

ma’lum bir tilning muayyan bir bosqichini ifodalaydigan barcha janrlar, uslublar, ijtimoiy hamda
hududiy lahjalar va boshqalarda aks ettiruvchi elektron shakldagi matnlar to‘plami. Milliy korpus
bo‘lishi uchun imkon qadar tilda mavjud yozma va og‘zaki matnlarning barcha turlarini o‘z ichiga
olishi, korpusga kiritilib maxsus izohiga ega bo‘lishi kerak. Albatta bunda korpus hajmi boshqa
korpus turlariga nisbatan oshib ketadi. Masalan, Ingliz tilining milliy korpusi 2.4 milliarddan
oshiq, rus tilining milliy korpusi 200 millionga yaqin, turk tilining milliy korpusi 50 milliondan
oshiq so‘z va so‘z shakllariga ega. Bugungi kunda dunyo tillarining juda ko‘pchiligi murakkab
qidiruv tizimiga ega bo‘lgan, ilmiy va amaliy lingvistik tadqiqotlar uchun bir –biridan farqli tahlil
funksiyalariga ega bo‘lgan milliy korpusiga ega.

O’zbek tilshunosligida korpus.

O‘zbek tili uchun ham milliy korpus yaratish tadqiqotlari tilshunoslar tomonidan boshlab

yuborilgan. Bu borada o‘zbek olimlaridan A.Po‘latov, B.Mengliyev, N.Abdurahmonova,
Sh.Hamroyeva, A.Eshmo‘minovlarning kompyuter lingvistikasi va korpus lingvistikasi sohalarida
olib borayotgan ilmiy izlanishlarini e’tirof etish mumkin. Ammo ko‘pchilik ishlar natijasi
nazariyalarni o‘rganish va tahlil qilish bilan cheklanib qolmoqda. Bir til doirasida milliy korpus
yaratish murakkab va uzoq vaqtni oladigan jarayon ekanligi hech bir tilshunosga sir emas. Ammo
kichik tadqiqotlar doirasida muayyan bir uslublar yoki janrlar bo‘yicha kichik korpus
namunalarini yaratish kerak. Lekin shu o‘rinda aytishkerakki, foydalanuvchi so‘zning
kontekstlarda to‘g‘ri qo‘llanilishini tekshirishi yoki tabiiy til nutq birikmalarini izlashi, tilda tez-
tez uchraydigan til qoliplarini aniqlashi va ulardan foydalanishi uchun kattaroq hajmdagi korpusga
ehtiyoj sezadi.[1;43-46]

O’zbekistonda korpus yaratish maqsadida qilingan ishlardan “”hamda “Ta’limiy korpus”ni

misol qilsak boladi.Ikkala korpus ham o’z nihoyasiga yetmagan bolsada korpusda alohida alohida
mavzuchalar tuzulgan. Ularni to’ldirish biz yoshlarni ishi deb o’layman.Shu o’rinda Nilufar
Abdurahmonavaning korrpus haqidagi fikrlarini eslab o’tmoq joiz: ”Biz tuzgan korpusda tilimizni
o’z holida saqlab qolish, uni kelgusi avlodga yetkazish va tilimizni imkon darajasida
boyitish,korpusimizni so’z hajmini kengaytirish,bizning kelajakdagi maqsadimiz.”- deya o’z
nutqini tamomlaydi.

O’zbek tillining Milliy korpusi ustida ish olib borayotgan professor B.Mengliyev korpusga

quydagicha tarif beradi: "Korpus-til birliklarining xususiyatlarini aniqlash maqsadida qidiruv
dasturiga boʻysundurilgan matnlar majmui,tabiiy tildagi elektron shaklda saqlanadigan yozma
yoki ogʻzaki, kompyuterlashtirilgan qidiruv tizimiga dasturiy taʼminot asosida joylashtirilgan
matnlar jamlammasi.Til korpuslari-til boʻyicha tadqiqot va amaliy topshiriqlar yechimi uchun
inkor etib boʻlmas ish quroli" deb tarif beradi. Milliy korpusi nima? degan savol tuguladi.[2;4-5]


background image

ISSN:

2181-3906

2023

International scientific journal

«MODERN SCIENCE АND RESEARCH»

VOLUME 2 / ISSUE 12 / UIF:8.2 / MODERNSCIENCE.UZ

885

Milliy til korpusi — til birliklarining xususiyatlarini aniqlash maqsadida elektron qidiruv

imkoniyati mavjud tizim, tabiiy tilning raqamlashgan yozma va og‘zaki matnlar jamlanmasi.
Milliy korpus — til birli gining o‘zgarishi, eskirishi, yangilarining paydo bo‘lishi, ma’nosining
kengayishi va torayishi, yangi iboralarning paydo bo‘lishini kuzatish, an’anaviy va zamonaviy
lug‘atlar tuzishda keng imkoniyatli dasturlashtirilgan tizim. Korpusdagi milliy so‘zi nafaqat
tilning, balki korpus tuzilishi va tarkibining ham o‘ziga xosligini anglatadi. Milliy korpusning
boshqa tur til korpuslaridan farqi ta’limiy korpus, muallifllik korpusi, poetik matnlar korpusi,
ilmiy va rasmiy matnlar korpusi, og‘zaki matnlar, badiiy matnlar va gazetalar hamda dialektlar
korpusi kabi ichki korpuslarni o‘z tarkibiga qamrab olganligi bilan belgilanadi.

Milliy korpusning o‘ziga xos ikki muhim xususiyati mavjud.Birinchidan, u

me’yorlashtirilgan muayyan tarkibga ega ekanligi bilan xarakterlanadi. Bu korpus ma’lum tilda
berilgan (turli badiiy janrlar: publitsistik, o‘quv, ilmiy, ish yuritish, so‘zlashuv, ilmiy, ish yuritish,
so‘zlashuv, shevaviy kabi),ularning barchasi imkon darajasida ma’lum doiraga oid
ma’lumotlarning proporsional matnlari hisoblanadigan og‘zaki va yozma ko‘rinishlarining
barchasini o‘z qamroviga oladi degani.

Ikkinchidan, korpus unga kiritilayotgan matnlarning o‘ziga xos jihatlari to‘g‘risida muhim

ko‘shimcha ma’lumotlarni saqlaydi. Kiritma–korpusning asosiy bosh ma’lumotnomasi bo‘lib, u
korpusni zamonaviy internet tarmog‘ida mavjud bo‘lgan oddiy matnlar to‘plamidan ajratib turadi.

Xulosa

Xulosa o’rnida shuni aytmoqlik kerakki, mamlakatimizda kompyuter savodxonligini

oshirish maqsadida qilinayotgan ishlar juda ko’p. Ulardan birinchi prizidentimiz Islom
Karimovning 2002-yil 30-maydagi

-Kompyuterlashtirishni yanada rivojlantirish va axborot-kommunikatsiya texnologiyalarni

joriy etish to’g’risidagi farmoni;

O’zbekiston Respublikasining 2003-yil 11-dekabirdagi
-Axborotlashtirish to’g’risidagi qonuni.
keying yillarda chiqarilayotgan qonun va farmoyishlarni bunga yorqin misol qilib

ko’rsatsak bo’ladi.

Gap o’rnida shuni takidlash kerakki korpus lingvistikasini o’zbek tilshunosligiga kirib

kelishi juda kata yangilik bo’ladi deb hisoblayman.

REFERENCES

1.

Abdurahmonova

N. Mashina

tarjimasining

lingvistik

asoslari

(o‘quv

qo‘llanma). Toshkent: Akademnashr, 2012.- B 43-46

2.

Abduraxmonova N.”O’zbek tili elektron korpusining elektron modellari” maqolasi.-B 4-
5.

3.

Raximov A.Kompyuter lingvvistikasi asoslari,-Toshkent “Akademik”-2011-B 89-90.

References

Abdurahmonova N. Mashina tarjimasining lingvistik asoslari (o‘quv qo‘llanma). Toshkent: Akademnashr, 2012.- B 43-46

Abduraxmonova N.”O’zbek tili elektron korpusining elektron modellari” maqolasi.-B 4-5.

Raximov A.Kompyuter lingvvistikasi asoslari,-Toshkent “Akademik”-2011-B 89-90.

inLibrary — это научная электронная библиотека inConference - научно-практические конференции inScience - Журнал Общество и инновации UACD - Антикоррупционный дайджест Узбекистана UZDA - Ассоциации стоматологов Узбекистана АСТ - Архитектура, строительство, транспорт Open Journal System - Престиж вашего журнала в международных базах данных inDesigner - Разработка сайта - создание сайтов под ключ в веб студии Iqtisodiy taraqqiyot va tahlil - ilmiy elektron jurnali yuridik va jismoniy shaxslarning in-Academy - Innovative Academy RSC MENC LEGIS - Адвокатское бюро SPORT-SCIENCE - Актуальные проблемы спортивной науки GLOTEC - Внедрение цифровых технологий в организации MuviPoisk - Смотрите фильмы онлайн, большая коллекция, новинки кинопроката Megatorg - Доска объявлений Megatorg.net: сайт бесплатных частных объявлений Skinormil - Космецевтика активного действия Pils - Мультибрендовый онлайн шоп METAMED - Фармацевтическая компания с полным спектром услуг Dexaflu - от симптомов гриппа и простуды SMARTY - Увеличение продаж вашей компании ELECARS - Электромобили в Ташкенте, Узбекистане CHINA MOTORS - Купи автомобиль своей мечты! PROKAT24 - Прокат и аренда строительных инструментов