Ўзбек тили миллий корпусини яратиш – замон талаби

inLibrary
Google Scholar
Журнал:
Выпуск:
CC BY f
77-81
0
0
Поделиться
Тоирова, Г. (2021). Ўзбек тили миллий корпусини яратиш – замон талаби. in Library, 21(4), 77–81. извлечено от https://inlibrary.uz/index.php/archive/article/view/30135
Crossref
Сrossref
Scopus
Scopus

Аннотация

Сунъий интеллект орқали тилнинг имкониятларидан фойдаланиш борасида замонавий ахборот технологиялари бениҳоя кенг қулайлик­лар эшигини очди. У инсон онги бажариши мумкин бўлган бир қанча вазифаларнинг бажара олмоқда. Сунъий интеллект маҳсули бўлмиш электрон манбалар инсонга зарар етказмаслик ва инсонларнинг оғири­ни енгиллаштириш мақсадида яратилмоқда. Чунончи, ўзбек тилининг интернет ва электрон тилга айланиши, миллий тилнинг электрон ре­сурсларини (ўзбек тили корпуси, электрон луғатлари, интернет саҳи фаларидаги матнлар) ва технологияларини такомиллаштириш долзарб вазифалардандир.

Похожие статьи


background image

77

ЎЗБЕК ТИЛИ МИЛЛИЙ

КОРПУСИНИ ЯРАТИШ – ЗАМОН ТАЛАБИ

Г.B.Тоирова

Бухора давлат университети

Сунъий интеллект орқали тилнинг имкониятларидан фойдаланиш

борасида замонавий ахборот технологиялари бениҳоя кенг қулайлик­

лар эшигини очди. У инсон онги бажариши мумкин бўлган бир қанча

вазифаларнинг бажара олмоқда. Сунъий интеллект маҳсули бўлмиш

электрон манбалар инсонга зарар етказмаслик ва инсонларнинг оғири­

ни енгиллаштириш мақсадида яратилмоқда. Чунончи, ўзбек тилининг

интернет ва электрон тилга айланиши, миллий тилнинг электрон ре­

сурсларини (ўзбек тили корпуси, электрон луғатлари, интернет саҳи­

фаларидаги матнлар) ва технологияларини такомиллаштириш долзарб

вазифалардандир.

Корпус – бу корпус лингвистикасининг предмети. Ушбу атама ил­

мий адабиётларда турлича таърифланади. Чунончи, инглиз тилида

linguistic corpus ёки text corpus каби атамалар билан қўлланилади[8].

Муайян тилнинг миллий корпусни яратиш, унинг аналитик технологи­

ясини, корпус лингвистикаси соҳасини ривожланиш каби муаммоларни

ҳал қилишда А.Н.Хомский, Г.Н.Луч, Ч.Ф.Меер, Ж.Синклер, М.З.Курди

кабиларнинг илмий изланишларини эътироф этиш лозим [17,18,21,22].

Рус олими В.П. Захаров «корпус» атамасини қуйидагича изоҳлайди:

«корпус –оғзаки ҳамда ёзма матнлар асосида жамланган тил бирликла­

рининг лингвистик маълумотлар мажмуи»[4]. Рус корпус лингвистика­

сида катта массивли матнлар мажмуаси, корпус тузиш принциплари,

лингвистик маълумотлар базаси В.Г.Бритвин, В.П.Захаров, И.А.Мел­

чук, А.Б.Кутузов, Р.Г.Котов, Л.И.Беляева, Е.В.Недошивина, В.В.Ры­

ков, В.Плунгянларнинг мақсадли тадқиқотларида ўз аксини топган

[1,2,3,4,5,6,8,9].

Ўзбек тилшунослигида матнни лингвостатистик таҳлил этиш,

унга лексикографик ишлов бериш, автоматик таҳрир қилувчи дастур­

нинг лингвистик таъминотини, таҳрир ва таҳлил қилувчи дастурнинг

лингвистик модуллари, миллий корпусининг синоним сўзлар базаси,

муаллифлик корпусининг лингвистик асослари борасида Х.Исхакова,

С.Муҳаммедов, С.Ризаев, С.Муҳаммедова, Б.Менглиев, Д.Ўринбоева,


background image

78

А.Пўлатов, У.Дысимова, Г.Валиева, Г.Жуманазарова, Н.Абдураҳмоно­

ва, Ш.Ҳамроева, М.Абжалова, А.Эшмўминовларнинг ишлари диққатга

сазовор.

Ўзбек тилшунос олимлари эса «корпус» атамасига қуйидагича изоҳ

беради: «корпус – маълум мақсадда йиғилган матнлар мажмуини таш­

кил этувчи тил бирликларининг йиғиндиси» [13], «корпус – исталган

табиий (реал) тилдаги электрон шаклда сақланадиган ёзма ёки оғзаки,

компьютерлаштирилган қидирув тизимига жойлаштирилган матнлар

йиғиндиси»[16] каби таърифларда ўз ифодасини топган. Ўзбек тилшу­

нослигидаги тадқиқотларда корпуснинг моҳияти қуйидагича ёритила­

ди: «Корпус – мавжуд маълумотларни матн ҳолида тақдим эта олиш;

корпуснинг ҳажмига кўра имкон даражада кўпроқ ахборот беришнинг

имконияти; бир марта яратилган корпус маълумотларидан такроран,

турли масалаларни ҳал қилишда фойдаланиш имкониятидир» [14].

«Корпус – тил бирликларининг хусусиятларини аниқлаш мақсадида

қидирув дастурига бўйсундирилган матнлар мажмуи, табиий тилдаги

электрон шаклда сақланадиган ёзма ёки оғзаки, компьютерлаштирил­

ган қидирув тизимига дастурий таъминот асосида жойлаштирилган on­

line ёки off­line тизимда ишлайдиган матнлар жамланмаси» [11] – деб

изоҳланади бошқа бир манбада.

Шунингдек, «таълимий корпус» ҳақида илмий тадқиқот олиб бор­

ган Ў.Холиёров ўз ишида қуйидаги фикрларни айтиб ўтади: «Таълимий

корпус – материаллари тилни ўргатишга йўналтирилган, лингводидак­

тик хусусиятга эга тил корпуси. Ўзбек тилининг таълимий корпуси ўз­

бек тили имкониятларини ўргатишга мўлжалланган, лингводидактик

хусусият касб этган, электрон матнларни қамраб олган, махсус сайт

кўринишида амал қиладиган корпусдир»[15].

Юқорида келтирилган таъриф ва изоҳларга қўшилган ҳолда, уни

қуйидагича таърифлаймиз: Корпус – электрон шаклда мавжуд бўлган

матнларни, ҳужжатларни маълумотларни қайта ишлаш, уларни авто­

матик таҳлил, яъни морфологик синтактик ва семантик таҳлил қилиш,

морфологик анализ ва синтез қилиш билан бирга, ярим автоматик ре­

жимда маънони бузмасдан ишончли нутқ материалини мослаштириш

даражасини текшириш ушбу соҳадаги тил билан қизиқишни оширишга

хизмат қилади. Бугун ўзбек тилидаги матнларни таҳлил қилиш инсон

қўл меҳнати билан амалга оширилмоқда, бу эса ўз навбатида матнлар­

нинг таҳлилига кетадиган вақтни кўп сарф қилинишига, иқтисодий


background image

79

харажатларнинг ошишига, инсон томонидан йўл қўйиладиган хатоли­

кларнинг юзага чиқишига олиб келмоқда. Шу жиҳатдан корпусларини

тилшунослик бўйича асосий тадқиқот ва амалий топшириқлар ечими

учун зарурий материал деб атасак бўлади.

Статистик тадқиқ методи компьютер таржимаси, нутқни синтезлаш

ва уни таниш, орфографик текширув каби лингвистик амалларни бажа­

риши корпус лингвистикасининг кейинги тараққиёт босқичида амалга

оширилади.

Ҳозирда интернет тизимида фаолиятда бўлган 70 яқин тил кор­

пуслари, яъни инглиз, испан, хитой, араб, француз, рус, немис, поляк,

поляк­украин, чех, словак, серб, хорват, босния, болгар, болгар­рус,

македон, шотланд, нидерланд, нидерланд­француз, швед, дат, норвег,

исланд, фарер, ўрта аср француз тили, испан, итальян, португал, румин,

литва, латиш, грек, шарқий арман, осетин, албан, ҳинд, хетт, фин, урал

тиллари, эстон, вепс, венгер, удмурт, грузин, инглиз­грузин, лазгин,

турк, татар, тожик, бошқирд, қрим­татар, қалмиқ, бурят, монгол, араб,

иврит, амхар, япон, қадимий япон, баман, эсперанто тилларининг кор­

пуслари яратилган[11]. Юқорида номлари санаб ўтилган корпуслар­

нинг ҳар бири ўзгача устунлик ва камчиликга эга. Масалан, Тожик тили

корпуси фақат электрон кутубхона вазифасини бажариб, фото, видео

галерея вазифасини бажара олади. У умуман разметкаланмаган, қиди­

рув тизими номукаммал ва ноқулайдир. Фақат яхлит асаргагина ишора

қила олади, холос.

А.Ғуломов, М.Асқарова, А.Ҳожиев, Ҳ.Неъматов, Р.Сайфуллаева,

Б.Менглиев, М.Қурбонова, М.Абузалова, С.Назарова каби ўзбек тил­

шунослигининг назарий ва амалий жиҳатдан тамал тошини қўйган

устозларнинг тадқиқотларни комьпютер тизимига мослаштириш ҳамда

збек тили миллий корпусини яратишга асос бўла олади.

«Ўзбек компьютер лингвистикаси ўзбек тилининг инглиз тилидан

тамомила фарқ қиладиган хусусиятлари асосида шакллантирилади. Бу

эса ўзбек компьютер лингвистикасини яратишдан олдин ўзбек тилини

мукаммал даражада системалаштириш, формаллаштириш вазифала­

рини амалга ошириш зарурияти мавжудлигини кўрсатади. Ўзбек тили

каби бой, кенг ва чуқур ривожланган тил масалаларини компьютерда

ечиш даражасига олиб чиқиш инглиз тилига қараганда катта ҳажмда

иш бажаришни талаб қилади»,­ дея таъкидлайди Абдумажид Пўлатов.

Олимнинг фикрига қўшилган ҳолда, ўзбек компьютер лингвистикасини


background image

80

яратишда инглиз компьютер лингвистикасидан тўғридан­тўғри фойда­

ланиб бўлмаса­да, унинг асосий ғояларига таяниш мумкин. Ўзбек тили­

нинг тил корпусини тузишга мўлжалланган лингвистик база ва миллий

матнлар банкини тайёрланишда Рус тили миллий корпуси бўйича олиб

борилган тадқиқот ишларига мурожаат қилинади.

Бугунги кунда у «виртуал луғатлар, улар билан ишлаш ҳамда яра­

тиш технологиялари» мазмунида оммалашмоқда. Бунда соҳани Интер­

нет тизими доирасида идрок этиш лозим бўлади. Киберлексикография

атамаси шу маънода интернет электрон луғатларни – умумий ва махсус

турдаги академик, энциклопедик ва лингвистик луғатларни яратиш­

нинг назарий асосларини ўзида ифодалайди. Маълумки, корпус ёзма

матнларнинг электрон шаклдаги тўплами бўлиб, махсус ишлаб чиқил­

ган компьютер дастурлари орқали тўпланган луғатлар жамланмаси

киритилиши асосида яратилади. Корпус компьютер дастури шаклида

тилнинг барча жиҳатларини ёритиб бера олади. Шунинг учун ҳам, кор­

пус лингвистикаси тилнинг хусусиятларини эътиборга олган ҳолда уни

қайта баҳолашга олиб келади. Ўзбек тили миллий корпуси ўзбек ти­

лида мавжуд бўлган лексик бирликларнинг, чунончи, ўзлашма сўзлар,

синоним, антоним, омоним, сўзларнинг даражаланиши; сўзнинг мор­

фологик таркиби, сўзнинг ясалиши, сўзларнинг маъноси, унинг морфо­

логик хусусиятларини автоматик таҳлил қилиб бера олиши керак. Яъни

корпусни тузиш, леммалаш, разметкалаш жараёнида корпус таркибига

кирган шундай сўзларни бирма­бир қидирув асосида матнлар ичидан

топиш ва уларни махсус изоҳлаш керак бўлади. Бунинг учун эса ал­

горитм, лингвистик молеллаштириш ишлари амалга оширилиш лозим.

Миллий корпуснинг интерфейси турли дизайн, тузилишга эга бў­

либ, унинг мукаммаллиги корпус яратувчи муаллифнинг зиммасига

юкланади. Чунки интерфейс корпус ҳақида илк таассурот қолдирувчи,

ўзига жалб этувчи умумий кўринишдир. Интерфейс яратишда миллий

коллоритни акс эттирувчи безаклар ҳамда мумтоз ёки замонавийликни

акс эттирувчи белгилар эътиборга олиниши лозим.

Демак, миллий корпусдан фойдаланишда унинг қулай ва энг сама­

рали имкониятларининг намоён бўлишида интерфейснинг мукаммал

ҳамда тизимли равишда ишлаб чиқилганлиги муҳим саналади. Шу боис

интерфейсни замонавий дастурий дизайн талабларига жавоб берадиган,

фойдаланувга тушунарли, ишлаш учун қулай шаклда яратилади.


background image

81

Хуллас, ўзбек тили миллий корпусининг умумий кўриниши бир

неча ойналарга ҳамда ўнг ва чап устунчаларга ажратилган. Унда қуй­

идаги ойналар мавжуд бўлади: «Лексик қидирув», «Морфологик қиди­

рув», «Синтактик қидирув». Ундан сўз ва гаплар бир неча сония вақт

ичида автоматик таҳлил қилиб берилади.

«ЎТКАН КУНЛАР» РОМАНИДА ҚЎЛЛАНГАН ПРАГМАТИК

ХУСУСИЯТЛАР

Д.Б.Жумаева

Навоий давлат педагогика институти

Тил кишилар ўртасида фақат алоқа воситасигина бўлиб қолмай,

куммулятив ва эстетик вазифани ҳам бажаради. Ижтимоий ҳаётда юз

бераётган ҳар қандай ҳодиса, қайси даврда бўлишидан қатъи назар, ба­

диий адабиётда акс этади ва келажак авлодларга етказилади. Бу жараён

inLibrary — это научная электронная библиотека inConference - научно-практические конференции inScience - Журнал Общество и инновации UACD - Антикоррупционный дайджест Узбекистана UZDA - Ассоциации стоматологов Узбекистана АСТ - Архитектура, строительство, транспорт Open Journal System - Престиж вашего журнала в международных базах данных inDesigner - Разработка сайта - создание сайтов под ключ в веб студии Iqtisodiy taraqqiyot va tahlil - ilmiy elektron jurnali yuridik va jismoniy shaxslarning in-Academy - Innovative Academy RSC MENC LEGIS - Адвокатское бюро SPORT-SCIENCE - Актуальные проблемы спортивной науки GLOTEC - Внедрение цифровых технологий в организации MuviPoisk - Смотрите фильмы онлайн, большая коллекция, новинки кинопроката Megatorg - Доска объявлений Megatorg.net: сайт бесплатных частных объявлений Skinormil - Космецевтика активного действия Pils - Мультибрендовый онлайн шоп METAMED - Фармацевтическая компания с полным спектром услуг Dexaflu - от симптомов гриппа и простуды SMARTY - Увеличение продаж вашей компании ELECARS - Электромобили в Ташкенте, Узбекистане CHINA MOTORS - Купи автомобиль своей мечты! PROKAT24 - Прокат и аренда строительных инструментов