Мақолада корпуснинг кўп қиррали лингвистик манба сифатидаги асосий аҳамияти, корпус асосан икки турдаги маълумотга эга эканлиги ҳамда унинг турлари таҳлил қилинган. Мақолада матн таҳлили жараёнига сарфланадиган вақтнинг тежалиши, тил бирликларининг нутқ таркибидаги хусусиятларини минглаб мисоллар билан кўрсата олиш корпуснинг асосий самарали имкониятлари сифатида эътироф этилган. Компьютер лингвистикаси соҳасида миллий корпус, таълимий корпус, параллел корпус ҳақида маълумот берилган. Уларни лингвистик, экстралингвистик теглаш, корпус тузиш алгоритмини ишлаб чиқиш, корпус учун лингвистик таъминот яратиш ижтимоий зарурат эканлиги таъкидланган. Унда ўзбек тили корпусларини яратишнинг асосларини ишлаб чиқиш, компьютер лингвистикаси йўналишида тадқиқотларни амалга ошириш илмий-назарий манба сифатида долзарблиги эътироф этилган.
Мақолада тилнинг интернет, компьютер технологиялари тилига айланиши математик лингвистика, унинг давоми бўлган компьютер лингвистикасининг шаклланганлиги ва ривожланиш даражаси билан боғлиқлиги, айниқса, сунъий интеллект учун табиий тилларни моделлаштириш муаммоси хусусида мушоҳада юритилган. Ўзбек тилининг халқаро мақомини оширишда ўзбек тили миллий корпуси катта аҳамиятга эга. Компьютер лингвистикаси фани доирасида амалга ошири лаётган ишлар ўзбек тилидаги мавжуд муаммоларни ҳал этишда муҳим роль ўйнайди. Мақолада миллий корпус яратишнинг за руратлари нимада эканлиги, таълим жараёнида сўзнинг нозик қиррасини ўрганиш, уни нутқида қўллаш кўникмасини ша кллантиришда нимага таяниш кераклиги, ўзбек тили миллий корпуснинг фан ва миллат учун нима аҳамияти борлиги, ўзбек тили миллий корпуснинг асосий фойдаланувчилари ким бўла олиши мумкинлиги хусусида асосли фикр мулоҳазалар билдирилди. Корпуснинг асосий фойдаланувчилари, албатта, турли йуналишларда иш олиб бораётган тилшунос тадқиқотчилардир. Маълум бир даврдаги тилга оид ишончли статистик маълумотлар адабиётшунослар, тарихчилар ва бошка гуманитар соҳалар вакилларини ўзига жалб этиб келгандир. Тилни ўқитишда ҳам миллий корпуснинг ахамияти каттадир. Миллий корпус яра-тишнинг технологик жараёни хусусида фикр-мулоҳазалар баён қилинди. Жумладан, миллий корпус технологик жараёни: тан ланган матнлар асосида лексема ва сўз шаклларининг такрорланиши луғатини яратиш; олинган такрорланиш луғатининг ҳар қандай бирлиги учун матнни кўриб чиқиш; графикли сўзни бўғинга ажратиш ва бўғинларнинг такрорланиш луғатини тузиш; сўз захираларини саралаш; бир вақтнинг ўзида чекланма-ган файлларни қайта ишлаш; ташқи белгиларга эга бўлган матнлар корпусларини яратиш кабилардан иборатлиги изоҳлаб бе рилган.
В статье рассматриваются авторский корпус и его значение в современном глоссарии, мир пушкинского авторского корпуса, чешский писательский корпус, авторский корпус Шекспира и их недостатки. Интерфейс авторского корпуса состоит из различных конструкций и структур, и автор несет ответственность за его полноту, интерфейс должен быть привлекательным и впечатляющим. Создание интерфейса основано на дизайне национальных или современных функций, интерфейс должен включать жизнь и творчество художника в фотографиях. Корпус лингвистики — очень быстро развивающаяся отрасль мира компьютерной лингвистики, которая достигла больших успехов в этом отношении. Корпус лингвистики также преподается как наука в мировых университетах. Предметом этой дисциплины является теория и практика построения корпуса, такие как особенности тела и основы программирования. Корпус лингвистики занимается общей теорией и практикой компьютерной лингвистики, формированием языкового тела и компьютерными технологиями. В статье рассказывается о современных информационных технологиях, которые создали огромные возможности для языковой функциональности. Компьютерный перевод, редактирование, анализ, электронный словарь и тезаурус являются доказательством нашего мнения. Особенно создание современных электронных словарей и культуры их использования является одним из эффективных способов изучения языка. В частности, роль языковых зданий, созданных и развивающихся быстрыми темпами во всем мире при демонстрации способности и способности владеть языком, очень велика. Цель статьи — изучить лингвистические основы корпуса узбекского языка, изучить
лингвистическую ценность лингвистического корпуса, историю корпусного языкознания, изучить авторскую лингвистику корпусов, ее особенности в социальном, лексикологическом, образовательная и другие сферы.
Мақолада корпуснинг кўп қиррали лингвистик манба сифатидаги асосий аҳамияти, корпус асосан икки турдаги маълумотга эга эканлиги ҳамда унинг турлари таҳлил қилинган. Лексик грамматик кодни шакллантириш мақсадида фонологик, морфонологик ва орфографик қоидалар алгоритми зарурияти илмий асосланган. “Эксперт лингвистик тизим" корпус-менежер тизими ва унинг асосий имкониятлари айтиб ўтилган. Ўзбек тили миллий корпусининг лингвистик базасини тузишда фонологик, морфонологик ва орфографик каби лингвистик модулларнинг аҳамияти, корпусда асосий структурали бирликларни ажратиш ёритилган.
В статье рассматривается трансформация языка в язык Интернета, компьютерные технологии, математическая лингвистика, ее продолжение и становление и развитие компьютерной лингвистики, в частности вопрос моделирования естественных языков для искусственного интеллекта. В частности, исследуется вопрос лингвистического и экстралингвистического разделения специальных тегов для маркировки текстов и их компонентов. Определены требования к кодированию важной текстовой информации. В статье рассматривается основное назначение корпуса как сложного лингвистического источника, а также тот факт, что он в основном содержит два вида информации и ее типы. Национальный корпус, образовательный корпус и параллельный корпус обсуждаются в рамках предмета компьютерной лингвистики. Было подчеркнуто, что их лингвистическая и экстралингвистическая маркировка, разработка алгоритмов формирования корпусов и создание корпусной лингвистической поддержки являются общественной потребностью.
Ушбу мақолада муаллиф мусулмон ўлкаларда оммавий тарқалган сфероконусларнинг географик ҳусусиятлари, безаклари, шаклига алоҳида тўҳталади. Унинг функцияси тўғрисида тадқиқотчиларнинг кескин ажралиб турувчи илмий мулоҳазаларини ёритаркан идишларни аниқ вазифаси нимадан иборат бўлганлигини мутаҳассисларнинг аниқ далиллари асосида келтиришга уриниб кўради
The article discusses the author's corps and its significance in modern glossary, the world of Pushkin's author's corps, the Czech writer's corps, Shakespeare's author's corps and their shortcomings. The interface of the author's corps is made up of different designs and structures, and the author is responsible for its completeness, the interface should be attractive and impressive. The creation of the interface is based on the design of the national or modern features, the interface should involve the life and works of the artist in photoes. The Corpus of Linguistics is a very rapidly developing branch of the world of computational linguistics, which has achieved great success in this regard.
The Corpus of Linguistics is also taught as a science in world universities. The subject of this discipline is the theory and practice of building a corpus, such as body features and the basics of programming. The Corpus of Linguistics deals with general theory and practice of computational linguistics, the formation of the language body, and computer technologies. The article tells about modern information technologies that have created tremendous opportunities for language functionality. Computer translation, editing, analysis, electronic dictionary and thesaurus are proof of our opinion. Especially the creation of modern electronic dictionaries and the culture of their use is one of the effective ways of learning a language. In particular, the role of language buildings created and developing at a fast pace throughout the world when demonstrating the ability and ability to master the language is very large. The purpose of the article is to study the linguistic foundations of the Uzbek language corpus, to study the linguistic value of the linguistic corpus, the history of corpus linguistics, to study the author's linguistics of the corpuses, its features in the social, lexicological, educational and other fields.
The article gives an idea about the interface, the content of the corpus, its flawless functioning and at first glance the importance of the author’s personality, creative heritage, classification.
Монография ўзбек миллий шевалари корпусини тузишнинг лингвистик асослари Бойсун тумани “ж”ловчи шевалари мисолида ёритилган. Ўзбек миллий субшевалар корпусининг базавий структурасига оид назариялар ҳамда амалиётдаги статистикаси келтирилиб ўтилган.
Шунингдек ўзбек миллий мавзувий шевалар корпусининг матн, паспорт, жанр, мавзувий метаразметкаси ва унинг конструктив концепцияси оид қарашлар назарий ва амалий асосланган.
Китоб тилшунослар, диалектолог ва корпус лингвистикаси доирасида тадқиқот олиб борувчилар ва амалий филология талабалари учун мўлжалланган.
Мақолада муаллиф томонидан Ўзбекистон Республикаси жиноят процессуал қонунчилигида «Хабеас корпус» институти ва уни такомиллаштириш истиқболлари таҳлил қилинган. Шунингдек, мақолада жиноят процессуал қонунчилигида «Хабеас корпус» институтини такомиллаштириш юзасидан таклифлар келтирилган.
Тадқиқот мавзусининг долзарблиги ва зарурати. Жаҳон тилшунослигида рақамли ахборот воситаларидан фойдаланиш қулайлиги ҳамда интернет орқали миллий тилларни ўзлаштиришга бўлган ҳаракат таъсирида миллий корпусларда шевалар базасини яратиш тенденцияси ўсмоқда. Натижада тилда мавжуд диалектларни нафақат лингвистик, балки амалий жиҳатдан тадқиқ этиш, бу орқали шева бирликларини сақлаб қолиш, авлоддан-авлодга етказиш имкониятининг кўлами кенгаймоқда: миллий тил корпусларида шева бирликларини лингвистик аниқлашнинг умумий тамойилларини ўрганиш, шевалар корпусининг жанрлар бўйича метаразметкасини ишлаб чиқиш, диалектал транскрипция лингвистик таъминоти тизимини ишлаб чиқишнинг амалий аҳамияти ошмоқда. Ҳозирда шева бирликларини матнга кўчириш (ёзиб олиш) асосига қурилган диалектал корпусларнинг икки хил йўналишли: мавзувий ва тегланган матнли корпусни шакллантириш муаммолари долзарб бўлиб қолмоқда. Дунё тилшунослигида тилларни сунъий интеллект ёрдамида матн таркибида сақлаб қолиш орқали уларнинг яшовчанлигини узайтириш ва лингвистик корпуснинг субкорпуси – шевалар корпусини шакллантириш зарурияти кун тартибидаги масалалардан бири ҳисобланди. Жумладан, диалектларни бир жойга жамлаш, таркибий тартиблаштириш, шевашуносликда мавжуд манбаларнинг сониялар оралиғида сараланиши ҳамда тақдимотини йўлга қўйиш доирасида: Австрия, Хитой (Мандарин диалектлари корпуси), Германия, Португалия, Чехия, Финляндия, Скандинавия, Польша, Литва, Грузия (масалан: Cor-Dial-Sin; Helsinki corpus of English dialeсts; Nordic dialeсts corpus; Archiv fur gesprochenes Deutsch, Die bayerische Dialektadebank; LEXDIALGRAM ва ҳ.к.), Россиянинг Москва, Славян-Кубан, Вологод, Саратов, Қозон диалектал корпуслари, Санкт Петербург илмий-текшириш институтлари, Томск диалектологик корпус мактабларида амалга оширилаётган тадқиқотларни кўрсатиб ўтиш мумкин.
Ўзбек тилшунослигида корпус лингвистикасига доир яқин йиллар оралиғида бажарилган тадқиқотлар тилни ўрганувчи ва уни тадқиқ этувчилар учун асос вазифасини ўтай бошлагани унинг истиқболли йўналиши эканини яна бир бор исботлаб берди. Бинобарин, “...давлат тилининг софлигини сақлаш, уни бойитиб бориш ва аҳолининг нутқ маданиятини ошириш; давлат тилининг замонавий ахборот технологиялари ва коммуникацияларига фаол интеграциялашувини таъминлаш 1 ” ҳозирги кунда ўзбек компьютер лингвистикаси олдида турган долзарб вазифалардан биридир. Ўзбек шевашунослигида шевалар корпусининг лингвистик базасини яратиш, ўзбек шевашунослиги муаммоларини амалий тилшунослик тамойиллари асосида тадқиқ этиш имкониятларини кенгайтириш ва шу орқали шева корпусини яратишнинг лингвистик асосларини назарий асослаш, белгилаш ва ишлаб чиқиш бугуннинг муҳим масалаларидандир. Бунда ўзбек тили шевалари корпусини шакллантириш орқали унинг компьютер услуби, шеваларнинг хорижий тилларга таржима дастурлари ва луғатлар, электрон дарсликлар яратиш билан боғлиқ илмий методик ишланмалар, амалий тавсиялар тайёрлаш ва бу орада эришилган натижаларни амалиётга кенг татбиқ этиш ҳар жиҳатдан долзарбдир.
Ўзбекистон Республикаси Президентининг 2017 йил 7 феврал “Ўзбекистон Республикасини янада ривожлантириш бўйича Ҳаракатлар стратегияси тўғрисида”ги ПФ–4947-сон, 2019 йил 21 октябр “Ўзбек тилининг давлат тили сифатидаги нуфузи ва мавқейини тубдан ошириш чора-тадбирлари тўғрисида”ги ПФ–5850-сон Фармонлари, 2017 йил 17 февраль “Фанлар академияси фаолияти, илмий тадқиқот ишларини ташкил этиш, бошқариш ва молиялаштиришни янада такомиллаштириш чора-тадбирлари тўғрисида”ги ПҚ–2789-сон ва 2019 йил 4 октябр “Ўзбекистон Республикасининг “Давлат тили ҳақида”ги Қонуни қабул қилинганлигининг ўттиз йиллигини кенг нишонлаш тўғрисида”ги ПҚ–4479-сон Қарорлари мазкур фаолиятга тегишли бошқа меъёрий-ҳуқуқий ҳужжатларда белгиланган вазифаларни амалга оширишга ушбу диссертация тадқиқоти муайян даражада хизмат қилади.
Бу мақолада ўзбек тилининг асосчиси жаҳоний шоир Aлишер Навоийнинг “Ҳайрат ул-аброр” достонида ишлатилган арабий ўзлашмалар тадқиқотга тортилган. Бу достон асосида тузилган конкорданс ва частотали луғат асосида асарда 2838 та арабий сўз ва бирикмалар ишлатилганлиги аниқланди. Шу жумладан, ўзбек тили тизимига кирмаган 52 та Қуръон ва ҳадислардан иқтибос қилинган жумла ва иборалар келтирилган. Aсарда қўлланган арабий ўзлашмаларнинг деярли 90% ўзбек адабий тилига Навоий давригача ўзлашиб бўлган ва ҳозиргача ҳам қўлланади. Қолган 10% гача бўлган арабий сўзлар ва иборалар ўзбек тили тизимига кирмаган, лекин шоир вазн ва қофия тақозоси билан уларни қўллашга мажбур бўлган. Шоир бу сўзларни араб тилида махсус ўрганган ва шу асосда “Сабъати абҳур” (“Етти уммон”) луғатини тузиб қолдирган. Aрабий ўзлашмаларнинг ўзбек тили тизимига сингиб кетганининг яна бир далили “арабча–форсча” ва “арабча–туркийча” қўшма сўзлар ва аффиксал ясама сўзларнинг қўллангани ҳамда бу сўзларнинг морфологик ва синтактик қоидаларга тўла мослигидир.
Мақолада сўз ясалиши ва унинг тарихи билан боғлиқ маълумотлар таҳлил этилган. Ушбу мақолада лингвистик дастурларнинг мустақил таркибий қисмларидан бир лингвистик модул ва алгоритм ҳамда унинг турлари таҳлил қилинган. Лексик-грамматик кодни шакллантириш мақсадида қўшма сўз ясалиши қоидалар бўйича алгоритм зарурияти илмий асосланган. Ўзбек тили миллий корпусининг лингвистик базасини тузишда қўшма сўзнинг лингвистик модулларининг аҳамияти ёритилган.
The article discusses the types of interfaces and the importance of the search window of the corpus in the creation of the national corpus of the Uzbek language. The interface of the national corpus consists of various designs and structures, the author is responsible for their completeness, the interface should be attractive and effective. The creation of the interface is based on national or modern features, and the interface should focus on the national color. Linguistic corpora are a very fast-growing branch of the world of computational linguistics that has achieved great success. An interface is a communication system between a technology and a user. Interface types such as visual, gestural and linguistic were analyzed.
Мақолада сўз ясалиши ва унинг тарихи билан боғлиқ маълумотлар таҳлил этилган. Ушбу мақолада лингвистик дастурларнинг мустақил таркибий қисмларидан бир лингвистик модул ва алгоритм ҳамда унинг турлари таҳлил қилинган. Лексик-грамматик кодни шакллантириш мақсадида қўшма сўз ясалиши қоидалар бўйича алгоритм зарурияти илмий асосланган. Ўзбек тили миллий корпусининг лингвистик базасини тузишда қўшма сўзнинг лингвистик модулларининг аҳамияти ёритилган.
Мақолада лингвистик дастурларнинг мустақил таркибий қисмларидан бир лингвистик модул ва алгоритм ҳамда унинг турлари таҳлил қилинган. Лексик-грамматик кодни шакллантириш мақсадида фонологик, морфонологик ва орфографик қоидалар алгоритми зарурияти илмий асосланган. Ўзбек тили миллий корпусининг лингвистик базасини тузишда фонологик, морфонологик ва орфографик каби лингвистик модулларнинг аҳамияти ёритилган.
Мақолада лингвистик дастурларнинг мустақил таркибий қисмларидан бир лингвистик модул ва алгоритм ҳамда унинг турлари таҳлил қилинган. Лексик-грамматик кодни шакллантириш мақсадида фонологик, морфонологик ва орфографик қоидалар алгоритми зарурияти илмий асосланган. Ўзбек тили миллий корпусининг лингвистик базасини тузишда фонологик, морфонологик ва орфографик каби лингвистик модулларнинг аҳамияти ёритилган.
Ushbu maqolada o‘zbek tilining korpusini yaratishda xususiy korpuslar asos vazifasini bajarishi haqida so‘z yuritilgan. Abdulla Qodiriyning “O‘tkan kunlar” asarining xususiy korpusini yaratish lingvistik jihatdan o‘rganilgan.
Сунъий интеллект орқали тилнинг имкониятларидан фойдаланиш борасида замонавий ахборот технологиялари бениҳоя кенг қулайликлар эшигини очди. У инсон онги бажариши мумкин бўлган бир қанча вазифаларнинг бажара олмоқда. Сунъий интеллект маҳсули бўлмиш электрон манбалар инсонга зарар етказмаслик ва инсонларнинг оғирини енгиллаштириш мақсадида яратилмоқда. Чунончи, ўзбек тилининг интернет ва электрон тилга айланиши, миллий тилнинг электрон ресурсларини (ўзбек тили корпуси, электрон луғатлари, интернет саҳи фаларидаги матнлар) ва технологияларини такомиллаштириш долзарб вазифалардандир.