В настоящее время идет стремительный процесс глобализации во всех сферах социальной жизни, и в том числе в области национальных языков и беспощадно подвергает опасности нивелирования национальных культур и ценностей. В таких условиях каждая нация должен заботиться о будущем своего языка и стремиться сохранить социальную функцию языка. В противном случае в недалеком будущем и язык, и культура, и сама нация лишится своего национального своеобразия и даже существования. Язык является ключом всего научно-технического прогресса. С этой целью мы должны собрать лексику всех произведений классического периода, начиная с «Дивану лугати-т-турк» (сочинение по тюркской лексике) Махмуда Кашгари до настоящего времени, создать текстовой корпус узбекского языка, составить конкордансы произведений и на основе этого создать полный толковый словарь. На следующем этапе собрать все заимствования в языке, классифицировать их по европейским языкам и по возможности заменить эквивалентом в узбекском языке или аналогом из тюркских языков. Слова арабского и персидского происхождения испокон веков находятся в составе узбекского языка, являясь его неотъемлемой частью. Их лучше заменить, если есть подходящие эквиваленты в узбекском языке. В узбекском языке пока не сущестует полнокровная норма терминотворчества. В этой области необходимо изучить опыт высокоразвитиых стран и разработать перспективную программу терминотворчества узбекского языка. Необходимо собрать все толковые словари тюркских языков, разработанных в настоящее время и использовать их опыт с целью совершенствования узбекского языка. Алишер Навои является основоположником современного узбекского языка и автором крупнейшего собрания сочинений в узбекском языке. По этой причине необходимо, в первую очередь, разработать конкордансы его сочинений и создать полный авторский словарь его произведений.
The emergence of corpus linguistics was preceded by a centuries old period of the use corpus methods and the creation of text corpora. In connection with the non-electronic form of storage of these corpora, as well as non-automatic methods of data processing, a special period in the history of corpus linguistics called pre electronic can be distinguished. With the invention and widespread use of computers, a new stage of development corpus linguistics begins – the created corpora differ from the old ones not only in the storage format, but also in volume. Second generation corpora are the products of the Internet and are distinguished by their large size. The third generation corpora are large and have many technological advantages. In this period, a number of new corpora were created, with a total volume of several billion words.
In Uzbek linguistics, a number of studies have been carried out on automatic translation, the development of the linguistic foundations of the author's corpus, the processing of lexicographic texts and linguistic-statistical analysis. However, the processing of the Uzbek language as the language of the Internet: spelling, automatic processing and translation programs, search programs for various characters, text generation, the linguistic basis of the text corpus and national corpus, the technology of its software is not studied in any monograph. The article discusses such problems as: the transformation of language into the language of the Internet, computer technology, mathematical linguistics, its continuation and the formation and development of computer linguistics, in particular the question of modeling natural languages for artificial intelligence. The Uzbek National Corps plays an important role in enhancing the international status of the Uzbek language.
Tayanch so’z va iboralar: avtomatlashtirish, concordance, “elektron” o’qituvchi, multimediya, virtual dastur, CALL, BASIC, avtomatizatsiya, kognitivintellektual yondashuv, avtomatik korrektorlar, speller, audio va vizual effektlar, interaktiv multimodal kutubxona, virtual ensiklopedia.
The article is scientifically substantiated by the need to create a national corpus of the Uzbek language. Suggestions are given on the structure of the corpus, the program interface, the algorithm of the program, the technology for obtaining the results. Based on the experience of world scientists, the requirements for the data encoding format for the national corpus of the Uzbek language are described. The article says that the interface of the national corpus and the author's corpus has a different design, structure, its improvement is the responsibility of the author of the corpus, and the interface should evoke the first impression of the corpus, an attractive appearance. The interface should take into account decorations that reflect the national color, as well as symbols reflecting the classics or modernity, the interface should reflect the life and work of the artist, the works created by him should open in separate windows, partly in photo galleries. The types of internal and external interface are also discussed. The article analyzes the linguistic module and algorithm and its types from independent components of linguistic programs. The need for an algorithm for phonological, morphological and spelling rules for the formation of the lexical and grammatical code is scientifically substantiated. The importance of language modules, such as phonology, morphology and spelling, in the formation of the linguistic base of the national corpus of the Uzbek language is emphasized.
Ushbu darslik bakalavriatning 60230700-Amaliy filologiya yo‘nalishi talabalari uchun o‘tiladigan “O‘zbek tilining dialektal korpusini tuzish amaliyoti” fani uchun yaratilgan bo‘lib, undan ma’ruza mashg‘ulotlari uchun materiallar, nazoratlar uchun test savollari, har bir mavzu uchun nazariy savollar, glossariy o‘rin olgan. Darslik nafaqat talabalar, balki soha mutaxassislari, tadqiqotchilar va qiziquvchi o‘quvchilar ommasi uchun mo‘ljallangan.
В данной статье рассматривается функционирование имен прилагательных в лирике Ф. Тютчева.
В научной статье автором рассмотрены некоторые особенности формирования судейского корпуса в таких зарубежных странах, как США, Франция, Япония, Россия в соответствии с которыми даны аргументированные предложения.
Ushbu tezisda ingliz tili lug’at sathining boyish omillari va usullari, zamonaviy texnologiyalarning yangi so’zlarning paydo bo’lishida tutgan o’rni, tilshunoslarining ingliz tilidagi faol so’zlarning miqdori haqidagi o’z taxminlari hamda ingliz tilini horijiy til sifatida o’qiydigan o’quvchilarga tavsiyalar o’rin olgan.
Ushbu maqolada o‘zbek tilining korpusini yaratishda xususiy korpuslar asos vazifasini bajarishi haqida so‘z yuritilgan. Abdulla Qodiriyning “O‘tkan kunlar” asarining xususiy korpusini yaratish lingvistik jihatdan o‘rganilgan.
Сунъий интеллект орқали тилнинг имкониятларидан фойдаланиш борасида замонавий ахборот технологиялари бениҳоя кенг қулайликлар эшигини очди. У инсон онги бажариши мумкин бўлган бир қанча вазифаларнинг бажара олмоқда. Сунъий интеллект маҳсули бўлмиш электрон манбалар инсонга зарар етказмаслик ва инсонларнинг оғирини енгиллаштириш мақсадида яратилмоқда. Чунончи, ўзбек тилининг интернет ва электрон тилга айланиши, миллий тилнинг электрон ресурсларини (ўзбек тили корпуси, электрон луғатлари, интернет саҳи фаларидаги матнлар) ва технологияларини такомиллаштириш долзарб вазифалардандир.