В статье рассматривается трансформация языка в язык Интернета, компьютерные технологии, математическая лингвистика, ее продолжение и становление и развитие компьютерной лингвистики, в частности вопрос моделирования естественных языков для искусственного интеллекта. В частности, исследуется вопрос лингвистического и экстралингвистического разделения специальных тегов для маркировки текстов и их компонентов. Определены требования к кодированию важной текстовой информации. В статье рассматривается основное назначение корпуса как сложного лингвистического источника, а также тот факт, что он в основном содержит два вида информации и ее типы. Национальный корпус, образовательный корпус и параллельный корпус обсуждаются в рамках предмета компьютерной лингвистики. Было подчеркнуто, что их лингвистическая и экстралингвистическая маркировка, разработка алгоритмов формирования корпусов и создание корпусной лингвистической поддержки являются общественной потребностью.
Из истории известно, что персидский язык является одним из древних языков, который не утратил свои языковые особенности. Времена и исторические обстоятельства оказали воздействие на лексику других языков под влиянием персидских слов, а также арабского языка. Лексика узбекского языка не является исключением. С давних времен персидско-таджикский язык параллельно использовался с языками региона Мавераннахр, в частности, узбекским. В результате, многие слова из персидского и арабского языков укоренились в лексическом составе узбекского языка, то есть используются как общеупотребительные слова. Однако, не все общеупотребительные слова используются для выражения одного и того же значения. В узбекском языке есть такие исконно арабские слова, что их семантическая граница имеет другое значение в персидском языке, а в узбекском языке - совершенно другое значение. Интересно то, что этот слово-термин, используемый в обоих языках, относится к слою активной речи в обоих языках. Кроме того, методы образования одинаковых слов в сравниваемых языках должны соответствовать международному стандарту. В результате такого исследования будут уточнены этимологическая основа и рубежное значение производных общеупотребительных слов персидского и узбекского языков. Например, в узбекском языке существуют такие слова, как ‘мухториятʼ, ‘маъмуриятʼ, ‘маъмурʼ, ‘муқобилʼ, ‘ҳакамʼ, ‘ташрифʼ, ‘инсонпарварликʼ, ‘дорулфунунʼ, ‘хусусийлаштиришʼ, ‘иқтисодиётʼ, ‘жаридаʼ, ‘маълумотномаʼ, ‘режаʼ, ‘дастурʼ, ‘инқилобʼ и многие другие, основа которых является арабским заимствованием, но не полностью отражают их значение из арабского языка. Даже данные слова являются общеупотребительными словами, которые на сегодняшний день были предложены вместо русско-международного слова-термина и уже укоренились в языке, а также отражают терминологические особенности. Семантическое и функциональное изучение таких слов служит развитию лексикологии узбекского языка. Причина этому то, что в 1989 году, когда узбекскому языку был присвоен статус «государственного языка», была поставлена задача позаботиться о его престиже. Соответственно, цель статьи является проведения структурно-семантического анализа персидских общеупотребительных слов-терминов, используемых сегодня в узбекском языке.