В последние годы роль письма в обучении иностранному язык постепенно увеличивается, и, в некотором смысле, письмо становится резервом в повышении эффективности обучения иностранному языку. Орфографическая грамотность является составной частью общей языковой культуры человека, обеспечивает точность выражения мысли и взаимопонимание при письменном общении, а потому письменная форма литературного языка отличается от устной большей сложностью своей состав. Многие методисты давно пришли к выводу, что орфографическая грамотность учащихся не достигает достаточно высокого уровня. Поэтому учителя ищут причины низкой орфографической грамотности, чтобы принять действенные меры по улучшению ситуации в этом компоненте образования.
Актуальность и востребованность темы диссертации. В мировой практике информатизации, системы электронного документооборота (СЭД) в последние годы рассматриваются и внедряются нс только как системы автоматизации процессов управления, но и как полноценные платформы для создания единого информационного пространства, что, безусловно, расширяет границы их использования и повышает к ним интерес со стороны научного сообщества. В исследованиях ведущих ученых сферы инфоком-муникацонных технологий выделяется востребованность задач достоверного сбора, передачи, анализа, кодирования информации при формировании документов делопроизводства для получения эффективных технологий, повышающих мобильность и производительность СЭД.
Комплексные меры, предпринимаемые Правительством Республики Узбекистан по развитию систем регионально-территориального автоматизированного управления и созданию единого информационного пространства, направлены на широкое внедрение информационных систем, СЭД, баз данных (БД) на основе современных информационно-коммуникационных технологий. В связи с этим, разработка новых методов интеллектуальной обработки информационных ресурсов, используемых для повышения качества передачи информации, позволяющих эффективно обнаруживать и исправлять ошибки в структуре электронного документооборота с наименьшими материальными и временными затратами, отличается особой актуальностью и, вместе с тем, остается нерешенной теоретической и прикладной проблемой, имеющей важное народно-хозяйственное значение.
Требования, предъявляемые к информационным ресурсам и потокам передачи данных, как важного фактора эффективности и качества функционирования СЭД выражаются в обеспечении стабильности, целостности, сохранности и достоверности информации. Одним из важных среди факторов является критерий достоверности информации, обусловливающийся искажением передаваемых сообщений в инфокоммуникационных сетях из-за сбоев и отказов технических средств, различного рода помех в каналах связи, ошибок операторов и систем сканирования, а также распознавания.
Следовательно, особый научный интерес представляет построение эффективных систем контроля достоверности передачи и обработки информации, как приоритетной технологии обработки данных, характерной для условий автоматизированного управления и электронного документооборота на предприятиях и в организациях.
Для существующих методов, несмотря на обеспечение высокого уровня достоверности передачи информации, характерен ряд нерешенных вопросов, в качестве основных из которых можно выделить следующие: при разработке технологий электронного документооборота в структуре пакетов передачи данных значительный объем ресурса расходуется на заголовки, вместе с тем большая часть информации заголовков остается неизменной на протяжении потока передачи целого кадра (возникающая при этом избыточность информации и механизмы обеспечения надежности доставки, заключающиеся, в основном, в послании соответствующего сообщения и повторной передаче пакетов, - приводят при обнаружении и устранении ошибок к дополнительным временным и материальным затратам); кодовые и аппаратурные методы контроля передачи информации ориентированы, в основном, на устранение в управляющих полях пакетов одно- и двукратных гранспозиционных ошибок, однако, при передаче данных возникают искажения в информационных полях, которые зачастую проявляются в виде текстовых ошибок более высокой кратности.
В этой связи, решение задач обеспечение достоверности передачи информации целесообразно рассматривать в двух аспектах.
При решении первого типа задач следует учитывать ошибки, вносимые оператором, сканирующими и другими устройствами, предназначенными для ввода информации. Такого вида ошибки составляют наибольший объем искажений текстовой информации и возникают на Прикладном и Представительском уровнях модели OSI (Open System Interconnection reference model).
Во втором типе задач контроля достоверности информации дополнительно учитываются вероятности искажений, возникающих на Транспортном, Сетевом, Физическом и Канальном уровнях OSI.
Восфсбованность диссертации характеризуется тем, что широкое внедрение IP-технологии в электронном документообороте связано с требующими пристального внимания задачами по обнаружению и устранению ошибок при подготовке и оформлении документов.
Данная исследовательская работа ориентирована на обеспечение реализации законов Республики Узбекистан “Об информатизации”, “Об электронной цифровой подписи”, “Об электронном документообороте”, “Об элек тронной коммерции”, “Об электронных платежах”, а также Постановления Кабинета Министров Республики Узбекистан № 126 от 04.05.2011 года «О мерах по внедрению и использованию единой защищенной электронной почты и системы электронного документооборота в исполнительном аппарате кабинета министров, органах государственного и хозяйственного управления, государственной власти на местах».
Исходя из этого, решение перечисленных задач требует проведения специальных исследований и разработок, связанных с созданием методов и алгоритмов, способных осуществлять контроль достоверности информации за счет использования вложенной избыточности, функционировать в сформированной транспортной среде и устранять существующие недостатки. Данное обстоятельство обусловливает необходимость выделения специального класса алгоритмов для обеспечения достоверности информации на основе нового тина PR-избыточности (property redundancy), определяющейся в зависимости от свойств обрабатываемого объекта.
Цель исследования разработка конструктивных методов, моделей, алгоритмов и систем контроля достоверности информации при передаче и обработке данных на основе механизмов использования PR-избыточности, а также их программно-алгоритмическая реализация при разработке технологий электронного документооборота.
Научная новизна диссертационного исследования заключается в следующем:
разработаны концепции, методологии и программно-алгоритмические основы построения методов, моделей и алгоритмов обеспечения достоверности информации в системах электронного документооборота, выделены классы объектов, характеризующиеся PR-избыточностью, применяемой для обеспечения точности, целостности, оперативности, сжатия, доступности информационных ресурсов в СЭД;
предложены методы и алгоритмы контроля достоверности информации за счет использования искусственной избыточности на основе механизмов линейного, модульного, плоскостного суммирований и определения принадлежности к закодированным подмножествам;
разработаны методы и программный комплекс контроля достоверности информации за счет использования естественной избыточности на основе алгоритмов статистического, арифметического, парсингового кодирования, n-граммного структурированного описания, статистического распознавания и хеширования элементов текстов;
предложены методы и алгоритмы конгроля и коррекции орфографических ошибок в текстах на узбекском языке на основе моделей многоуровневого морфологического анализа и описания п-граммной грамматики;
разработаны методы и алгоритмы конгроля достоверности информации за счет использования структурно-технологической PR-избыточности на основе вложенных логических критериев, баз данных и знаний в составе встроенных экспертных систем;
разработаны методы синтеза алгоритмов контроля достоверности информации в системе интерактивного обнаружения и исправления ошибок при разработке технологий электронного документооборота.
Заключение.
1. Разработанные в диссертации на основе концепций системного анализа, управления и обработки информации конструктивные методы, модели и программно-алгоритмические комплексы обеспечения достоверности информации по принципам использования PR-избыточности позволяют повысить эффективность и производительность СЭД.
2. Оценка современного состояния теории и практики кодовых, аппаратурных и программных методов контроля достоверности передачи информации показала недостаточность использования существующих типов избыточности для обеспечения качественного функционирования СЭД. Принципы использования PR-избыточности электронных документов при разработке прикладных методов и программно-алгоритмических комплексов обеспечения достоверности передачи информации позволили спроектировать инструментарий развития существующих технологий.
3. Методы: линейного, плоскостного и модульного суммирования; кодирования ио правилам Хаффмана, Лемпеля-Зива-Велча, Барроуза-Вилера, арифметического кодирования, статистического распознавания, логического контроля образуют методические основы использования PR-избыточности для расширения возможностей алгоритмов и программных комплексов обеспечения достоверности информации при составлении, передаче и обработке текстов электронных документов.
4. Установлено, что разработанные алгоритмы до 92% обнаруживают все виды ошибок, способны исправлять однократные, двукратные и смежные гранспозиционныс ошибки и ио сравнению с существующим методами снижают трудоемкость и стоимость процедур контроля в 2-3 раза при вероятности ошибок P ≈3 4⋅10−3 а также повышают достоверность информации до трех порядков. Оценки эффективности и решения задач контроля достоверности информации получены ио критерию вероятностей необнаружения ошибок.
5. Для решения задач контроля и коррекции орфографических ошибок в текстах на узбекском языке разработаны методы, алгоритмы и системы, включающие в себя морфологические и n-граммные структурированные модели. Разработанная методика получения частотных характеристик п-грамм на основе статистики вероятностных показателей искажений применяется при систематизации хеш-кодов для парсингового кодирования.
6. Интерполяционные и экстраполяционные методы построения логической и арифметической функции статистического распознавания применены при разработке алгоритмов контроля достоверности изображений элементов текста. Предложены методы контроля достоверности сигнальных характеристик изображений элементов текста в нейросетевой системе обработки информации, которая включает звенья автоматического распознавания и контроля сигналов изображений. Методы и алгоритмы реализуются в структуре системы контроля достоверности информации на основе определения принадлежности признаков и классификации объектов метатекста СЭД ио нечеткой семантической гиперсети.
7. Модели, алгоритмы контроля достоверности информации, основанные на методы словарного, статистического и хеш-кодирования, обеспечивают эффективное применение программно-аппаратной среды параллельных вычислений NVIDIA с использованием стандартных библиотек численного анализа, оптимизированного обмена данными между CPU и GPU.
8. Разработаны архитектура и идентифицированы способы описания программной оболочки системы контроля орфографии на основе древовидного представления n-граммной грамматики в среде фреймворк Сфинкс-4, реализующей программные модули для различных языковых моделей, использующих PR-избы сочность. Созданный вариант системы снижает число необнаруженных ошибок, стоимость реализации и трудоемкость по сравнению с системой контроля орфографии на основе морфологического анализа до двух порядков.
9. Разработанные моделирующие алгоритмы, комплексы программных средств и системы контроля достоверности информации на основе использования PR-избы сочности нашли практическое применение в системах автоматизированной организации учебной среды в ВУЗах; адаптированной передачи, обработки и анализа данных в инфокоммуникационных сетях; СЭД предприятий и учреждений.
10. Разработанные программные комплексы контроля достоверности информации в СЭД и компьютерная система адаптированной передачи, обработки, анализа данных внедрены в производственных условиях в Самаркандском филиале компании «УзТслском» Государственный Комитет связи, информатизации и телекоммуникационных технологий и в совместном предприятии «Лаззат-Мева», полученные соответствующие акты о внедрении подтверждаю! экономическую эффективность результатов диссертации.
The article is scientifically substantiated by the need to create a national corpus of the Uzbek language. Suggestions are given on the structure of the corpus, the program interface, the algorithm of the program, the technology for obtaining the results. Based on the experience of world scientists, the requirements for the data encoding format for the national corpus of the Uzbek language are described. The article says that the interface of the national corpus and the author's corpus has a different design, structure, its improvement is the responsibility of the author of the corpus, and the interface should evoke the first impression of the corpus, an attractive appearance. The interface should take into account decorations that reflect the national color, as well as symbols reflecting the classics or modernity, the interface should reflect the life and work of the artist, the works created by him should open in separate windows, partly in photo galleries. The types of internal and external interface are also discussed. The article analyzes the linguistic module and algorithm and its types from independent components of linguistic programs. The need for an algorithm for phonological, morphological and spelling rules for the formation of the lexical and grammatical code is scientifically substantiated. The importance of language modules, such as phonology, morphology and spelling, in the formation of the linguistic base of the national corpus of the Uzbek language is emphasized.
В статье анализируется лингвистический модуль и алгоритм и его типы из независимых компонентов лингвистических программ. Необходимость в алгоритме фонологических, морфологических и орфографических правил для формирования лексико-грамматического кода научно обоснована. Подчеркивается важность таких лингвистических модулей, как фонология, морфология и орфография, в формировании лингвистической базы национального корпуса узбекского языка.
В статье анализируется лингвистический модуль и алгоритм и его типы из независимых компонентов лингвистических программ. Необходимость в алгоритме фонологических, морфологических и орфографических правил для формирования лексико-грамматического кода научно обоснована. Подчеркивается важность таких лингвистических модулей, как фонология, морфология и орфография, в формировании лингвистической базы национального корпуса узбекского языка.
Эта статья является неотъемлемой частью узбекского словаря, который является одним из великих шедевров огромной культурной и духовной ценности узбекского народа. Потому что в этих именах сложный и противоречивый исторический путь нашего народа, надежды и чаяния широких масс, их мечты, философские, религиозные, духовные, нравственные, образовательные и эстетические взгляды, убеждения, обычаи и традиции, а также уважение к людям. Отражены его любовь и привязанность к своему ребенку. Название зависит от эстетических и этических принципов, пожеланий претендентов, обычаев, религиозных убеждений, мировоззрения, национальной идентичности и так далее. Социальные условия, социальный класс и экономическая деятельность также были важны для именования узбекских семей. Хорошо известно, что большинство имен в узбекском языке – арабские. Они состоят из арабского прилагательного, называющего название движения, и существительных с суффиксом. Кроме того, есть арабские существительные в узбекском языке, которые происходят от иностранных языков. Особенно при именовании детей важно учитывать их орфографические, фонетические и семантические аспекты в соответствии с их первоначальной формой.
Статья посвящена проблеме методики обучения письму и письменной речи студентов в вузах Узбекистана. В ней рассматриваются группы различных письменно-речевых упражнений, направленных на формирование у студентов письменных навыков и умений. Здесь показана роль и тесное взаимоотношение преподавателя русского языка на рассмотрение и уделение внимания к коммуникативно-обучающим функциям, важным построениям учебного занятия на коммуникативно-речевой основе и обучению русскому языку уделять большое внимания к трём основным компонентам: каллиграфической, графической иорфографической.
In Uzbek linguistics, a number of studies have been carried out on automatic translation, the development of the linguistic foundations of the author's corpus, the processing of lexicographic texts and linguistic-statistical analysis. However, the processing of the Uzbek language as the language of the Internet: spelling, automatic processing and translation programs, search programs for various characters, text generation, the linguistic basis of the text corpus and national corpus, the technology of its software is not studied in any monograph. The article discusses such problems as: the transformation of language into the language of the Internet, computer technology, mathematical linguistics, its continuation and the formation and development of computer linguistics, in particular the question of modeling natural languages for artificial intelligence. The Uzbek National Corps plays an important role in enhancing the international status of the Uzbek language.
В данной статье, посвященной анализу частей речи в трудах Махмуда Замахшари, рассматривается вопрос о спряжении глаголов в последней главе «Тасрифу-л-афъал» книги «Мукаддамату-л-адаб». В статье подчеркивается, что глагол является важной частью речи в арабском языке, что невозможно овладеть грамматическими правилами и категориями, не зная его морфологических особенностей, что некоторые части речи, особенно масдары, степени имен прилагательных образуются из глагольных корней.
В книге «Муқаддамату-л-адаб» говорится, что глаголы в арабском языке делятся на глаголы с тремя и четырьмя корнями. а большинство – глаголы с тремя корнями. Глаголы с четырьмя корнями, как и глаголы с тремя корнями склоняются с помощью тех суффиксов и префиксов. При образовании форм настоящего времени, повелительного наклонения, масдаров, причастий применяются те же правила, что и для трехкоренных глаголов.
Махмуд Замахшари, определяя удвоенные глаголы как глаголы в группе трехкорневых, у которых вторые и третьи корни состоят из одной и той же буквы, подчеркивает, что хамза является «здоровой» буквой, а не дефектной, и из-за того, что она является звуком со сложным произношением, её либо меняют с другой буквой, либо иногда её пропускают при произношении и
этим обеспечивают легкость произношения. Ведь вопрос написания хамзы, то есть правописание всегда было сложным вопросом языка. Поскольку Замахшари создал свой труд для быстрого изучения арабского языка и грамматики неарабскими народами, он не стал глубоко входить в суть некоторых сложных вопросов арабского нахва. Ученый в своих трудах отмечая то, что личные окончания прибавляются к глаголам действительного залога, дает образцы спряжение правильных глаголов в прошедшем времени и
говорит, что все правильные глаголы и глаголы, похожие на правильные глаголы, спрягаются в указанном выше порядке.
Замахшари в своем труде дал образец спряжения глаголов страдательного залога и примеры прибавления к таким глаголам личных окончаний, а также спряжения правильных глаголов и глаголов, похожих на правильные глаголы, пустых и дефектных глаголов. В работе ученого не только дано спряжение глаголов, но и даны исключения из правил, в ней также выделена отдельная глава, посвящённая толкованию формы повелительного наклонения в арабском языке. В труде содержится информация об образовании формы повелительного наклонения от глаголов настояще-будущего времени.
В статье подчеркивается, что глаголы удивления образуются только из первой главы трехкорневых глаголов, что такие формы образуются не из глаголов, выражающих физическое несовершенство.
Комментируются способы выражения удивления с помощью удвоенных и дефектных глаголов. В части спряжения глаголов, посвященной изучению инфинитива (масдар), автор останавливается на именах действия, способах образования масдаров из пустых глаголов, дается определение действительным и страдательным причастиям, приводятся примеры их образования. В данной главе дана информация об образовании действительных и страдательных причастий из производных глав и четырехкорневых глаголов, дается толкование форм прилагательных превосходной и сравнительной степеней.
Данная статья посвящена анализу грамматических тем в учебных пособиях, написанные для специализированной школы по языку хинди и лицея восточных языков при ТашГУВ. Дружественные отношения между Узбекистаном и Индией развиваются плодотворно и мы, учителя языка хинди,тоже должны внести свой вклад в развитие этих отношений. Налаживание научного сотрудничества между двумя странами, требует высокого уровня изучения хинди для нашей молодежи. К сожалению, за последние двадцать лет не создавались учебники по языку хинди школьникам и учащимся лицеев. В этой статье, учителям школы и лицеев было предложено ознакомиться с учебными пособиями, подготовленными автором статьи, и поставлена задача создать новые учебники под руководством учителей хинди университета Востоковедения. В статье описывается поэтапное изучение языка хинди школьниками младших и старших классов. Учебник для 5-х классов включает в себя вводные темы по фонетики, орфографии и грамматики языка хинди. Предлагаются различные упражнения и картинки, чтобы заинтересовать учащихся к изучению этого языка, также помогает повысить активность учащихся в процессе изучения языка. Учебные пособия для старшеклассников содержат более подробные фонетические и грамматические источники на хинди; даны различные темы, а именно по географии, истории, тексты, рассказывающие об известных индийских государственных деятелях, о национальных праздниках Индии, грамматические таблицы, словари каждого текста(или поурочные), устные и письменные упражнения, выполнение тестов увеличивает знания по языку хинди.
Мақолада корпуснинг кўп қиррали лингвистик манба сифатидаги асосий аҳамияти, корпус асосан икки турдаги маълумотга эга эканлиги ҳамда унинг турлари таҳлил қилинган. Лексик грамматик кодни шакллантириш мақсадида фонологик, морфонологик ва орфографик қоидалар алгоритми зарурияти илмий асосланган. “Эксперт лингвистик тизим" корпус-менежер тизими ва унинг асосий имкониятлари айтиб ўтилган. Ўзбек тили миллий корпусининг лингвистик базасини тузишда фонологик, морфонологик ва орфографик каби лингвистик модулларнинг аҳамияти, корпусда асосий структурали бирликларни ажратиш ёритилган.