Актуальность и востребованность темы диссертации. Стремительные темпы роста мирового информационного пространства неразрывно приводят к повышению уровня сложности процессов обработки информации. Становятся очевидными недостаточность и неадекватность традиционных математических аппаратов при решении задач анализа, выбора, классификации и прогнозирования по данным, описывающим процессы глобального социально-экономического развития. В связи с ежедневно возрастающими информационными потребностями человечества усиливаются требования к точности и оперативности обработки информации. Это обосновывает создание учеными новых подходов к обработке больших массивов данных со сложной структурой.
Для обеспечения интеграции Республики в глобальное информационное пространство, широкого внедрения соременных информационнокоммуникационных технологий в рамках требований к развитию социально-экономической сферы реализуются многочисленные научно-исследовательские работы.
Сложные интегрированные системы характеризуются большим числом входных-выходных данных и элементами, отношениям между которыми свойственна разнотипность и нелинейность, а часть информации о системе представляется в качественном, численном и количественном виде. В результате усложняется вывод закономерностей распределения параметров влияния на систему, а в некоторых случаях, например, когда предъявляются жесткие ограничения на время, вывести закономерность не представляется возможным.
Стремительное развитие современных информационнокоммуникационных технологий привело к повышению эффективности управления социально-экономическими процессами, экономии материальных, финансовых, временных и трудовых затрат. Это является одной из причин повышенного научного и практического интереса к методам интеллектуальной обработки данных при поддержке принятия решений. К методам интеллектуального анализа данных относятся, основанные на приближенных решениях модели нечеткого вывода, нейронных и гибридных нейронных сетей, иммунные, генетические и, алгоритмы имитирующие поведение животных, и в общем воплощающие в себе комбинированные модели средства «Мягких вычислений».
Расширение сферы охвата проблем в задачах управления процессами, а также развитие и усложнение состава функций, выполняемых при управлении, ставит требование достижения результатов поддержки принятия решений на уровне человеческого суждения. Нечеткие модели, в свою очередь, позволяют описывать процессы и события реального мира лингвистическими термами на естественных языках, а механизм нечетких решений является прозрачным и понятным для человека. Эти очевидные преимущества расширяют возможности решения задач в различных прикладных отраслях науки, техники и экономики, связанных с решением задач анализа, выбора, принятия решений, классификации и прогнозирования в процессе автоматического управления и мониторинга.
Вышеуказанные утверждения и выделенные проблемы обосновывают актуальность поставленной в настоящем исследовании цели по решению задач создания систем интеллектуального анализа данных на основе моделей теории нечетких множеств и снижения погрешностей в альтернативах для поддержки принятия решений за счет правильного выбора и настройки параметров нечеткой модели.
Данная исследовательская работа служит для обеспечения выполнения задач, поставленных законами Республики Узбекистан «Об информатизации», «Об электронном документообороте», Постановлением Президента Республики Узбекистан ПП-1989 «О мерах по дальнейшему развитию Национальной информационно-коммуникационной системы Республики Узбекистан» от 27 июня 2013 года, а также постановлением Кабинета Министров Республики Узбекистан №355 «О мерах по внедрению оценки состояния развития информационно-коммуникационных технологий в Республике Узбекистан» от 31 декабря 2013 года.
Цель исследования разработка методов, моделей и программноалгоритмического обеспечения систем интеллектуального анализа данных на основе механизмов математического аппарата теории нечетких множеств для поддержки решений управленческих задач целевого мониторинга слабоформализованных процессов и объектов, а также внедрение результатов исследований в системах поддержки принятия слабоструктурированных решений.
Научная новизна исследования заключается в следующем:
разработан метод построения баз правил для реализации нечеткой модели при создании систем мониторинга и интеллектуального анализа поддержки принятия решений;
разработана математическая модель построения стратегии принятия слабоструктурированных решений при логико-лингвистическом отображении для создания систем целевого мониторинга и интеллектуального анализа данных;
разработана методика настройки параметров нечетких баз знаний на основе модифицированного градиентного метода и марковской модели для повышения эффективности механизма поддержки принятия управленческих решений системы целевого мониторинга и интеллектуального анализа данных;
предложено описание методов и моделей интеллектуального анализа данных на основе нечеткого подхода в слабоформализованных задачах;
разработаны рекуррентные уравнения на основе аппарата теории нечетких множеств для нахождения оптимальной стратегии в нечетких моделях целевого мониторинга;
разработаны принципы, критерии и требования построения интеллектуальных систем принятия управленческих решений на основе методов и алгоритмов интеллектуального анализа данных;
разработаны модели и алгоритмы решения задач прогнозирования и классификации на основе интеллектуального анализа данных при принятии управленческих решений.
ЗАКЛЮЧЕНИЕ
В диссертационной работе проведен системный анализ, разработаны методы, модели и алгоритмы интеллектуального анализа данных, реализующие комплексный подход к построению систем поддержки принятия решений.
Основными результатами исследований являются следующие:
1. Анализ научно-технической литературы, раскрывающей современное состояние проблем построения систем интеллектуального анализа данных на основе нечетко-множественного подхода позволили сформировать и обосновать концептуальные принципы, конструктивные подходы, методы, модели и алгоритмы построения систем поддержки принятия решений.
2. Сформулирована математическая постановка задач принятия слабоструктурированных управленческих решений и нахождения оптимальных решений сложно структурированных задач, что способствует повышению эффективности обеспечения альтернатив решений для системы поддержки принятия решений в целевом мониторинге.
3. Разработан метод построения нечеткого вывода для модели идентификации при построении систем целевого мониторинга и интеллектуального анализа данных, в которых реализованы модели параметрической и структурной идентификации. Для параметрической идентификации разработаны модели идентификации типа Синглтона и Мамдани, модель структурной идентификации реализована на основе алгоритмов кластерного анализа и методов субъективного разделения, основной функцией которых является выявление структурных характеристик нечеткой модели при построении базы нечетких правил, которые служат методической основой разработки моделей на основе подходов теории нечетких множеств.
4. Разработанный метод и алгоритм решения задачи построения нечеткой модели с эффективной реализацией базы нечетких правил обосновывает возможность создания эффективно функционирующих интеллектуальных систем анализа данных.
5. Для повышения эффективности функционирования систем целевого мониторинга, интеллектуального анализа данных при работе с большими массивами входных данных на основе применения метода настройки параметров при нечетком подходе разработан градиентный метод параметрической идентификации. Применение таких подходов повышает достоверность решений слабоформализованных задач моделями нечеткомножественного подхода и элементами базы нечетких правил.
6. Предложено пять моделей принятия решений с описанием нечетких множеств и событий для разрешенных состояний среды при реализации интеллектуальных систем. Разработаны методы и модели отображения исходных данных слабоформализованных задач в нечетко-множественном виде, оценки альтернатив, поиска и нахождения оптимальных стратегий. Разработана марковская модель с нечетким подходом для решения задачи классификации в системах поддержки принятия решений. Приведённые методы и модели определяют характер слабоформализованных задач, и позволяют повысить точность и эффективность формирования альтернатив решений в системах поддержки принятия решений.
7. На основе предложенных методов и моделей разработан алгоритм решения задачи прогнозирования в хлопководстве и осуществлена его программная реализация. Предложен десятишаговый алгоритм построения нечеткой модели, результаты прогнозирования по которому на 0,5-3% эффективнее по сравнению с существующими алгоритмами. В частности, достигнута точность результатов 96,5-99,8% при решении задачи прогнозирования себестоимости и урожайности хлопка сырца.
8. Разработан алгоритм на основе методов настройки параметров нечеткой модели для реализации поддержки принятия решений и обоснованы положительные результаты. Точность классификации объектов в модельных задачах (IRIS, WINE, «Собака-волк», диагностике онкологических заболеваний) составила 97-100%, в прикладных задачах (прогноз урожайности хлопка-сырца, выбор соответсвующего сорта хлопчатника, классификации в системе документообороте) - 92-98%.
9. Программные средства, ориентированные на реализацию систем поддержки принятия решений на основе разработанных подходов теории нечеткого множества были внедрены в Министерстве высщего и средного специального образования Республики Узбекистан, Управлении сельского и водного хозяйства Джизакского вилоята, на которые получены акты внедрения, подтверждающие экономический эффект от реализации результатов иследований диссертации.
Data advances have influenced each part of human movement and play a possible part to play in the field of schooling and preparing, uniquely, in distance training to change it into an inventive type of involvement. The need of new advances in showing learning measure develops further and quicker. The data age turns into a period of information giving sound and unequaled attainability to disclosure, trade of data, correspondence and investigation to fortify the showing learning measure. Data innovations help in advancing chances of information sharing all through the world. These can help the instructors and understudies having forward-thinking data and information. Exact and right data is vital for compelling educating and learning; and data advances are "set of instruments that can assist with giving the perfect individuals the ideal data at the ideal time." Understudies are free and they can settle on most ideal choices about their examinations, learning time, spot and assets. Understudies can work in collective and intelligent learning conditions adequately imparting, sharing data and trading thoughts and learning encounters with all in the climate.
Актуальность и востребованность темы диссертации. В настоящее время прилагаются большие усилия для понимания структуры нейтроноизбыточных гало-ядер 6Не, "Li, "Вс, |9С, 31Ne и др. Эти ядра обладают необычными свойствами, такими как малая энергия связи и большая протяженность одно- и двухнейтронных орбиталей с малыми угловыми моментами (1=0,1). Обычно эти ядра моделируются как кор плюс несколько нейтронов. Кроме того, ни одна из двухчастичных подсистем трехчастичных гало-ядер 6Не, "Li, 14Вс не связана - свойство, присущее Борромейским системам. Наряду с такими статическими характеристиками гало-ядер, как энергия и зарядовый радиус, большой интерес представляют процессы бета-распада и электромагнитных переходов в двух- и трехчастичные континуум-каналы. Данные процессы дают ценную информацию о внутренней структуре и гало-свойствах этих ядер, проявляющихся в изучаемых процессах, поскольку рассматриваемые переходы происходят именно в гало-частях этих систем. Более того, имеются экспериментальные данные по процессам бета-переходов гало-ядер 6Не и "Li в двухчастичные дейтронные континуум-каналы, которые требуют тщательного теоретического анализа. Бета-переходы однонейтронных гало-ядер "Вс, |9С, 3lNc в двухчастичные кор плюс протон континуум-каналы также могут давать информацию о новых гало-свойствах этих систем в дополнение к их статическим характеристикам.
Среди гало-ядер особо выделяется ядро Li, отличающееся от других ядер тем, что дополнительно может распадаться на трехчастичный 9Ь1+протон+нейтронный континуум-канал. Так как этот переход представляет собой довольно сложный процесс, теоретическая модель позволит получить ценную информацию об изучаемом процессе и трехчастичной структуре гало-ядра "Li.
Первое возбужденное состояние ядра 6Li является изобар-аналоговым состоянием гало-ядра 6Не. Благодаря процессу Ml-перехода данного состояния в дейтронный континуум-канал можно получить информацию о его гало-свойствах, аналогичных свойствам ядра 6Не. Установленные при этом оценки для ширины Ml-перехода могут быть сопоставлены с имеющимися экспериментальными данными. Данный процесс дополнительно может быть использован при изучении эффектов нарушения сохранения четности в сильном взаимодействии.
Модели ядро-ядерного взаимодействия, содержащие запрещенные состояния в низших волнах, предложены еще в 70-е годы прошлого столетия для адекватного учета принципа Паули в качестве альтернативы к потенциальным моделям с отталкивающим кором на малых расстояниях. Они имеют микроскопическое обоснование, т.е. опираются на нуклонные степени свободы. Однако роль этих запрещенных состояний в структуре ядра до сих пор не изучена надлежащим образом. Особенно важен этот вопрос для ядер, содержащих несколько альфа-кластеров. Исключение составляет Московская модель нуклон-нуклонного потенциала с запрещенными состояниями в низших волнах. Ее свойства в трехнуклонных ядрах изучены достаточно подробно. С другой стороны, роль запрещенных состояний в Московской модели совсем другая: она связана с кварковой структурой нуклона. А в легких ядрах, состоящих из нескольких ядерных кластеров, модели с запрещенными состояниями введены исключительно для адекватного учета принципа Паули, которые стали особенно актуальными в связи с открытием гало-структуры некоторых легких ядер. Изучение гало свойств легких ядер в электромагнитных и бета-процессах с использованием двух альтернативных потенциальных моделей, с корами и с запрещенными состояниями, поможет выяснить особые свойства этих моделей.
Ядра, состоящие из нескольких альфа-кластеров, играют исключительно важную роль в астрофизике. Хотя две альфа-частицы не связаны, ядра из трех (12С) и четырех (16О) альфа-кластеров обладают большими энергиями связи, поэтому принадлежат к классу Борромейских ядер. Для таких ядер особенно остро стоит проблема получения реалистических волновых функций как связанных, так и континуум-состояний, которые можно применять для расчета сечения астрофизических реакций синтеза. С другой стороны, в последнее время изучение структуры этих ядер стало еще более актуальным в связи с предсказанием существования «альфа-конденсации».
Развиваемые в диссертации модели легких ядер и получаемые на их основе результаты крайне важны для оптимального управления термоядерными реакциями в плазме d+6Li, происходящими с образованием легких ядер 3Н, 3Нс, 4Не, 7Li и 7Ве. Неопределенности в дифференциальном сечении реакций сильно влияют на кинетику термоядерного реактора, поэтому для оптимального управления этими процессами необходимо развивать теоретические модели с высокой точностью. Вариационные методы на основе гауссового и Лагранж-меш базисов необходимы для расчета волновых функций, которые используются для оценки скоростей указанных реакций с высокой точностью.
Целью исследования является выяснение особенностей потенциальной модели межкластерного взаимодействия для связанной и континуум-структуры легких ядер и для описания процессов с их участием при низких энергиях.
Научная новизна диссертационного исследования:
впервые показана сверхчувствительность энергий компактных основного 0' и первого возбужденного 2' состояний ядра 12С к описанию запрещенных принципом Паули аа-состояний, которая приводит к появлению так называемых «почти запрещенных состояний» в трехчастичном функциональном пространстве;
впервые R-матричный подход развит в комбинации с пропагатор-методом для изучения трехчастичной континуум-структуры легких ядер 6Нс и |4Ве в методе гиперсферических гармоник на Лагранж-меш базисе; показано, что для достижения сходимости результатов необходимо сшивать волновую функцию с асимптотикой на очень больших (примерно 1000 фм) расстояниях; рассчитаны диагональные и собственные фазовые сдвиги трехчастичной матрицы столкновения, предсказано существование нового резонанса |4Ве(2+) около ЕВОЗ=3.4 МэВ;
получены теоретические оценки для вероятности бета-распада гало-ядра 6Не в a+d континуум-канал за единицы времени и энергии; впервые показано, что для воспроизведения данных крайне необходимо использовать микроскопически обоснованные ad-потенциалы с запрещенным состоянием в S-волне, воспроизводящие фазовые сдвиги и энергии основного состояния; показано также, что сходимость матричных элементов перехода требует знания вольновых функций вплоть до 30 фм и компоненты гипермомента вплоть до К=24; показано, что гало-эффекты играют важную роль при описании процесса из-за сильного взаимного подавления внутренних и внешних частей матричных элементов;
впервые получены теоретические оценки для вероятности Ml-перехода изобар-аналогового состояния 6Li(0’) в а+ d континуум-канал за единицы времени и энергии; показано, что только при использовании потенциала с запрещенным состоянием интегральная ширина перехода 0.9 мэВ хорошо согласуется с результатами предыдущих упрощенных вычислений; показано также, что сходимость результатов обусловливает брать границу эффективного интеграла 25-30 фм, а компоненты гипермомента вплоть до К=20;
впервые получены теоретические оценки для вероятности бета-перехода гало-ядра "Li в 9Li+d континуум-канал за единицы времени и энергии, полностью воспроизводящие новые данные; показано, что в этом случае основную роль играет резонанс в S-волне в системе 9Li+d при энергии около 0.7 МэВ независимо от того, используется потенциал с кором или с запрещенными состояниями; 9Li+d-пoтeнциaл, который воспроизводит этот резонанс, хорошо описывает форму и абсолютные значения вероятности перехода с помощью поглощающего мнимого члена из-за открытых каналов распада;
впервые получены теоретические оценки для вероятностей бета-перехода гало-ядра "Li в 9Li+p+n трехчастичный континуум-канал за единицы времени и энергии;
впервые получены теоретические оценки для вероятностей бета-распадов однонейтронных гало-ядер "Вс, 19С и 31Ne в двухчастичные континуум-каналы в рамках кластерной модели; показано, что вероятности бета-переходов сильно чувствительны к энергии отделения валентного нейтрона.
ЗАКЛЮЧЕНИЕ
1. Показана сверхчувствительность энергий компактных основного 0' и первого возбужденного 2’ состояний ядра 12С к описанию запрещенных принципом Паули аа-состояний.
2. Впервые R-матричный подход развит для изучения трехчастичной континуум-структуры легких ядер в методе гиперсферических гармоник на Лагранж-меш базисе с применением пропагатор-техники. Установлено, что R-матрицу, рассчитанную на границе внутренней области, нужно продолжать вплоть до больших расстояний (около 1000 фм), где волновая функция сшивается с асимптотикой. Метод был применен к анализу трехчастичной континуум-структуры гало-ядер 6Не и |4Вс. Рассчитаны диагональные и собственные фазовые сдвиги трехчастичной матрицы столкновения, предсказано существование нового резонанса |4Ве(2+) при ЕВОЗ=3.4 МэВ.
3. Показано, что для воспроизведения данных по бета-распаду гало-ядра 6Не в a+d континуум-канал крайне необходимо использовать микроскопически обоснованные ad-потенциалы с запрещенным состоянием в S-волне, воспроизводящие фазовые сдвиги и энергии основного состояния. В этом случае вклады внутренних и гало-компонент Гамов-Теллеровских матричных элементов почти полностью подавляют друг друга, в результате суммарная вероятность перехода строго занижена в соответствии с экспериментом.
4. Метод гиперсферических гармоник на Лагранж-меше применен к изучению процесса Ml-перехода изобар-аналогового состояния 6Li(0 ) в основное состояние 6Li(l+) и a+d континуум-канал в трехчастичном формализме. Теоретическая оценка 7.49 эВ для ширины Ml-перехода в основное состояние хорошо согласуется с экспериментальным значением 8.19+0.19 эВ, а оценка магнитного момента ядра 6Li ц=0.86 в единицах ядерного магнетона слегка превышает экспериментальное значение 0.82. Получены теоретические оценки для вероятности Ml-перехода изобар-аналогового состояния 6Li(0+) в a+d континуум за единицы времени и энергии. Интегральная ширина перехода 0.9 мэВ хорошо согласуется с результатами предыдущих упрощенных вычислений. Показано, что изобар-аналоговое состояние 6Li(0+), как и ядро 6Не, имеет ярко выраженную гало-структуру.
5. Получены теоретические оценки для вероятности бета-перехода гало-ядра 11 Li в 9Li+d континуум-канал за единицы времени и энергии, полностью согласующиеся с новыми экспериментальными данными. Найдено, что в этом случае основную роль играет резонанс в S-волне в системе 9Li+d при энергии около 0.7 МэВ, независимо от того, используется ли потенциал с кором или с запрещенными состояниями. При этом гало-компоненты строго доминируют над внутренними компонентами. Для интегральной вероятности процесса полученная оценка 7.3 Е-3 с'1 находится внутри коридора ошибок экспериментальных данных 8.8+1.9 Е-3 с'1 в области энергии Е > 0.2 МэВ.
6. Получены теоретические оценки для коэффициента ветвления (вероятности) уникального бета-перехода гало-ядра "Li в 9Li+p+n трехчастичный континуум-канал в рамках кластерной потенциальной модели. Разумные оценки для коэффициента ветвления и энергетического распределения распада получены с помощью модифицированной кулоновской волновой функции, которая имитирует реальную волновую функцию. Полученные оценки для коэффициента ветвления находятся в интервале 0.8Е-10 - 2.2Е-10, которые намного меньше, чем для бета-распада ядра 6Не в дейтронный канал (2.6 ±1.3)Е-6. Причиной малости коэффициента ветвления для первого процесса является малое Q-значение, которое сильно ограничивает фазовое пространство. Полная вероятность бета-перехода имеет порядок 1O'S с'1.
7. Получены теоретические оценки для вероятностей бета-распада однонейтронных гало-ядер иВе, |9С и 31Ne в двухчастичные континуум-каналы в рамках кластерной потенциальной модели. Для интегральной вероятности бета-перехода гало-ядра "Вс в "’Вс+р континуум-канал получена оценка 1.5Е-9 с'1, а для ядра |9С - 2.7Е-12 с'1. Соответствующие коэффициенты ветвления равны З.ОЕ-8 для ядра 11 Вс и 1.8Е-13 - для ядра |9С. Полная вероятность бета-перехода ядра 3lNc в 30Ne+p континуум-канал может варьировать от О до 10'6 с'1 в зависимости от значения энергии отделения валентного нейтрона, которое в настоящее время плохо определено из эксперимента. Для энергии отделения в интервале 0.25 - 0.35 МэВ полная вероятность перехода оценивается в З.ЗЕ-1О с’1, которая приводит к оценке 1.6Е-12 для коэффициента ветвления.
Главный итог проведенных исследований сводится к тому, что развитые в данной работе потенциальные модели могут не только адекватно описать существующие экспериментальные данные в области низкоэнергетической ядерной физики, но и предсказать новые свойства легких ядер, если параметры моделей выбираются из условия согласования с микроскопическими свойствами легких ядер.
В статье рассматриваются опыт зарубежных стран в сфере применения цифровых технологий в противодействии коррупции. Определено, что в ряде иностранных государств наряду с уже апробированными технологиями (электронное правительство, информационные и краудсорсинговые платформы) активно внедряются современные информационные технологии такие как: технологии обработки больших объемов данных (Big Data), распределенной книги (DLT), блокчейн, интеллектуального анализа данных (Data Mining), интеллектуального анализа в сфере противодействия коррупции при проведении государственных закупок, аналитические инструменты для аудиторов (Forensic Tools), электронные системы верификации деклараций о доходах, расходах, активах и интересах государственных служащих, электронные технологии противодействия коррупции при осуществлении электорального процесса и др.
Определено, что преимущества цифровизации могут осуществляться только при наличии соответствующих инфраструктур, положений, финансовых ресурсов и персонала, подготовленного по вопросам ИКТ.
Обосновано, что процессы цифровизации правоохранительной деятельности способствуют повышению эффективности проводимой антикоррупционной политики, обеспечивают ее эффективность, объективность, позволяют снижению расходов на поддержание правопорядка, минимизируют влияние человеческого фактора в указанной сфере.
Отмечено, что технологии, основанные на нейронных сетях и децентрализованных, синхронизированных базах данных фундаментально изменят характер государственного управления и способны значительно снизить риски коррупционных правонарушений в будущем
Актуальность и востребованность темы диссертации. В мировой практике информатизации, системы электронного документооборота (СЭД) в последние годы рассматриваются и внедряются нс только как системы автоматизации процессов управления, но и как полноценные платформы для создания единого информационного пространства, что, безусловно, расширяет границы их использования и повышает к ним интерес со стороны научного сообщества. В исследованиях ведущих ученых сферы инфоком-муникацонных технологий выделяется востребованность задач достоверного сбора, передачи, анализа, кодирования информации при формировании документов делопроизводства для получения эффективных технологий, повышающих мобильность и производительность СЭД.
Комплексные меры, предпринимаемые Правительством Республики Узбекистан по развитию систем регионально-территориального автоматизированного управления и созданию единого информационного пространства, направлены на широкое внедрение информационных систем, СЭД, баз данных (БД) на основе современных информационно-коммуникационных технологий. В связи с этим, разработка новых методов интеллектуальной обработки информационных ресурсов, используемых для повышения качества передачи информации, позволяющих эффективно обнаруживать и исправлять ошибки в структуре электронного документооборота с наименьшими материальными и временными затратами, отличается особой актуальностью и, вместе с тем, остается нерешенной теоретической и прикладной проблемой, имеющей важное народно-хозяйственное значение.
Требования, предъявляемые к информационным ресурсам и потокам передачи данных, как важного фактора эффективности и качества функционирования СЭД выражаются в обеспечении стабильности, целостности, сохранности и достоверности информации. Одним из важных среди факторов является критерий достоверности информации, обусловливающийся искажением передаваемых сообщений в инфокоммуникационных сетях из-за сбоев и отказов технических средств, различного рода помех в каналах связи, ошибок операторов и систем сканирования, а также распознавания.
Следовательно, особый научный интерес представляет построение эффективных систем контроля достоверности передачи и обработки информации, как приоритетной технологии обработки данных, характерной для условий автоматизированного управления и электронного документооборота на предприятиях и в организациях.
Для существующих методов, несмотря на обеспечение высокого уровня достоверности передачи информации, характерен ряд нерешенных вопросов, в качестве основных из которых можно выделить следующие: при разработке технологий электронного документооборота в структуре пакетов передачи данных значительный объем ресурса расходуется на заголовки, вместе с тем большая часть информации заголовков остается неизменной на протяжении потока передачи целого кадра (возникающая при этом избыточность информации и механизмы обеспечения надежности доставки, заключающиеся, в основном, в послании соответствующего сообщения и повторной передаче пакетов, - приводят при обнаружении и устранении ошибок к дополнительным временным и материальным затратам); кодовые и аппаратурные методы контроля передачи информации ориентированы, в основном, на устранение в управляющих полях пакетов одно- и двукратных гранспозиционных ошибок, однако, при передаче данных возникают искажения в информационных полях, которые зачастую проявляются в виде текстовых ошибок более высокой кратности.
В этой связи, решение задач обеспечение достоверности передачи информации целесообразно рассматривать в двух аспектах.
При решении первого типа задач следует учитывать ошибки, вносимые оператором, сканирующими и другими устройствами, предназначенными для ввода информации. Такого вида ошибки составляют наибольший объем искажений текстовой информации и возникают на Прикладном и Представительском уровнях модели OSI (Open System Interconnection reference model).
Во втором типе задач контроля достоверности информации дополнительно учитываются вероятности искажений, возникающих на Транспортном, Сетевом, Физическом и Канальном уровнях OSI.
Восфсбованность диссертации характеризуется тем, что широкое внедрение IP-технологии в электронном документообороте связано с требующими пристального внимания задачами по обнаружению и устранению ошибок при подготовке и оформлении документов.
Данная исследовательская работа ориентирована на обеспечение реализации законов Республики Узбекистан “Об информатизации”, “Об электронной цифровой подписи”, “Об электронном документообороте”, “Об элек тронной коммерции”, “Об электронных платежах”, а также Постановления Кабинета Министров Республики Узбекистан № 126 от 04.05.2011 года «О мерах по внедрению и использованию единой защищенной электронной почты и системы электронного документооборота в исполнительном аппарате кабинета министров, органах государственного и хозяйственного управления, государственной власти на местах».
Исходя из этого, решение перечисленных задач требует проведения специальных исследований и разработок, связанных с созданием методов и алгоритмов, способных осуществлять контроль достоверности информации за счет использования вложенной избыточности, функционировать в сформированной транспортной среде и устранять существующие недостатки. Данное обстоятельство обусловливает необходимость выделения специального класса алгоритмов для обеспечения достоверности информации на основе нового тина PR-избыточности (property redundancy), определяющейся в зависимости от свойств обрабатываемого объекта.
Цель исследования разработка конструктивных методов, моделей, алгоритмов и систем контроля достоверности информации при передаче и обработке данных на основе механизмов использования PR-избыточности, а также их программно-алгоритмическая реализация при разработке технологий электронного документооборота.
Научная новизна диссертационного исследования заключается в следующем:
разработаны концепции, методологии и программно-алгоритмические основы построения методов, моделей и алгоритмов обеспечения достоверности информации в системах электронного документооборота, выделены классы объектов, характеризующиеся PR-избыточностью, применяемой для обеспечения точности, целостности, оперативности, сжатия, доступности информационных ресурсов в СЭД;
предложены методы и алгоритмы контроля достоверности информации за счет использования искусственной избыточности на основе механизмов линейного, модульного, плоскостного суммирований и определения принадлежности к закодированным подмножествам;
разработаны методы и программный комплекс контроля достоверности информации за счет использования естественной избыточности на основе алгоритмов статистического, арифметического, парсингового кодирования, n-граммного структурированного описания, статистического распознавания и хеширования элементов текстов;
предложены методы и алгоритмы конгроля и коррекции орфографических ошибок в текстах на узбекском языке на основе моделей многоуровневого морфологического анализа и описания п-граммной грамматики;
разработаны методы и алгоритмы конгроля достоверности информации за счет использования структурно-технологической PR-избыточности на основе вложенных логических критериев, баз данных и знаний в составе встроенных экспертных систем;
разработаны методы синтеза алгоритмов контроля достоверности информации в системе интерактивного обнаружения и исправления ошибок при разработке технологий электронного документооборота.
Заключение.
1. Разработанные в диссертации на основе концепций системного анализа, управления и обработки информации конструктивные методы, модели и программно-алгоритмические комплексы обеспечения достоверности информации по принципам использования PR-избыточности позволяют повысить эффективность и производительность СЭД.
2. Оценка современного состояния теории и практики кодовых, аппаратурных и программных методов контроля достоверности передачи информации показала недостаточность использования существующих типов избыточности для обеспечения качественного функционирования СЭД. Принципы использования PR-избыточности электронных документов при разработке прикладных методов и программно-алгоритмических комплексов обеспечения достоверности передачи информации позволили спроектировать инструментарий развития существующих технологий.
3. Методы: линейного, плоскостного и модульного суммирования; кодирования ио правилам Хаффмана, Лемпеля-Зива-Велча, Барроуза-Вилера, арифметического кодирования, статистического распознавания, логического контроля образуют методические основы использования PR-избыточности для расширения возможностей алгоритмов и программных комплексов обеспечения достоверности информации при составлении, передаче и обработке текстов электронных документов.
4. Установлено, что разработанные алгоритмы до 92% обнаруживают все виды ошибок, способны исправлять однократные, двукратные и смежные гранспозиционныс ошибки и ио сравнению с существующим методами снижают трудоемкость и стоимость процедур контроля в 2-3 раза при вероятности ошибок P ≈3 4⋅10−3 а также повышают достоверность информации до трех порядков. Оценки эффективности и решения задач контроля достоверности информации получены ио критерию вероятностей необнаружения ошибок.
5. Для решения задач контроля и коррекции орфографических ошибок в текстах на узбекском языке разработаны методы, алгоритмы и системы, включающие в себя морфологические и n-граммные структурированные модели. Разработанная методика получения частотных характеристик п-грамм на основе статистики вероятностных показателей искажений применяется при систематизации хеш-кодов для парсингового кодирования.
6. Интерполяционные и экстраполяционные методы построения логической и арифметической функции статистического распознавания применены при разработке алгоритмов контроля достоверности изображений элементов текста. Предложены методы контроля достоверности сигнальных характеристик изображений элементов текста в нейросетевой системе обработки информации, которая включает звенья автоматического распознавания и контроля сигналов изображений. Методы и алгоритмы реализуются в структуре системы контроля достоверности информации на основе определения принадлежности признаков и классификации объектов метатекста СЭД ио нечеткой семантической гиперсети.
7. Модели, алгоритмы контроля достоверности информации, основанные на методы словарного, статистического и хеш-кодирования, обеспечивают эффективное применение программно-аппаратной среды параллельных вычислений NVIDIA с использованием стандартных библиотек численного анализа, оптимизированного обмена данными между CPU и GPU.
8. Разработаны архитектура и идентифицированы способы описания программной оболочки системы контроля орфографии на основе древовидного представления n-граммной грамматики в среде фреймворк Сфинкс-4, реализующей программные модули для различных языковых моделей, использующих PR-избы сочность. Созданный вариант системы снижает число необнаруженных ошибок, стоимость реализации и трудоемкость по сравнению с системой контроля орфографии на основе морфологического анализа до двух порядков.
9. Разработанные моделирующие алгоритмы, комплексы программных средств и системы контроля достоверности информации на основе использования PR-избы сочности нашли практическое применение в системах автоматизированной организации учебной среды в ВУЗах; адаптированной передачи, обработки и анализа данных в инфокоммуникационных сетях; СЭД предприятий и учреждений.
10. Разработанные программные комплексы контроля достоверности информации в СЭД и компьютерная система адаптированной передачи, обработки, анализа данных внедрены в производственных условиях в Самаркандском филиале компании «УзТслском» Государственный Комитет связи, информатизации и телекоммуникационных технологий и в совместном предприятии «Лаззат-Мева», полученные соответствующие акты о внедрении подтверждаю! экономическую эффективность результатов диссертации.
Объекты исследования: юрские отложения Бухаро-Хивинского региона.
Цель работы: разработка методики комплексной интерпретации геологогеофизических данных и ее применение при изучении формаций, структуры и строения юрского разреза Бухаро-Хивинского региона, включая трактовку нового представления о геологическом развитии седиментационного бассейна и выявление латеральных неоднородностей.
Методы исследования: Комплексный анализ материалов геологогеофизических исследований, включая данные бурения, геофизических исследований скважин, сейсморазведки, а также разработанная методика комплексной интерпретации геолого-геофизических данных, включая математическое моделирование сейсмических волновых полей.
Полученные результаты и их новизна: Предложена новая схема методики комплексной интерпретации геолого-геофизических данных, включая математическое моделирование сейсмических волновых полей. Проведено циклостратиграфическое и сейсмостратиграфическое расчленение разреза юрского комплекса. Изучена история геологического развития Бухаро-Хивинского региона в юрское время.
Практическая значимость: Разработанная методика комплексной интерпретации геолого-геофизических данных может быть применима при детальном изучении геологического строения других нефтегазоперспективных регионов, со схожими геолого-тектоническими условиями. На основе проведенного сейсмоформационного анализа и другой априорной информации выявлены зоны перспективные на открытие ловушек нефти и газа.
Степень внедрения и экономическая эффективность: Разработанная методика комплексной интерпретации геолого-геофизических данных внедрена в учебный процесс при проведении занятий на геологическом факультете Национального университета Узбекистана. Даны рекомендации на проведение детализационных сейсморазведочных работ на выявленных перспективных участках, с целью обнаружения ловушек и залежей углеводородов.
Область применения: нефтегазовая отрасль Республики Узбекистан, геологоразведочные предприятия, система образования.
Цель данного исследования заключается в анализе и сравнении доступности данных о государственных услугах на порталах государственных услуг и других официальных порталах Узбекистана, Казахстана и Кыргызстана. Исследование включает анализ основных показателей эффективности работы Центра Государственных Услуг каждой из трех стран, основываясь на открытых данных. Основное внимание уделено самым востребованным услугам и количеству заявок на них. Была проведена оценка полноты, точности и доступности информации на государственных порталах, а также анализировались возможности просмотра данных за разные периоды времени и разделения данных по различным критериям. Результаты позволили выявить ключевые проблемы и недостатки в системе формирования статистики и публикации открытых данных, что привело к формулировке рекомендаций для улучшения сбора, анализа и публикации данных в целях повышения прозрачности и эффективности государственных услуг.
In this paper, importance of preprocessing and techniques in this field such as data cleaning, dimensionality reduction, smoothing, normalization are illustrated. During the research we mentioned some details of techniques above. However, our research includes only theoretical aspect of data preprocessing. The data preprocessing phase while arduous and time-intensive stands as the cornerstone of data science, possessing paramount significance. Neglecting the meticulous cleansing and structuring of data has the potential to undermine the integrity and efficacy of subsequent modeling endeavors.