Англаш масалаларида аломатлар фазосининг ночизиқли алмаштиришларига асосланган ахборот моделлари

Дониёр Саидов

doi:10.71337/inlibrary.uz.autoabstract.70695

Авторы

Дониёр Саидов
Национальный университет Узбекистана имени Мирзо Улугбека

DOI:

https://doi.org/10.71337/inlibrary.uz.autoabstract.70695

Ключевые слова:

Обучающая выборка конечные статистики сигналы случайные процессы оператор преобразования плотность вероятности критерий оптимальности решающее правило вероятность ошибки достоверность оценки нелинейное преобразование

Аннотация

Актуальность и востребованность темы диссертации. Использование цифровых технологий является локомотивом повышения эффективности производства товаров и услуг в мире. Большая роль в развитии этих технологий отводится методам искусственного интеллекта (ИИ). Значительная часть методов ИИ применяется для интеллектуального анализа данных (ИАД). Скрытые закономерности, извлекаемые из данных с помощью ИАД, является новыми знаниями в информационных моделях, в рамках которых обосновывается процесс принятия решений для слабо структурированных предметных областей.
Мировая практика свидетельствует, что большая часть усилий построения информационных моделей в слабо структурированных предметных областях становятся неэффективными из-за большой размерности признакового пространства и высокой комбинаторной сложности алгоритмов для поиска логических закономерностей. Продолжается исследование проблемы поиска информативных наборов признаков и подмножества объектов обучения, которые обладают лучшим качеством в смысле решения задач распознавания чем исходные множества признаков и объектов. Одним из путей повышения качества систем распознавания является синтез латентных признаков для описания объектов путём нелинейного отображения определяемых наборов признаков на числовую ось. Повышение точности алгоритмов классификации, извлечение скрытых закономерностей из баз (хранилищ) данных определяет актуальность данного исследования.
В нашей стране в годы независимости большое внимание уделяется научным направлениям, имеющим фундаментальное и прикладное значение. В частности, если в задачах приобретения знаний подразумевается, что представление знаний является заданными априори и нужно лишь построить систему в рамках этих представлений, то в задачах метаобучения ставится вопрос об автоматическом представлении самих представлений, детали которых могут сильно меняться в зависимости от предметной области. Решение задач метаобучения необходимо для снятия следующего ограничения для машинных систем - их способности функционировать только в узкой предметной области. На основе Стратегии Действий по развитию Республики Узбекистан особенно большое значение приобретают эффективные механизмы внедрения научных и инновационных достижений в целях повышения эффективности в сфере экономики страны.
Эта диссертация, в определенной степени, служит осуществлению задач, обозначенных в Постановлениях Президента Республики Узбекистан №-ПП-916 «О дополнительных мерах по стимулированию внедрения инновационных проектов и технологий в производство» от 15 июля 2008 года, №-ПП-2789 «О мерах по дальнейшему совершенствованию деятельности Академии наук, организации, управления и финансирования научно-исследовательской деятельности» от 17 февраля 2017 года и №-УП- 4947 «О стратегии действий по дальнейшему развитию Республики Узбекистан» от 8 февраля 2017 года а также в других нормативно-правовых актах по данной деятельности.
Целью исследования. Совершенствование критериев и методов искусственного интеллекта на основе нелинейных преобразований признакового пространства в задачах распознавания образов.
Научная новизна исследования заключается следующем:
Совершенствован метод формирования нелинейных решающих правил на основе обучающих выборок данных;
описана методика сравнения результатов визуализации на основе критерия компактности. Значения компактности определяются по результатам разбиения объектов каждого класса на минимальное число непересекающихся групп;
получена оценка сложности алгоритма разбиения значений количественных признаков на непересекающиеся интервалы: с учетом пропусков и повторяющихся значений; с учётом и без учёта предобработки данных;
доказано повышение обобщающей способности алгоритма ближайший сосед при переходе от исходного описания объектов в пространство из латентных признаков;
показано, что при иерархической агломеративной группировке признаков и нелинейном отображении их на числовую ось формируются наборы латентных признаков, упорядоченные по отношению их информативности.
Заключение
Разработка и обоснование методов интеллектуального анализа для информационных моделей, основанных на знаниях, является актуальным направлением научных исследований. Отношения между объектами на многообразиях структур признаков исследуются с помощью нелинейных преобразований пространства с использованием методов кластерного анализа. Цель нелинейных преобразований выражается в стремлении к идеальной компактности объектов из непересекающихся классов. Интерпретация компактности в терминах нечётной логики используется для поиска скрытых закономерностей в базах данных.
Основные результаты, полученные в данной работе:
1. Разработаны правила для иерархической группировки признаков, используемые для линейного отображения разнотипных признаков на числовую существенные различия между линейным и нелинейным отображением. С помощью предложенных правил удалась существенно сократить размерность исходного признакового пространства;
2. Предложены способы предобработки данных для вычисления оптимальных границ интервалов. При поиске границ используется проверка истинности гипотезы «В границах каждого интервала лежат значения признаков в описании объектов одного класса». Определена оценка агломеративной и нелинейного ось. Описаны сложности алгоритмов для поиска при наличии повторяющихся значений и пропусков в данных. Значения границ интервалов использовались в правилах иерархической агломеративной группировки для вычисления устойчивости объектов по группе признаков и включения признака в нелинейную комбинацию;
3. Предложен способ оценки компактности обучающей выборки с множеством допустимых значений в (0, 1]. С помощью вычислительного эксперимента доказано, что при нелинейном преобразованием признаков компактность выше чем при линейном и в исходном пространстве из «сырых» признаков. Показано, что оценка компактности имеет связь с показателями обобщающей способности алгоритмов;
4. Нелинейное преобразование признаков было использовано для вывода аналитического представления решающих правил. Латентные признаки на основе этого преобразования были упорядочены по отношению информативности в процессе реализации иерархического агломеративного алгоритма;
5. Построены две информационные модели для диагностики рака и мониторинга засоленности орошаемых земель. В рамках моделей определены шумовые объекты обучающих выборок. Эффект от удаления шумовых объектов показан с помощью оценок компактности классов и выборки в целом

1

ЎЗБЕКИСТОН МИЛЛИЙ УНИВЕРСИТЕТИ

ҲУЗУРИДАГИ ИЛМИЙ ДАРАЖАЛАР БЕРУВЧИ

DSc.27.06.2017.FM.01.02 РАҚАМЛИ ИЛМИЙ КЕНГАШ

ЎЗБЕКИСТОН МИЛЛИЙ УНИВЕРСИТЕТИ

САИДОВ ДОНИЁР ЮСУПОВИЧ

АНГЛАШ МАСАЛАЛАРИДА АЛОМАТЛАР ФАЗОСИНИНГ

НОЧИЗИҚЛИ АЛМАШТИРИШЛАРИГА АСОСЛАНГАН АХБОРОТ

МОДЕЛЛАРИ

05.01.03 – Информатиканинг назарий асослари

ФИЗИКА-МАТЕМАТИКА ФАНЛАРИ БЎЙИЧА ФАЛСАФА ДОКТОРИ

(PhD)

ДИССЕРТАЦИЯСИ АВТОРЕФЕРАТИ

Тошкент шаҳри–

2017 йил

2

УДК: 517.95

Физика-математика фанлари бўйича фалсафа доктори (PhD)

диссертацияси автореферати мундарижаси

Оглавление автореферата диссертации

доктора философии (PhD) по физико-математическим наукам

Contents of dissertation abstract of doctor of philosophy (PhD)

on physical-mathematical sciences

Саидов Дониёр Юсупович

Англаш масалаларида аломатлар фазосининг ночизиқли
алмаштиришларига асосланган ахборот моделлари ................................ 3

Саидов Дониёр Юсупович

Информационные модели на основе нелинейных преобразований
признакового пространства в задачах распознавания............................... 17

Saidov Doniyor Yusupovich

Information models based on nonlinear transformations of feature space in
pattern recognition ………………………………………………………….

31

Эълон қилинган ишлар рўйхати

Список опубликованных работ
List of published works …………………………………………………….. 35

3

ЎЗБЕКИСТОН МИЛЛИЙ УНИВЕРСИТЕТИ

ҲУЗУРИДАГИ ИЛМИЙ ДАРАЖАЛАР БЕРУВЧИ

DSc.27.06.2017.FM.01.02 РАҚАМЛИ ИЛМИЙ КЕНГАШ

ЎЗБЕКИСТОН МИЛЛИЙ УНИВЕРСИТЕТИ

САИДОВ ДОНИЁР ЮСУПОВИЧ

АНГЛАШ МАСАЛАЛАРИДА АЛОМАТЛАР ФАЗОСИНИНГ

НОЧИЗИҚЛИ АЛМАШТИРИШЛАРИГА АСОСЛАНГАН АХБОРОТ

МОДЕЛЛАРИ

05.01.03 – Информатиканинг назарий асослари

ФИЗИКА-МАТЕМАТИКА ФАНЛАРИ БЎЙИЧА ФАЛСАФА ДОКТОРИ

(PhD)

ДИССЕРТАЦИЯСИ АВТОРЕФЕРАТИ

Тошкент шаҳри–

2017 йил

4

Физика-математика фанлари бўйича фалсафа доктори (PhD)

диссертацияси мавзуси

Ўзбекистон Республикаси Вазирлар Маҳкамаси ҳузуридаги Олий аттестация комиссиясида
B2017.3.PhD/FM103 рақам билан рўйхатга олинган.

Диссертация Мирзо Улуғбек номидаги Ўзбекистон Миллий Университетида бажарилган.

Диссертация автореферати уч тилда (ўзбек, рус, инглиз (резюме)) Илмий кенгаш веб-

саҳифаси (http://ik-fizmat.nuu.uz/) ва «ZiyoNet» Ахборот таълим порталида (www.ziyonet.uz)
жойлаштирилган.

Илмий раҳбар:

Игнатьев Николай Александрович

физика-математика фанлари доктори, профессор

Расмий оппонентлар:

Усманов Ришат Ниязбекович

техника фанлари доктори, профессор

Ибрагимов Фарходжон Нурмухамаджонович

физика-математика фанлари номзоди

Етакчи ташкилот:

Ислом Каримов номидаги Тошкент давлат техника
университети

Диссертация

ҳимояси

Ўзбекистон

Миллий

университети

ҳузуридаги

DSc.27.06.2017.FM.01.02 рақамли Илмий кенгашнинг «___»___________ 2017 йил соат____ даги
мажлисида бўлиб ўтади. (Манзил: 100174, Тошкент ш., Олмазор тумани, Университет кўчаси, 4-
уй. Тел.: (+99871) 227-12-24, факс: (+99871) 246-53-21, 246-02-24, e-mail: nauka@nuu.uz).

Диссертация билан Ўзбекистон Миллий университетининг Ахборот-ресурс марказида

танишиш мумкин (___ рақами билан рўйхатга олинган). (Манзил: 100174, Тошкент ш., Олмазор
тумани, Университет кўчаси, 4-уй. Тел.: (+99871) 246-02-24).

Диссертация автореферати 2017 йил «____» _______________куни тарқатилди.
(2017 йил «____» ___________ даги _______ рақамли реестр баённомаси).

А. Р. Марахимов

Илмий даражалар берувчи Илмий
кенгаш раиси, т.ф.д., профессор

З. Р. Рахмонов

Илмий даражалар берувчи Илмий
кенгаш илмий котиби, ф.-м.ф.д.

Р.Ж. Алоев

Илмий даражалар берувчи Илмий
кенгаш қошидаги илмий семинар
раиси, ф.-м.ф.д., профессор

5

КИРИШ (фалсафа доктори (PhD) диссертацияси аннотацияси)

Диссертация мавзусининг долзарблиги ва зарурати.

Жаҳонда,

рақамли технологиялардан фойдаланиш товарлар ишлаб чиқариш ва
хизматлар

самарадорлигини

оширишнинг

муҳим

омили

бўлиб

ҳисобланмоқда. Ушбу технологияларнинг ривожланишида сунъий интеллект
(СИ) усуллари муҳим роль касб этади. СИ усулларининг салмоқли қисми
берилганларни интеллектуал таҳлили (БИТ) учун қўлланилмоқда.
Берилганлардан БИТ ёрдамида ажратиб олинган яширин қонуниятлар
ахборот моделлари учун янги билимлар ҳисобланиб, улар асосида заиф
тузилмали предмет соҳалардаги қарор қабул қилиш жараёнлари асослаб
берилмоқда.

Жаҳон амалиёти шуни кўрсатадики, заиф тузилмага эга предмет соҳалар

учун ахборот моделларини қуришга уриниш аломатлар фазосининг катта
ўлчамлиги ва мантиқий қонуниятларни қидириш учун мўлжалланган
алгоритмларнинг юқори комбинаторик мураккаблиги сабабли самарасиз
бўлиб қолмоқда. Шунингдек, англаш масаласини ечиш нуқтаи-назаридан,
дастлабки аломатлар ва объектлар тўпламига нисбатан яхши сифат
кўрсаткичларига эга информатив аломатлар тўпламини ва ўргатувчи
объектларнинг қисм тўпламини қидириш муаммолари бўйича тақдиқотлар
давом этмоқда. Тадқиқотлар шуни кўрсатадики, англаш тизимларининг
сифатини ошириш йўлларидан бири – объектларни тавсифлаш учун
аниқланадиган аломатлар тўпламини сон ўқига ночизиқли акслантириш йўли
билан латент аломатларни синтез қилиш усули ҳисобланади. Берилганлар
базасидан

(сақлагичдан) яширин

қонуниятларни

ажратиб олувчи

классификация алгоритмларининг аниқлигини ошириш мазкур тадқиқотнинг
долзарблигини аниқлайди.

Мустақиллик йилларида мамлакатимизда фундаментал ва амалий

татбиққа эга бўлган долзарб илмий йўналишларга эътибор кучайтирилди.
Хусусан, билимларни эгаллаш масалаларида билимларни тақдим этиш
априор берилган бўлиб, фақат ушбу тақдимот доирасида тизимни қуриш
кераклиги кўзда тутилса, метаўргатиш масалаларида эса тақдимотни ўзини
автоматик тақдим этиш масалаcи қўйиладики, унинг деталлари предмет
соҳага боғлиқ равишда кескин ўзгариши мумкин. Метаўрганиш масаласини
ечишнинг зарурати, машинали тизимлар учун тор предмет соҳада амал
қилиш қобилиятлари билан боғлиқ чекловларни олиб ташлаш билан
изоҳланади. Шунингдек, Ўзбекистон Республикасини янада ривожлантириш
бўйича Ҳаракатлар стратегияси асосида илмий-тадқиқот ва инновация
ютуқларини амалиѐтга жорий этиш маханизмларидан иқтисодиѐт
тармоқларининг самарадорлигини оширишда фойдаланиш муҳим аҳамиятга
эга ҳисобланади.

Ўзбекистон Республикаси Президентининг 2008 йил 15 июлдаги

ПҚ-916-сон «Инновацион лойиҳалар ва технологияларни ишлаб чиқаришга
татбиқ этишни рағбатлантириш борасидаги қўшимча чора-тадбирлар
тўғрисида»ги, 2017 йил 17 февралдаги ПҚ-2789-сон «Фанлар академияси

6

фаолияти, илмий-тадқиқот ишларини ташкил этиш, бошқариш ва
молиялаштиришни янада такомиллаштириш чора-тадбирлари тўғрисида»ги
Қарори ва 2017 йил 8 февралдаги ПФ-4947-сон «Ўзбекистон Республикасини
янада ривожлантириш бўйича ҳаракатлар стратегияси тўғрисида»ги фармони
ҳамда мазкур фаолиятга тегишли бошқа норматив-ҳуқуқий хужжатларда
белгиланган вазифаларни амалга оширишга ушбу диссертация тадқиқоти
муайян даражада хизмат қилади.

Тадқиқотнинг рeспублика фан ва тexнологиялари ривожлани-

шининг устувор йўналишларига мослиги.

Диссертация республика фан ва

технологиялар

ривожланишининг

IV.

«Математика,

механика

ва

информатика» устувор йўналиши доирасида бажарилган.

Муаммонинг ўрганилганлик даражаси.

Умумлашган қарор қилиш

функциялари ёрдамида ночизиқли классификаторлардан фойдаланишга бир
неча бор ҳаракатлар бўлган. Амалда бу муаммо бошланғичга нисбатан катта
бўлган янги аломатлар фазосига ўтиш орқали бажарилган. В.Н. Вапник ва
Червоненкислар томонидан аломатлар фазоси ўлчамининг ўсишига мос
равишда объектлар танланмасини синфларга тўғри ажратиш эҳтимол-
лигининг ошиши исбот қилинган.

Англаш

усулларидан

фойдаланиш

назарияси

ва

амалиётини

ривожланишида чет эл ва юртимиз олимлари улкан ҳиссаларини қўшишган.
Чет эл олимлари орасида Ю.И.Журавлев, Н.Г.Загоруйко, В.А.Дюк,
К.В.Воронцова, В.Н.Вапникларни, юртимиз олимлари ичида М.М.Камилов,
Т.Ф.Бекмуратов,

Ф.Т.Адилова,

Ш.Х.Фазылов,

Д.Т.Мухамадиевалар

тадқиқотларини алоҳида қайд этиш мақсадга мувофиқдир.

Диссертация тадқиқотининг диссертация бажарилган олий таълим

муассасининг илмий-тадқиқот ишлари режалари билан боғлиқлиги.

Диссертация тадқиқоти Ўзбекистон Миллий университетининг илмий-
тадқиқот ишлари режасига мувофиқ Ф-4-64 «Берилганларни интеллектуал
таҳлилида умумлашган баҳоларни ҳисоблаш ва объектларнинг индивидуал
метрикасига асосланган усулларни ишлаб чиқиш ва асослаш» (2011-2016)
илмий тадқиқот лойиҳаси доирасида бажарилган.

Тадқиқотнинг мақсади

англаш масалаларида аломатлар фазосининг

ночизиқли алмаштиришларига асосланган сунъий интеллект мезонлари ва
усулларини такомиллаштиришдан иборат.

Тадқиқотнинг вазифалари

қуйидагилардан ташкил топган

:

аломатларни гуруҳлаш, ҳамда уларнинг объектлар тавсифидаги

қийматларини сон ўқига чизиқли ва ночизиқли акслантириш учун
агломератив иерархик усулларни ишлаб чиқиш ва асослаш;

чизиқли ва ночизиқли усуллардан фойдаланилган ҳолда берилганларни

визуаллаштириш. Визуаллаштириш сифатини баҳолаш мезонини ишлаб
чиқиш;

объектлар латент аломатлар билан тавсифланган ҳолатларда англаш

алгоритмларининг умумлашириш қобилиятини баҳолаш;

дастлабки ишлов бериш инобатга олинган ва олинмаган ҳолатлар учун

синфларга ажратилган объектларни тавсифловчи аломатлар қийматларини

7

ўзаро

кесишмайдиган

интервалларга

ажратиш

алгоритмининг

мураккаблигини баҳолаш;

иерархик агломератив гуруҳлаш, берилганларни визуаллаштириш ва

англаш алгоритмларининг умумлаштириш қобилиятини ҳисоблаш учун
дастурий таъминот яратиш ва уни заиф тузилмага эга предмет соҳалар учун
ахборот моделлар яратишда қўллаш.

Тадқиқотнинг объекти

образларни англаш алгоритмларининг

моделларини ишлаб чиқиш ва асослашдан иборат.

Тадқиқотнинг предмети

– англаш масалаларидаги мумкин бўлган

объектлар учун аломатлар фазосини танлаш методларидан иборат.

Тадқиқотнинг усуллари.

Тадқиқот ишида дискрет математика, сунъий

интеллект, математик таҳлил, алгоритмик тилларда дастурлаш асосида
англашнинг оптимал алгоритмларини излаш усулларидан фойдаланилган.

Тадқиқотнинг илмий янгилиги

қуйидагилардан иборат:

берилганлар танланмасига асосланган ночизиқли қарор қилиш

қоидаларини шакллантириш усули такомиллаштирилган;

компактлик мезони асосида визуаллаштириш натижаларини қиёсий

таққослаш усули тавсифланган бўлиб, компактлик қиймати ҳар бир синф
объектларини минимал сондаги ўзаро кесишмайдиган гуруҳларга ажратиш
натижалари бўйича аниқланган;

берилганларда тушуриб қолдирилган ва такрорланувчи қийматлар

инобатга олинган ҳолда ҳамда берилганларни дастлабки ишлов беришни
инобатга олган ва олмаган ҳолда миқдорий аломатларни ўзаро
кесишмайдиган интервалларга бўлиш алгоритмининг мураккаблик баҳоси
олинган;

объектлар тавсифидаги бошланғич аломатлар фазосидан латент

аломатлар фазосига ўтилганда яқин қўшни алгоритмининг умумлаштириш
қобилиятининг ошганлиги исботланган;

аломатларни агломератив иерархик гуруҳлаш ва уларни сон ўқига

ночизиқли акслантиришда информативлиги бўйича тартибланган латент
аломатлар тўпламларининг шаклланиши кўрсатилган.

Тадқиқотнинг амалий натижаси

қуйидагилардан иборат:

объектлар тавсифини сон ўқига чизиқли ва ночизиқли акслантиришдаги

визуаллаштириш натижаларини баҳолаш усули ишлаб чиқилган;

аломатларни агломератив иерархик гуруҳлаш орқали англаш

алгоритмининг умумлаштириш қобилиятини пасайтирмасдан ўлчанадиган
бошланғич аломатлар сони камайтирилган;

аломатларни сон ўқига акслантириш ва улар учун бўлиш мезонининг

оптимал қийматидан фойдаланган ҳолда ҳисобланадиган чизиқли
дискрименант функциянинг бўсаға қийматини қўллаш натижасида англаш
алгоритмларининг аниқлиги ва умумлаштириш қобилияти оширилган;

объектлар тавсифидаги аломатлар тўпламини сон ўқига чизиқли ва

ночизиқли акслантириш асосида латент аломатларни танлаш усуллари билан
англаш масалаларини ечиш бўйича дастурий мажмуа ишлаб чиқилган.

8

Тадқиқот натижаларининг ишончлилиги.

Олинган натижаларнинг

ишончлиги, модел ва тест берилганларда ўтказилган ҳисоблаш
тажрибаларининг натижалари аломатлар фазосини ночизиқли алмаштириш
асосидаги алгоритмларнинг юқори умумлаштириш қобилияти билан
тасдиқланади, латент аломатлар ёрдамида объектларни визуаллаштириш
натижалари бўйича ўргатувчи танланманинг компактлик кўрсаткичи
ошганлиги билан исботланган.

Тадқиқот натижаларининг илмий ва амалий аҳамияти.

Тадқиқот

натижаларининг илмий аҳамияти англаш алгоритмларининг умумлаштириш
қобилиятини оширувчи, заиф формаллашган предмет соҳалардаги
берилганлар базаси ва сақлагичларидан яширинган билимларни ажратиб
олиш имконини берувчи, мумкин бўлган объектларни янги аломатлар
фазосини

шакллантиришнинг

чизиқли

ва

ночизиқли

усулларини

ривожлантириш, ҳамда ночизиқли қоидаларни аналитик кўринишини
келтириб чиқариш асосида қарор қабул қилишни асослаш, аломатлар
фазосини визуаллаштириш ва компактлик мезони бўйича унинг баҳосини
бериш, информатив аломатларни танлаб олишдан иборат.

Тадқиқот натижаларининг амалий аҳамияти заиф формаллашган

предмет соҳалардан янги билимларни олишга имкон берувчи, таклиф
қилинган алгоритмлар сифатини баҳолаш мезонлари асосида ахборот
моделларини қуриш учун дастурий мажмуадан фойланишдан иборат.

Тадқиқот натижаларининг жорий қилиниши.

Яратилган тадқиқот

усуллари ва алгоритмлари асосида:

аломатларни иерархик агломератив гуруҳлаш ва уларни сон ўқига

ночизиқли акслантириш усули Ўзбекистон Республикаси Ер ресурслари,
геодезия, картография ва давлат кадастри давлат қўмитасида тупроқ
шўрланишининг ахборот моделини қуришда фойдаланилган (Ўзбекистон
Республикаси Ер ресурслари, геодезия, картография ва давлат кадастри
давлат

қўмитасининг

2017

йил

20

октябрдаги

03-05-8912–сон

маълумотномаси).

Илмий

натижаларнинг

қўлланилиши

тупроқ

шўрланишининг учта тури бўйича аломатларнинг ночизиқли боғланиш-
ларини аниқлаш орқали яширин қонуниятларни топиш имконини берган;

ўргатувчи танланмадан шовқин объектларни қидириш ва уларни ўчириш

орқали

берилганларни

селекция

қилиш,

компактлик

ўлчовининг

қийматларини ҳисоблаш ва берилганларни визуаллаштириш усуллари
Ўзбекистон Республикаси Ер ресурслари, геодезия, картография ва давлат
кадастри давлат қўмитасида тупроқ шўрланиши мониторинг қилишда
қўлланилган (Ўзбекистон Республикаси Ер ресурслари, геодезия,
картография ва давлат кадастри давлат қўмитасининг 2017 йил 20 октябрдаги
03-05-8912–сон маълумотномаси). Ушбу усулларнинг қўлланилиши тупроқ
шўрланиши жараёнида миқдорий ва номинал аломатлар вазнларини аниқлаш
ва объектлар ўртасидаги ўзаро муносабатни визуаллаштириш ҳамда аномал
объектларни аниқлаш имконини берган.

9

Тадқиқот натижаларининг апробацияси.

Мазкур тадқиқот натижа

лари 8 илмий-амалий анжуманларда, жумладан 5 та халқаро ва 3 та
республика илмий-амалий анжуманларида муҳокамадан ўтказилган.

Тадқиқот натижаларининг эълон қилинганлиги.

Тадқиқот мавзуси

бўйича жами 20 та илмий иш чоп этилган, шулардан, Ўзбекистон
Республикаси Олий Аттестация комиссиясининг фалсафа доктори
диссертациялари асосий илмий натижаларини чоп этиш тавсия этилган
илмий нашрларда 8 та мақола, жумладан, 3 таси хорижий ва 5 таси
республика журналларида нашр этилган.

Диссертациянинг тузилиши ва ҳажми.

Диссертация кириш, учта боб,

хулоса, фойдаланилган адабиётлар ва 3 та иловалардан ташкил топган.
Диссертациянинг ҳажми 93 бетдан иборат.

ДИССЕРТАЦИЯНИНГ АСОСИЙ МАЗМУНИ

Кириш

қисмида диссертация мавзусининг долзарблиги ва зарурати,

тадқиқотнинг республика фан ва технологияларни ривожлантиришнинг
устувор йўналишларига мос келиши асосланган, диссертация мавзусига
бўйича чет элдаги илмий тадқиқотларнинг қисқача маълумоти ва
муаммонинг ўрганилганлик даражаси келтирилган, тадқиқотнинг мақсад,
вазифалари шакллантирилган, унинг объекти ва предмети кўрсатилган,
тадқиқотнинг амалий натижалари ва илмий янгиликлари баён қилинган,
олинган натижаларнинг назарий ва амалий аҳамияти очиб берилган,
тадқиқот натижаларининг қўлланилиши, диссертация тузилиши ва нашр
қилинган илмий ишлар тўғрисида маълумотлар келтирилган.

Биринчи бобда англаш алгоритмларининг параметрларини ҳисоблаш

учун ва объектларни тавсифлашда фазони танлашда аломатлар қиймат-
ларини ўзаро кесишмайдиган интервалларга ажратишдан фойдаланиш
тавсифланган.

Синф объектларининг чизиқли ажралиш хусусияти яримтекислик

шаклидаги мантиқий конуният нуқтаи назаридан қаралган. Мантиқий
қонуниятлар асосида масалани ечиш алгоритмлари ғоят катта комбинаторик
мураккабликга эгалиги билан характерланади.

.

Мураккабликни камайтириш

учун дастлабки ишлов бериш ва айрим эвристикалардан фойдаланиш таклиф
этилади.

Ўзаро кесишмайдиган

l

та

синф вакилларидан ташкил топган

0

1

{ ,...,

}

m

E

S



объектлар тўплами берилган бўлсин. Объектлар

n

та турли

тоифадаги аломатлар тўплами





1

,...,

n

X

x



билан тасвирланган бўлиб,

улардан





n

 



таси номинал шкалада,

n





таси миқдорий шкалада

ўлчанади. Берилганларда тушириб қолдирилган ва такрорланувчи қийматлар
бўлиши мумкин. Миқдорий аломатлар (дастлабки ва латент) қийматларини
ўзаро кесишмайдиган интервалларга ажратиш учун

F

(

*

) мезон берилган деб

ҳисобланади. Латент аломатлар миқдорий ва номинал аломатларнинг

1

,...,

l

K

10

комбинацияси орқали тасвирланиши мумкин.

 

*

F

extr



шартида

l

та

оралиқнинг чегаравий қийматларини аниқлаш талаб этилади.

Айтайлик,

p

i

u

-

2

1

2

(

,

]

p

c



оралиқдаги

i

K

синфнинг

,

j

x

j

I I

n





 

миқдорий

аломатнинг

ўлчанган

қийматлари

тўплами,

0

( ,..., ),

0,

,

l

j

A

a

m



j

m

–

j

x

бўйича

қиймати

тушириб

қолдирилмаган объектлар сони

(2

)

j

l

m



,

ij



–

j

x

аломатнинг

i

K

синфдаги такрорланувчи қийматлари сони,

p

a

–

0

E

даги

j

x

аломат

қийматларининиг

1

,...,

j

m

r

ўсувчи кетма-кетлигидаги интервалнинг ўнг

чегараси

2

.

p

a

c

r



аниқловчи элементнинг тартиб рақами бўлсин.

Қуйидаги мезон

1

(

1)

|

| (|

| 1)

l

p

i

p

i

l

ij

i

u u





































1

{ }

1

(

|

)

max

|

| (

|

|)

l

p

i

j

ij

t

i

p

i

t

l

A

ij

j

ij

i

u m

u

m



















 



















(1)

2

1

2

{(

,

]},

1,

p

c

p

l





интерваллар чегараларининг оптимал қийматларини

ҳисоблашга ва улардан миқдорий аломатларнинг номинал ўлчов шкаласида
градацияларини аниқлаш учун фойдаланишга имкон беради.

Мезонни ҳисоблашдаги мураккабликни камайтиришга олиб келувчи

берилганларни дастлабки ишлов беришдан фойдаланиш келтирилган.
Тушириб қолдирилган ва такрорланувчи қийматлар бўлган ҳолда
берилганларни дастлабки ишлов беришни инобатга олган ҳолдаги алгоритм
муракаблигини баҳолаш амалга оширилди. 1-расмда такрорланувчи
қийматлар мавжуд ҳолат учун (1) мезонни ҳисоблаш алгоритмининг
мураккаблигини ўзгариши кўрсатилган.

Расм 1

. Аломатнинг такрорланувчи қийматларидаги мураккабликнинг ўзгариши.

11

Аломатларнинг ночизиқли алмаштирилиши, одатда объектларни

дастлабки фазога нисбатан каттароқ ўлчамга эга бўлган фазода (умумлашган
фазода) тавсифлашга олиб келади. Умумлашган фазода информатив
аломатларни

танлаш

олиш

ва

алгоритмларнинг

умумлаштириш

қобилиятларини ошириш учун бир қатор эвристикалар таклиф қилинган.

Айтайлик

1

2

,

m m

- аломатларнинг

1

2

,

K K

синфлардаги математик

кутилмалар вектори бўлсин. Ҳар бир

x

i

=X

(

u

) аломат учун

1

2

,

m m

бўйича синф

ичидаги ўхшашлик

i



ва синфлараро фарқланиш

i



қийматлари ҳисобланади.

Ушбу

j

 

(2)

муносабат аломатларни синфларнинг математик кутилмалари атрофида
уларнинг тарқалиш зичлиги бўйича тартиблаш ва баҳолаш имконини беради.

(2) даги каби ҳар бир

( )

x

X n





аломат бўйича синф ичидаги

ўхшашликни ҳисоблаш ушбу мезонида амалга оширилади:

2

1

2

1

2

,

m

s





(3)

бу ерда

1

2

r

s



 

синф ичидаги объектларнинг бир-биридан қанчалик узоқ

жойлашганликлари йиғиндисини,

1

2

m



эса сонлар ўқидаги

1

K

ва

2

K

синфлар математик кутилмалари орасидаги фарқни ифодалайди.

Фишер мезони

 

2

1

2

1

2

max

m

w

s











,

Y

(

p

)

=

(

y

1

,…,y

p

)

, p>n

да чизиқли

қарор қилувчи функциянинг (ЧҚҚФ) аломатлар жуфтликларини танлаш учун
фойдаланилади. Бу ерда





 

,

i

j

y y

Y p



,

 

X n

даги аломатлар

комбинацияси.

Муҳит табиати тўғрисидаги ҳар қандай фаразларни инобатга олмасдан

ЧҚҚФ бўсаға қийматини танлаш усули қўлланилди. Бўсаға қиймати (1) даги









1

2

3

,

c c

интервалнинг

2

c

чегара қиймати бўйича қуйидагича

ҳисобланди:

 





0

2

w

c

u S





(4)

бу ерда

 

1

2

i

j

u S

w s





, ва





1

,...,

p

S

s



,

 





2

3

,

u S

c c



- сон ўқидаги

2

c

га

яқин бўлган

0

E

даги объектдир. Бўсаға қиймати (4) бўйича танланганда

ЧҚҚФнинг умумлаштириш қобилияти, танланманинг нормал тарқалиши
тўғрисидаги фараз бўйича танланган бўсаға қийматга нисбатан кўп ҳолларда
юқори бўлиши ҳисоблаш эксперименти орқали исботланган.

Иккинчи бобда аломатлар жуфтликларини сон ўқига ночизиқли

акслантириш асосланган иерархик агломератив гуруҳлаш таклиф этилган.
Гуруҳлаш натижалари бўйича аломатлар фазосини танлаш ва дастлабки
аломатларнинг информатив тўплам остиларини ажратиб олиш муаммолари
ечилади. Объектларни гуруҳлашдан мақсад – аломатлар фазосининг турли
хилма-хилликлардаги кўринишларида компактлик ҳақидаги гипотезанинг

12

ростлигини текшириш ҳисобланади. §3.1 да аломатларни сон ўқида чизиқли
акслантириш масаласи қаралади. Латент аломатларни чизиқли ва ночизиқли
ҳисоблаш усуллари орасидаги фарқланишлар 1-жадвалда келтирилган.

1-жадвал.

Чизиқли ва ночизиқли усуллар орасидаги фарқланишлар

№

Латент аломатларни ҳисоблаш усули

Чизиқли

Ночизиқли

1.

Аломатлар гуруҳини шакллан-
тириш

иерархик

агломератив

гуруҳлаш

қоидалари

бўйича

амалга оширилади. Ҳар бир гуруҳ
аломатлари битта латент аломатга
чизиқли акслантирилади.

Дастлабки аломатлардан латент
аломатларни кетма-кет шакллан-
тириш

иерархик

агломератив

гуруҳлаш қоидалари бўйича амалга
оширилади.

2.

Информатив латент аломатларни
саралаш объектлар ўртасидаги
яқинлик

ўлчовини

танлашга

боғлиқ.

Информатив латент аломатларни
танлаб олиш усули мавжуд. Усул
аломатлар ўлчов масштабига ва
объектлар

орасидаги

яқинлик

ўлчовига нисбатан инвариант.

Ночизиқли алмаштириш миқдорий аломатлар учун қандай бўлса турли

тоифадаги аломатлар учун ҳам худди шандай амалга оширилади. Миқдорий
аломатлар учун масаланинг қўйилиши қуйидаги кўринишга эга.

Стандарт тарздаги икки синфли англаш масаласи қаралади.





0

1

,...,

m

E

S



танланма объектлари

1

K

ёки

2

K





0

1

2

E

K





синфлардан

бирига тегишли бўлиб,

n

та миқдорий аломатлар

 





1

,...,

n

X n

x



билан

тавсифланади.

0

E

да

( )

X n

тўпламни

ўзаро

кесишмайдиган

 

1

,...,

,

1,

...

X k

X

k

n





 



қисм тўпламларга кетма-кет равишда

ажратиш қоидаси берилган бўлсин. Қуйидагилар талаб этилади:



ҳар бир

 

i

X k

учун

0

,

1,

j

S

E

j

m





объект тавсифидаги

 

i

X k

аломатлар қийматларини сон ўқидаги қийматга (умумлаширувчи баҳога)
кетма-кет акслантирувчи

i

A

алгоритм (Ю.И. Журавлёвнинг образларни

англашга алгебраик ёндошув терминларидаги англовчи оператор)
аниқлансин;



i

A

англаш операторини ҳисоблаш учун аналитик кўринишни

(формулани) келтириб чиқариш.

Айтайлик

1

2

,

i

u u

–

,

p

j

x

j

I



,

I=

{

1,2,…,n

} аломатнинг

,

1,2

i

K i



синфга

тегишли ва мос равишда



1

2

3

,

jp

c









,

1

i

K



интервалларидаги

қийматлари сони,



–

0

E

даги

p
j

x

нинг қийматларининг ўсувчи

1

,....,

,...,

j

jm

r



кетма-кетлигидаги

1

2

3

,

jp

j

jm

c

r c

r

c

r





интерваллар

чегараларини аниқловчи элементининг тартиб номери бўлсин.

13

Қуйидаги мезон













1

2

3

2

1

2

1

2

1

max

2

1

jp

d

i

c

i

d

i

d

i

u

K

u

K K

K





























 

























(5)



1

2

3

,

jp

c









интерваллар орасидаги чегаралар қийматини баҳолаш

имконини беради. Мезоннинг экстремуми

p

j

x

аломатнинг





0

1

p

j





вазни сифатида ишлатилади.





1

,

,...,

p

r

r n p

S

a





,

0

r

S

E



объектнинг





,

p

i

j

x

,

0

p

n

 

,





,

1,...,

i j

n

p





,

i

j



аломатлар жуфтликлари бўйича

p

rij

b

умумлашган

баҳосининг қиймати қуйидагича ҳисобланади:





2

3

1

3

1

2

3

1

, ,

,

p

jp

p

ip

rj

p

ri

rij

ij

i

j

ip

jp

p

ijp

ri

rj

p

ij

ijp

a

c

a

c

b

t

c

a a

c

t

i j

I

c





































































 





















, ,

1,1

i

j

ij

t t t

 

,

 

0,1

ij





,

бу ерда

,

p

i

j

ij

  

– мос равишда

p

j

p

i

x

,

x

аломатлар қийматлари тўпламидан

ва уларнинг

p

j

p

i

x

кўпайтмаларидан бўйича (5) асосида аниқланган вазнлар,





, ,

1,1

i

j

ij

t t t

 

,

 

0,1

ij





ларнинг қийматлари қуйидаги функционал

экстремумидан танланади:





1

2

0

min

max

, ,

max

min

r

p

rij

S

K

S

K

p

rij

S

E

S

E

b

p i j

b











.

(6)

Ҳисоблаш

эксперименти

гипертония

касаллиги

кўрсаткичлари

асосидаги тиббиёт берилганларида ўтказилган бўлиб,

K

1

(деярли соғломлар),

K

2

(касаллар)

синфларидан ташкил топган. 2-жадвалда дастлабки

аломатларни биринчи гуруҳга кетма-кет бирлаштириш натижалари, (5) мезон
бўйича аломатлар комбинациясидан умумлашган баҳолар қийматларни
(латент аломатларни) синтез қилиш тартиби ва ичма-ич кавсларни ҳисобга
олган ҳолдаги (6) бўйича синф объектлари орасидаги чекинишлар
келтирилган.

14

2-жадвал.

Аломатларни гуруҳлаш натижалари

Гуруҳ

номери

Аломатларни бирлаштириш

кетма-кетлиги

(5) мезон

қиймати

(6) бўйича

чекиниш

1

4

20

( ,

)

x x

0.9672

-0.0659

4

20

9

(( ,

),

)

x x

x

0.9672

-0.0325

4

20

9

18

((( ,

),

)

x x

x

1.0000

0.0055

4

20

9

18

8

(((( ,

), ),

), )

x x

x

1.0000

0.0076

4

20

9

18

8

2

((((( ,

),

), ),

)

x x

x

1.0000

0.0079

4

20

9

18

8

2

10

(((((( ,

),

), ),

),

)

x x

x

1.0000

0.0101

4

20

9

18

8

2

10

12

((((((( ,

),

), ),

),

)

x x

x

1.0000

0.0105

Биринчи гуруҳ бўйича латент аломат қийматларини ҳисоблаш кетма –

кетлигининг аналитик кўриниши:

1

0.006947([

] 140) 0.394923([

] 0.42)

0.0041346([

] [

] 68.2);

АДС

ДИАСТОЛА

АДС

ДИАСТОЛ

y

А

 











1

2

1

1.602699(

0.0047)

3.128708([

] 0.08)

QRS

y









;

1

3

2

0.581198

0.551857([

] 0.485)

0.892018

[

]

СИСПО

y

К

СИСПО

y

К











;

1

4

3

0,21174(

0.0388)

0.2756([

] - 0.36)

2.13634(

[

] 0.0124)

QT

y

QT

y









;

1

5

4

0.005789(

[

] 1.9623)

y

Рост

y







;

1

6

5

0.310793

[

]

y

П

y

ПЛ





;

1

7

6

0.1804337

[

]

y

Р

y

КД





.

Визуаллаштириш натижаларини таҳлил қилиш учун синф компактлиги

баҳоси каби тузилмавий тавсифдан фойдаланиш таклиф этилган.

2

1

2

ij

j

i

m









,

(7)

бу ерда



-

,

1,2

i

K i



даги гуруҳлар сони,

i

m

K



,

ij

m

-

i

K

синфнинг

j

–

гуруҳидаги объектлари сони. Ўргатувчи танланма бўйича компактликнинг
ўртача баҳоси қуйидаги формула ёрдамида ҳисобланади:

2

1

0

F(E , )

i

m









,

(8)

бу ерда

m

- танланма объектлари сони.

Учинчи бобда компактлик кўрсаткичи аломатлар фазосининг турли хил

алмаштиришларни таҳлил қилиш учун ишлатилиши кўрсатилган.

Объектларнинг турғунлик қийматлари танланманинг тузилмавий хилма-

хиллигининг ўлчови сифатида хизмат қилади. Ундан шовқин объектларни
излаш ва ўчириш орқали алгоритмнинг умулаштириш қобилиятини ошириш
мақсадида

фойдаланиш

мумкин.

Синф

объектлари

турғунлик

15

қийматларининг турли-туманлиги метрикани танлашга бевосита боғлиқ.
Ушбу ишда қуйидагилар амалга оширилган:



дастлабки аломатлар тўпламини иерархик агломератив гуруҳлаш

қоидалари бўйича ўзаро кесишмайдиган гуруҳларга ажратиш ва унинг
асосида латент аломатлар тўпламини шакллантириш;



информатив латент аломатлар тўпламини саралаш;



англаш алгоритмларининг умумлаштириш қобилиятини ошириш

мақсадида шовқин объектларини аниқлаш ва ўчириш.

(5)

мезон

бўйича

қурилган

оралиқлар

учун













1

2

( )

|

,

i

d

p

d

p

S

K

S S

c c









,













2

3

1

2

( )

|

,

i

d

p

d

p

S

K

S S

c c











,

1

( )

( ) /

p

K







ва

2

3

( )

( ) /

p

K









ни аниқлаймиз.

(k)

X

аломатлар

тўплам остиси бўйича

,

1,2

d

p

S

K

p





объект турғунлиги қуйидаги тарзда

ҳисобланади:









1

2

,

( )

( ) 1

( ) .

d

U S X k

p







Қандайдир

( )

a

x

X n



аломатни

( ), ( )

( )

X k X k

X n



тўпламга (гуруҳга)

қўшиш учун қуйидаги функционалдан фойдаланилади:

  







 













1

1,

,

1 ,

1

,

1

0,

.

m

d

U S X k

M X k

X k

m

акс холда





















Шовқин объектларни ўчириш ҳамда (7) ва (8) бўйича компактликнинг

ошишининг боғланиши кўрсатилган. (8) кўрсаткич бўйича ночизиқли
усулнинг чизиқли усулдан афзаллиги эксперимент орқали тасдиқланди.

ХУЛОСА

Билимларга асосланган ахборот моделлар учун интеллектуал таҳлил

усулларини яратиш ва асослаш илмий тадқиқотларнинг долзарб
йўналишларидан ҳисобланади. Аломатларнинг тузилмавий хилма-хиллигида
объектлар

ўртасидаги

муносабатлар

кластер

таҳлил

усулларидан

фойдаланган ҳолда аломатлар фазосини ночизиқли алмаштиришлар орқали
тадқиқ

қилинган.

Ночизиқли

алмаштиришлардан

мақсад

ўзаро

кесишмайдиган синф объектларининг идеал компактлигига интилиш
ҳисобланади. Компактликни қатъиймас мантиқ атамаларида изоҳлаш
берилганлар базасидан яширин қонуниятларни излашда фойдаланилади.

Ушбу ишда олинган асосий натижалар:
1.

Турли тоифадаги аломатларни сон ўқида чизиқли ва ночизиқли

акслантириш учун аломатларни иерархик агломератив гуруҳлаш қоидалари
ишлаб чиқилди. Чизиқли ва ночизиқли акслантириш ўртасида жиддий фарқ
мавжудлиги кўрсатилди. Таклиф этилган қоидалар ёрдамида дастлабки
аломатлар фазоси ўлчамини сезиларли даражада қисқартиришга мувофиқ
бўлинди;

2.

Оралиқларнинг оптимал чегарасини ҳисоблаш учун берилганларни

дастлабки ишлов бериш усуллари таклиф этилган. Чегара қийматларини

16

аниқлашда «Ҳар бир оралиқ чегараларида фақат битта синфнинг
объектларни тавсифлашдаги аломатлар қийматлари ётади» гипотезасининг
ростлигини текширишдан фойдаланилади. Берилганларда такрорланишлар ва
тушириб қолдирилган қийматлар бўлган ҳолатларда қидириш учун
алгоритмлар

мураккаблигининг

баҳоси

аниқланди.

Интерваллар

чегараларининг қийматларидан аломатлар гуруҳи бўйича объектлар
турғунликларини ҳисоблаш ва аломатни ночизиқли комбинацияга қўшиш
учун иерархик агломератив гуруҳлаш қоидаларида фойдаланилган;

3.

Объектлар тавсифидаги аломатларининг (0,1] оралиққа тегишли

мумкин бўлган қийматлари тўплами билан берилган ўргатувчи танланманинг
компактлигини баҳолаш усули таклиф қилинди. Аломатларни ночизиқли
алмаштиришдаги компактлик қиймати чизиқли алмаштиришга ва дастлабки
«хом» аломатлар фазосидагига нисбатан юқори бўлиши ҳисоблаш
экспериментлари ёрдамида исботланди. Компактлик баҳоси ҳамда
алгоритмнинг умумлаштириш қобилияти ўртасида боғлиқлик мавжудлиги
кўрсатилди;

4.

Аломатларни ночизиқли алмаштиришдан қарор қабул қилиш

қоидаларининг аналитик кўринишини келтириб чиқаришда фойдаланилган.
Иерархик агломератив алгоритмни амалга ошириш жараёнида ушбу
алмаштириш асосида олинган латент аломатлар информативлик муносабати
бўйича тартибланди;

5.

Сувғориладиган ерлар шўрланишининг мотиноринги ва саратон

касаллигини ташҳис қилиш учун иккита ахборот моделлар қурилди. Модел
доирасида ўргатувчи танланманинг шовқин объектлари аниқланди. Шовқин
объектларни ўчиришдан олинган самара синфнинг ва бутун танланма
компактлик баҳоси орқали кўрсатилди.

17

НАУЧНЫЙ СОВЕТ DSc.27.06.2017.FM.01.02

ПО ПРИСУЖДЕНИЮ УЧЕНЫХ СТЕПЕНЕЙ ПРИ

НАЦИОНАЛЬНОМ УНИВЕРСИТЕТЕ УЗБЕКИСТАНА

НАЦИОНАЛЬНЫЙ УНИВЕРСИТЕТ УЗБЕКИСТАНА

САИДОВ ДОНИЁР ЮСУПОВИЧ

ИНФОРМАЦИОННЫЕ МОДЕЛИ НА ОСНОВЕ НЕЛИНЕЙНЫХ

ПРЕОБРАЗОВАНИЙ ПРИЗНАКОВОГО ПРОСТРАНСТВА В ЗАДАЧАХ

РАСПОЗНАВАНИЯ

05.01.03 – Теоретические основы информатики

АВТОРЕФЕРАТ ДИССЕРТАЦИИ ДОКТОРА ФИЛОСОФИИ (PHD)

ПО ФИЗИКО-МАТЕМАТИЧЕСКИМ НАУКАМ

г.Ташкент –

2017 год

18

Тема диссертации доктора философии (PhD)

по физико-математическим наукам

зарегистрирована в Высшей аттестационной комиссии при Кабинете Министров
Республики Узбекистан за № B2017.3.PhD/FM103.

Диссертация выполнена в Национальном Университете Узбекистана имени Мирза Улугбека.
Автореферат диссертации на трех языках (узбекский, русский, английский (резюме))

размещен на веб-странице Научного совета (www.ik-fizmat@nuu.uz) и на Информационно-
образовательном портале «Ziyonet» (www.ziyonet.uz).

Научный руководитель:

Игнатьев Николай Александрович

доктор физико-математических наук, профессор

Официальные оппоненты:

Усманов Ришад Ниязбекович

доктор технических наук, профессор

Ибрагимов Фарходжон Нурмухамаджонович

кандидат физико-математических наук

Ведущая организация:

Ташкентский государственный технический
университет имени Ислама Каримова

Защита диссертации состоится «____» _____________2017 года в ____ часов на заседании

Научного совета DSc.27.06.2017.FM.01.02 при Национальном университете Узбекистана. (Адрес:
100174, г. Ташкент, Алмазарский район, ул. Университетская, 4. Тел.: (+99871)227-12-24,
факс: (+99871) 246-53-21, e-mail: nauka@nuu.uz).

С диссертацией можно ознакомиться в Информационно-ресурсном центре Национального

университета Узбекистана (зарегистрирована за №_____). (Адрес: 100174, г. Ташкент,
Алмазарский район, ул. Университетская, 4. Тел.: (+99871) 246-02-24).

Автореферат диссертации разослан «____» _______________2017 года.
(протокол рассылки №________ от «____» _______________2017 года).

А. Р. Марахимов

Председатель Научного совета по
присуждению ученых степеней, д.ф.-
м.н., профессор

З. Р. Рахмонов

Ученый секретарь Научного совета по
присуждению ученых степеней, д.ф.-
м.н.

Р.Ж. Алоев

Председатель научного семинара при
Научном совете по присуждению
ученых степеней,

д.ф.-м.н., профессор

19

ВВЕДЕНИЕ (аннотация диссертации доктора философии(PhD))

Актуальность и востребованность темы диссертации.

Использование

цифровых технологий является локомотивом повышения эффективности
производства товаров и услуг в мире. Большая роль в развитии этих
технологий отводится

методам искусственного интеллекта

(ИИ).

Значительная часть методов ИИ применяется для интеллектуального анализа
данных (ИАД). Скрытые закономерности, извлекаемые из данных с
помощью ИАД, является новыми знаниями в информационных моделях, в
рамках которых обосновывается процесс принятия решений для слабо
структурированных предметных областей.

Мировая практика свидетельствует, что большая часть усилий

построения информационных моделей в слабо структурированных
предметных областях становятся неэффективными из-за большой
размерности признакового пространства и высокой комбинаторной
сложности

алгоритмов

для

поиска

логических

закономерностей.

Продолжается исследование проблемы поиска информативных наборов
признаков и подмножества объектов обучения, которые обладают лучшим
качеством в смысле решения задач распознавания чем исходные множества
признаков и объектов. Одним из путей повышения качества систем
распознавания является синтез латентных признаков для описания объектов
путём нелинейного отображения определяемых наборов признаков на
числовую ось. Повышение точности алгоритмов классификации, извлечение
скрытых закономерностей из баз (хранилищ) данных определяет
актуальность данного исследования.

В нашей стране в годы независимости большое внимание уделяется

научным направлениям, имеющим фундаментальное и прикладное значение.
В частности, если в задачах приобретения знаний подразумевается, что
представление знаний является заданными априори и нужно лишь построить
систему в рамках этих представлений, то в задачах метаобучения ставится
вопрос об автоматическом представлении самих представлений, детали
которых могут сильно меняться в зависимости от предметной области.
Решение задач метаобучения необходимо для снятия следующего
ограничения для машинных систем – их способности функционировать
только в узкой предметной области. На основе Стратегии Действий по
развитию Республики Узбекистан особенно большое значение приобретают
эффективные механизмы внедрения научных и инновационных достижений
в целях повышения эффективности в сфере экономики страны.

Эта диссертация, в определенной степени, служит осуществлению задач,

обозначенных в Постановлениях Президента Республики Узбекистан
№-ПП-916 «О дополнительных мерах по стимулированию внедрения
инновационных проектов и технологий в производство» от 15 июля
2008 года, №-ПП-2789 «О мерах по дальнейшему совершенствованию
деятельности Академии наук, организации, управления и финансирования
научно-исследовательской деятельности» от 17 февраля 2017 года и

20

№-УП- 4947 «О стратегии действий по дальнейшему развитию Республики
Узбекистан» от 8 февраля 2017 года а также в других нормативно-правовых
актах по данной деятельности.

Соответствие исследования приоритетным направлениям развития

науки и технологий республики.

Данное исследование выполнено в

соответствии с приоритетным направлением развития науки и технологий
Республики Узбекистан IV. «Математика, механика и информатика».

Степень изученности проблемы.

Попытки использования нелинейных

классификаторов предпринимались неоднократно с помощью обобщенных
решающих функций. На практике это был уход в новое признаковое
пространство, размерность которого была выше чем у исходного.
В.Н. Вапником и Червоненкисом было доказано, что с ростом размерности
признакового пространства увеличивается вероятность корректного
разделения классов выборки объектов.

В развитие теории и практики использования методов распознавания

большой вклад внесли известные зарубежные и отечественные учёные.
Среди

зарубежных

учёных

можно

выделить

Журавлева

Ю.И.,

Загоруйко Н.Г., Дюк В.А., Воронцова К.В., Вапника В.Н., среди
отечественных особо следует отметить труды Камилова М.М.,
Бекмуратова Т.Ф., Адыловой Ф.Т., Фазылова Ш.Х., Мухамадиевой Д.Т.

Связь темы диссертации с научно-исследовательскими работами

учреждением высшего образования, где выполнялась диссертация.

Диссертационное исследование выполнено в рамках научного гранта
согласно

плану

научно-исследовательских

работ

Национального

университета Узбекистана

Ф-4-64 «Разработка и обоснование методов

вычисления обобщённых оценок и индивидуальных метрик объектов в
интеллектуальном анализе данных» (2011-2016 гг.).

Целью исследования.

Совершенствование критериев и методов

искусственного интеллекта на основе нелинейных преобразований
признакового пространства в задачах распознавания образов.

Задачи исследования

состоит в следующем:

разработка и обоснование агломеративных

иерархических методов

группировки признаков для линейного и нелинейного отображения их
значений в описании объектов на числовую ось;

визуализация данных с использованием линейного и нелинейного

методов. Разработка критерия для оценки качества результатов
визуализации;

оценка обобщающей способности алгоритмов распознавания при

описании объектов с помощью латентных признаков;

оценка сложности алгоритма разделения значений признаков в описании

классифицированных объектов на непересекающиеся интервалы с учётам и
без учёта предобработки;

разработка комплекса программ для иерархической агломеративной

группировки, визуализации данных и вычисления обобщающей способности

21

алгоритмов распознавания. Использование комплекса для построения
информационных моделей в слабо структурированных предметных областях.

Объект исследования.

Разработка и обоснование моделей алгоритмов

распознавания образов.

Предмет исследования.

Методы выбора признакового пространства для

описания допустимых объектов в задачах распознавания.

Методы исследования.

Поиск оптимальных алгоритмов распознавания

на основе методов дискретной математики, теории искусственного
интеллекта,

математического

анализа,

программирования

на

алгоритмических языках.

Научная новизна исследования

заключается следующем:

Совершенствован метод формирования нелинейных решающих правил

на основе обучающих выборок данных;

описана методика сравнения результатов визуализации на основе

критерия компактности. Значения компактности определяются по
результатам разбиения объектов каждого класса на минимальное число
непересекающихся групп;

получена

оценка

сложности

алгоритма

разбиения

значений

количественных признаков на непересекающиеся интервалы: с учетом
пропусков и повторяющихся значений; с учётом и без учёта предобработки
данных;

доказано повышение обобщающей способности алгоритма ближайший

сосед при переходе от исходного описания объектов в пространство из
латентных признаков;

показано, что при иерархической агломеративной группировке

признаков и нелинейном отображении их на числовую ось формируются
наборы латентных признаков, упорядоченные по отношению их
информативности.

Практические результаты исследования

заключаются в следующем:

разработан способ оценки результатов визуализации при линейном и

нелинейном отображении описаний объектов на числовые оси;

значительно уменьшился число измеряемых исходных признаков без

снижения обобщающей способности алгоритмов распознавания при
использовании иерархической агломеративной группировки признаков;

применение

порогов

линейных

дискриминантных

функций,

вычисленных с использованием оптимального значения критерия разбиения
значений результатов отображения признаков на числовую ось повысил
точность и обобщающую способность алгоритмов распознавания;

разработан программный комплекс по решению задач распознавания

методами отбора латентных признаков на основе линейного и нелинейного
отображений наборов признаков в описании объектов на числовую ось.

Достоверность результатов исследования.

Достоверность полученных

результатов обосновывается тем, что итоги вычислительных экспериментов
на модельных и тестовых данных подтверждают высокую обобщающую
способность

алгоритмов

распознавания

на

основе

нелинейных

22

преобразований признакового пространства, доказывается повышение
показателей компактности обучающих выборок по результатам визуализации
объектов с помощью латентных признаков.

Научная и практическая значимость результатов исследования.

Научная значимость результатов исследования заключается в развитии
методов линейного и нелинейного формирования нового признакового
пространства с описанием допустимых объектов, позволяющих повысить
обобщающую способность алгоритмов распознавания, извлекать скрытые
закономерности из баз и хранилищ данных в виде новых знаний из слабо
формализованных предметных областей, обоснование принятия решений на
основе вывода аналитического представления нелинейных правил,
визуализации признакового пространства и его оценки по критерию
компактности, отбора информативных наборов признаков.

Практическая значимость результатов исследования заключается в

использовании программного комплекса для извлечения скрытых
закономерностей из баз и хранилищ данных, позволяющих получить новые
знания из слабо формализованных предметных областей, строить
информационные модели принятия решений на основе предложенных
критериев оценки качества алгоритмов.

Внедрение результатов исследования.

На основе разработанных

методов исследования:

метод иерархической агломеративной группировки признаков и

нелинейное отображения их на числовую ось внедрен в Государственного
комитета Республики Узбекистан по земельным ресурсам, геодезии,
картографии и государственному кадастру для построения информационной
модели засолённости почв (справка от 20 октября 2017 года №03-05-8912
Государственного комитета Республики Узбекистан по земельным ресурсам,
геодезии, картографии и государственному кадастру). Предлагаемый в
результате исследований метод отображения позволил выявить скрытые
закономерности по трём типам засолённости почв путем отбора связанных
нелинейной зависимостью признаков;

методы селекции данных посредством обнаружения и удаления

шумовых объектов выборки, вычисления значений меры компактности и
визуализации данных были применены в Государственного комитета
Республики Узбекистан по земельным ресурсам, геодезии, картографии и
государственному кадастру для мониторинга засоленности почв (справка от
20 октября 2017 года №03-05-8912 Государственного комитета Республики
Узбекистан

по

земельным

ресурсам,

геодезии,

картографии

и

государственному кадастру). В результате внедрение этих методов позволил
определять веса номинальных и количественных признаков в процессе
засоления почвы и визуализировать отношений между объектами, а также
выявить аномальные объекты выборки.

Апробация

результатов

исследования.

Результаты

данного

исследования были обсуждены, в том числе, на 5 международных и
3 республиканских научно-практических конференциях.

23

Публикация результатов исследования.

По теме диссертации

опубликовано 20 научных работ, из них 8 входят в перечень научных
изданий, предложенных Высшей аттестационной комиссией Республики
Узбекистан для защиты диссертаций доктора философии, в том числе из них
3 опубликованы в зарубежных журналах и 5 в республиканских научных
изданиях.

Структура и объем диссертации.

Структура диссертации состоит из

введения, трех глав, заключения, списка использованной литературы и
3 приложений. Объем диссертации составляет 93 страниц.

ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введении

обоснована актуальность и востребованность темы

диссертации, определено соответствие исследования приоритетным
направлениям развития науки и технологий республики, приведены обзор
зарубежных научных исследований по теме диссертации и степень
изученности проблемы, сформулированы цели и задачи, выявлены объект и
предмет исследования, изложены научная новизна и практические
результаты исследования, раскрыта теоретическая и практическая
значимость полученных результатов, даны сведения о внедрении результатов
исследования, об опубликованных работах и о структуре диссертации.

В первой главе описывается использование разбиение значений

признаков на непересекающиеся интервалы для вычисления параметров
распознающих алгоритмов и выбора пространства в описании объектов.

Свойство линейной разделимости объектов классов рассматривается с

точки зрения логических закономерностей в форме полуплоскостей.
Алгоритмы решения задач на базе логических закономерностей
характеризуются огромной комбинаторной сложностью. Для уменьшения
сложности предлагается использовать предобработку данных и некоторые
эвристики.

Пусть задано множество объектов

0

1

{ ,...,

}

m

E

S



, содержащее

представителей

l

непересекающихся классов

. Описание объектов

производится с помощью набора из

n

разнотипных признаков





1

,...,

,

n

X

x







n

 



из которых измеряются в номинальной,

n





в

интервальной шкалах. Допускается наличие пропусков и повторяющихся
значений в данных. Считается, что задан критерий

 

*

F

для разбиения

значений количественного признака (как исходного так и латентного) на
непересекающиеся интервалы. Требуется определить значения границ

l

интервалов при

 

*

.

F

extr



Пусть

p

i

u

- множество измеренных значений количественного признака

,

j

x

j

I I

n





 

класса

i

K

в

интервале

2

1

2

(

,

]

p

c



,

0

( ,..., ),

0,

,

l

j

A

a

m



j

m

-

число объектов без пропусков

(2

)

j

l

m



по

j

x

,

ij



- число повторяющихся значений признака

j

x

в

1

,...,

l

K

24

классе

i

K

,

p

a

- порядковый номер элемента упорядоченной по возрастанию

последовательности

1

,...,

j

m

r

значений

j

x

из

0

E

, определяющий правую

границу интервала

2

.

p

a

c

r



Критерий

1

(

1)

|

| (|

| 1)

l

p

i

p

i

l

ij

i

u u





































1

{ }

1

(

|

)

max

|

| (

|

|)

l

p

i

j

ij

t

i

p

i

t

l

A

ij

j

ij

i

u m

u

m



















 



















(1)

позволяет

вычислять

оптимальные

значения

границ

интервалов

2

1

2

{(

,

]},

1,

p

c

p

l





и использовать их для определения градаций

количественного признака в номинальной шкале измерений.

Описана предобработка данных для уменьшения сложности вычисления

(1). Сделана оценка сложности алгоритма с учётом предобработки данных,
наличия пропусков и повторяющихся значений. На рис. 1 показано
изменение

сложности

алгоритма

вычисления

(1)

при

наличии

повторяющихся значений.

Рис.1.

Изменение сложности при наличии повторяющихся значений признака.

Нелинейные преобразования признаков, как правило, приводили к

описанию объектов в пространстве (обобщённом пространстве) более
высокой размерности, чем исходное. Предлагается ряд эвристик для отбора
информативных признаков в обобщенном пространстве и повышения
обобщающей способности алгоритмов.

25

Пусть

1

2

,

m m

- векторы математических ожиданий признаков из класса

1

2

,

K K

. Для каждого признака

( )

i

x

X n



по

1

2

,

m m

вычисляются значения

внутриклассового сходства

i



и межклассового различия

i



. Соотношение

j

 

(2)

даёт возможность оценивать и упорядочивать признаки по плотности их
распределения вокруг математических ожиданий классов.

Также как и в (2) вычисление внутриклассового сходства по отдельному

признаку

( )

r

x

X n



используется в критерии

2

1

2

1

2

,

m

s





(3)

в котором сумма внутриклассового разброса

1

2

,

r

s



 

а

1

2

m



есть

разность математических ожиданий классов

1

K

и

2

K

на числовой оси.

Критерий Фишера

 

2

1

2

1

2

max

m

w

s











использовался для выбора

пар признаков линейной решающей функции (ЛРФ) из

Y

(

p

)=(

y

1

,…,y

p

),

p>n

,

где

 

i

y

Y p



- комбинация признаков из

 

.

X n

Применялся способ выбора порога ЛРФ без всяких предположении о

природе среды. Значение порога вычислялось по границе

2

c

интервалов









1

2

3

,

c c

по (1) как

 





0

2

w

c

u S





(4)

где

 

1

2

i

j

u S

w s





, и





1

,...,

p

S

s



,

 





2

3

,

u S

c c



- ближайщий к

2

c

объект

0

E

на числовой оси. Доказано, что обобщающая способность ЛРФ в

большинстве случаев выше при выборе порога по (4) чем при выборе порога
в предположении о нормальном распределении выборки.

Во второй главе предлагается иерархическая агломеративная

группировка на основе нелинейного отображения пар признаков на числовую
ось. По результатам группировки решается проблема селекции признакового
пространства и отбора информативных наборов исходных признаков. Целью
группировки объектов является проверка истинности гипотезы о
компактности при различных многообразиях представления признакового
пространства. В §3.1 рассматривается задача о линейном отображении
признаков на числовую ось. Различия между линейным и нелинейным
методами вычисления латентных признаков приводятся в табл. 1.

26

Таблица 1.

Различия между линейным и нелинейным методами

№

Метод вычисления латентных признаков

Линейный

Нелинейный

1. Формирование групп признаков

производится

по

правилам

иерархической агломеративной
группировки. Признаки каждый
группы линейно отображаются в
один латентный признак.

Последовательное

формирование

латентных признаков из исходных
производится

по

правилам

иерархической

агломеративной

группировки.

2. Отбор

информативных

латентных признаков зависит от
выбранной меры близости между
объектами.

Существует

способ

отбора

информативных

латентных

признаков.

Метод

инвариантен

масштабам измерения признаков и
мерам близости между объектами.

Нелинейные преобразования используются как для количественных так

и разнотипных признаков. Для количественных признаков постановка задачи
выглядит так.

Рассматривается двухклассовая задача распознавания в стандартной

постановке. Объекты выборки





0

1

,...,

m

E

S



принадлежит одному из

классов

1

K

или

2

K

,





0

1

2

E

K





и описываются с помощью

n

количественных признаков

  



1

,...,

n

X n

x



. На

0

E

задано правило

последовательного разбиения набора

( )

X n

на непересекающиеся

подмножества

 

1

,...,

,

1,

...

X k

X

k

n





 



. Требуется:



для каждого

 

i

X k

определить алгоритм

i

A

(распознающий оператор

в терминологии алгебраического подхода к распознавания образов Ю.И.
Журавлёва) для последовательного отображения значений признаков из

 

i

X k

в описании объекта

0

,

1,

j

S

E

j

m





в значение (обобщённую оценку)

на числовой оси;



получить

аналитический

вид

(формулы)

для

вычисления

распознающего оператора

i

A

.

Пусть

1

2

,

i

u u

– количество значений признака

,

p

j

x

j

I



,

I=

{

1,2,…,n

}

класса

,

1, 2

i

K i



соответственно в интервалах



1

2

3

,

jp

c









,

1

i

K



,



–

порядковый

номер

элемента

упорядоченной

по

возрастанию

последовательности

1

,....,

,...,

j

jm

r



значений

p

j

x

из

0

E

определяющий

границы интервалов как

1

2

3

,

jp

j

jm

c

r c

r

c

r





. Критерий

27













1

2

3

2

1

2

1

2

1

max

2

1

jp

d

i

c

i

d

i

d

i

u

K

u

K K

K





























 

























(5)

позволяет вычислять оптимальное значение границы между интервалами



1

2

3

,

jp

c









. Экстремум критерия (5) используется в качестве веса





0

1

p

j





признака

p

j

x

.

Значение обобщённой оценки

p

rij

b

объекта





1

,

,...,

p

r

r n p

S

a





,

0

r

S

E



по

паре









,

,0

, ,

1,...,

,

p

i

j

x x

p

n i j

n

p i

j

 







,

вычисляется как





2

3

1

3

1

2

3

1

, ,

,

p

jp

p

ip

rj

p

ri

rij

ij

i

j

ip

jp

p

ijp

ri

rj

p

ij

ijp

a

c

a

c

b

t

c

a a

c

t

i j

I

c





































































 

















 

, ,

1,1

i

j

ij

t t t

 

,

 

0,1

ij





,

где

,

p

i

j

ij

  

– веса признаков, определяемые по (5) соответственно по

множеству значений признаков

,

p

i

j

x x

и их произведения

p

i

j

x x

, значения

 

, ,

1,1

i

j

ij

t t t

 

,

 

0,1

ij





выбирается по экстремуму функционала





1

2

0

min

max

, ,

max

min

r

p

rij

S

K

S

K

p

rij

S

E

S

E

b

p i j

b











.

(6)

Рассматривается эксперимент на медицинских данных с показателями

гипертонической болезни, где класс:

𝐾

1

(практически здоровые);

𝐾

2

(больные). В табл. 2 приведены результаты последовательного объединения
исходных признаков в первую группу и порядок синтеза значений
обобщенных оценок (латентных признаков) из комбинаций признаков по
критерию (5) и отступами между объектами классов по (6) с учётом
вложенных скобок.

28

Таблица 2.

Результаты группировки признаков

.

Номер

группы

Последовательность объединения

признаков

Значение

критерия (5)

Отступ по (6)

1

4

20

( ,

)

x x

0.9672

-0.0659

4

20

9

(( ,

),

)

x x

x

0.9672

-0.0325

4

20

9

18

((( ,

),

)

x x

x

1.0000

0.0055

4

20

9

18

8

(((( ,

),

)

x x

x

1.0000

0.0076

4

20

9

18

8

2

((((( ,

),

)

x x

x

1.0000

0.0079

4

20

9

18

8

2

10

(((((( ,

),

)

x x

x

1.0000

0.0101

4

20

9

18

8

2

10

12

((((((( ,

),

)

x x

x

1.0000

0.0105

Аналитический

вид

последовательности

вычисления

значений

латентного признака по первой группе:

1

0.006947([

] 140)

0.394923([

] 0.42)

0.0041346([

] [

] 68.2);

АДС

ДИАСТОЛА

АДС

ДИАСТОЛ

y

А

 











1

2

1

1.602699(

0.0047)

3.128708([

] 0.08)

QRS

y









;

1

3

2

0.581198

0.551857([

] 0.485)

0.892018

[

]

СИСПО

y

К

СИСПО

y

К











;

1

4

3

0,21174(

0.0388)

0.275601([

] - 0.36)

2.136341(

[

] 0.0124);

QT

y

QT

y









1

5

4

0.005789(

[

] 1.9623)

y

Рост

y







;

1

6

5

0.310793

[

]

y

П

y

ПЛ





;

1

7

6

0.1804337

[

]

y

Р

y

КД





.

Для анализа результатов визуализации предлагается использовать такую

структурную характеристику как оценка компактности класса

2

1

2

ij

j

i

m









,

(7)

где



- число непересекающихся групп в

,

1,

i

K i

l



,

i

m

K



,

ij

m

- число

объектов в

j

– ой группе класса

i

K

. Усреднённая оценка компактности по

обучающей выборке вычисляется с помощью формулы

1

0

F(E , )

.

l

i i

i

m









(8)

где

m

-количество объектов в выборке.

В третьей главе показатели компактности используются для анализа

различных преобразований признакового пространств.

Значения устойчивости объектов служат мерой структурного

разнообразия выборки, которую можно использовать для поиска и удаления
шумовых объектов с целью повышения обобщающей способности
алгоритмов. Многообразие значений устойчивости объектов классов
напрямую зависит от выбора метрики. В работе реализовано:

29



разбиение исходного набора признаков на непересекающиеся группы

по правилам иерархической агломеративной группировки и формирование на
их основе набора латентных признаков;



отбор набора информативных латентных признаков;



обнаружение и удаление шумовых объектов с целью повышения

обобщающей способности алгоритмов распознавания.

Для интервалов, построенных по критерию (5), определим













1

2

( )

|

,

i

d

p

d

p

S

K

S S

c c









,













2

3

1

2

( )

|

,

i

d

p

d

p

S

K

S S

c c











,

1

( )

( ) /

p

K







и

2

3

( )

( ) /

p

K









.

Устойчивость

объекта

,

1,2

d

p

S

K

p





по подмножеству признаков

(k)

X

вычисляется следующим

образом:









1

2

,

( )

( ) 1

( ) .

d

U S X k

p







Для включения признака

( )

a

x

X n



в набор (группу)

( ),

( )

X k X k

X n



используется функционал

  







 













1

1,

,

1 ,

1

,

1

0,

.

m

d

U S X k

M X k

X k

m

в противномслучае





















Показана связь удаления шумовых объектов и увеличение компактности

по (7) и (8). Экспериментально подтверждено преимущество нелинейного
метода перед линейным по показателю (8).

ЗАКЛЮЧЕНИЕ

Разработка и обоснование методов интеллектуального анализа для

информационных моделей, основанных на знаниях, является актуальным
направлением научных исследований. Отношения между объектами на
многообразиях структур признаков исследуются с помощью нелинейных
преобразований пространства с использованием методов кластерного
анализа. Цель нелинейных преобразований выражается в стремлении к
идеальной компактности объектов из непересекающихся классов.
Интерпретация компактности в терминах нечётной логики используется для
поиска скрытых закономерностей в базах данных.

Основные результаты, полученные в данной работе:
1.

Разработаны

правила

для

иерархической

агломеративной

группировки признаков, используемые для линейного и нелинейного
отображения разнотипных признаков на числовую ось. Описаны
существенные различия между линейным и нелинейным отображением. С
помощью предложенных правил удалась существенно сократить размерность
исходного признакового пространства;

2.

Предложены способы предобработки данных для вычисления

оптимальных границ интервалов. При поиске границ используется проверка
истинности гипотезы «В границах каждого интервала лежат значения
признаков в описании объектов одного класса». Определена оценка

30

сложности алгоритмов для поиска при наличии повторяющихся значений и
пропусков в данных. Значения границ интервалов использовались в правилах
иерархической агломеративной группировки для вычисления устойчивости
объектов по группе признаков и включения признака в нелинейную
комбинацию;

3.

Предложен способ оценки компактности обучающей выборки с

множеством допустимых значений в (0, 1]. С помощью вычислительного
эксперимента доказано, что при нелинейном преобразованием признаков
компактность выше чем при линейном и в исходном пространстве из
«сырых» признаков. Показано, что оценка компактности имеет связь с
показателями обобщающей способности алгоритмов;

4.

Нелинейное преобразование признаков было использовано для

вывода аналитического представления решающих правил. Латентные
признаки на основе этого преобразования были упорядочены по отношению
информативности в процессе реализации иерархического агломеративного
алгоритма;

5.

Построены две информационные модели для диагностики рака и

мониторинга засоленности орошаемых земель. В рамках моделей
определены шумовые объекты обучающих выборок. Эффект от удаления
шумовых объектов показан с помощью оценок компактности классов и
выборки в целом

31

SCIENTIFIC COUNCIL AWARDING SCIENTIFIC DEGREES

DSc.27.06.2017.FM.01.02 NATIONAL UNIVERSITY OF UZBEKISTAN

NATIONAL UNIVERSITY OF UZBEKISTAN

SAIDOV DONIYOR YUSUPOVICH

INFORMATION MODELS BASED ON NONLINEAR

TRANSFORMATIONS OF FEATURE SPACE IN PATTERN

RECOGNITION

05.01.03 – Theoretical foundations of informatics

ABSTRACT OF DISSERTATION OF THE DOCTOR OF

PHILOSOPHY (PhD) ON PHYSICAL AND MATHEMATICAL SCIENCES

Tashkent–2017

32

The theme of dissertation of doctor of philosophy (PhD) on physical and mathematical

sciences was registered at the Supreme Attestation Commission at the Cabinet of Ministers of the
Republic of Uzbekistan under number B2017.3.PhD/FM103.

Dissertation has been prepared at the National University of Uzbekistan named after

Mirzo Ulugbek.

The abstract of the dissertation is posted in three languages (Uzbek, Russian, English (resume)) on

the website (www.ik-fizmat.nuu.uz) and the «Ziyone» Information and educational portal
(www.ziyonet.uz).

Scientific supervisor:

Ignatyev Nikolay Aleksandrovich

doctor of physical and mathematical sciences, professor

Official opponents:

Usmonov Rishad Niyazbekovich

doctor of technical sciences, professor

Ibragimov Farkhadjan Nurmuhamadjonovich

candidate of physical and mathematical sciences

Leading organization:

Tashkent state technical university named after
Islam Karimov

Defense will take place «____» _____________2017 at _____ at the meeting of Scientific Council

number DSc.27.06.2017.FM.01.02

at National University of Uzbekistan, Institute of Mathematics.

(Address: University str. 4, Almazar area, Tashkent, 100174, Uzbekistan, Ph.: (+99871) 227-12-24,
fax: (+99871) 246-53-21, e-mail: nauka@nuu.uz).

Dissertation is possible to review in Information-resource centre at National University of

Uzbekistan (is registered №____) (Address: University str. 4, Almazar area, Tashkent, 100174,
Uzbekistan, Ph.: (+99871) 246-02-24).

Abstract of dissertation sent out on «____» _______________2017 year
(Mailing report № ___________on «____» _______________2017 year)

A. R. Maraximov

Chairman of scientific council on award of
scientific degrees, D.T.S., Professor

Z. R. Raxmonov

Scientific secretary of scientific council on
award of scientific degrees, D.F.-M.S.

R. J. Aloev

Chairman of scientific Seminar under
Scientific Council on award of scientific
degrees, D.F.-M.S., professor

33

INTRODUCTION (abstract of PhD thesis)

The aim of research work

is development of criteria and methods of

artificial intelligence based on nonlinear transformation of feature space in pattern
recognition problems.

The object of the research work

is

development and validation of the model

of pattern recognition algorithms.

Scientific novelty of the research work

is as follows:



the method of forming nonlinear decision rules based on training data

samples is developed;



a methodology for comparing visualization results based on the

compactness criterion is described. The compactness values are determined by the
results of partitioning the objects of each class into the minimal number of disjoint
groups;



an estimation of the complexity of the algorithm for dividing the values of

quantitative features into disjoint intervals is obtained: taking into account the
missing values and repeated values; with and without taking into account the
preprocessing of data.



the increase of the generalizing ability of the algorithm of the nearest

neighbor during the transition from the initial description of objects to the space of
latent features is proved;



it is shown that with a hierarchical agglomeration grouping of features and

non-linear mapping of thair values onto the numerical axis, formed the set of latent
features and ordered in relation of their informativeness.

Implementation of the research results.

On the basis of the developed

methods of research:

agglomerative hierarchical method of grouping features and nonlinear

mapping them on the numerical axis introduced in the State Committee of the
Republic of Uzbekistan on Land Resources, Geodesy, Cartography and State
Cadaster for building information model of soil salinity(Certificate of October 20,
2017 №03-05-8912 State Committee of the Republic of Uzbekistan Land
Resources, Geodesy, Cartography and State Cadaster). The mapping method
proposed as a result of the research made it possible to obtain the hidden
regularities in three types of salinity of the soil by selecting the features associated
with nonlinear dependence;

methods of data selection by detecting and removing noisy objects of the

sample, calculating compactness values, and visualizing data were applied to the
State Committee of the Republic of Uzbekistan for Land Resources, Geodesy,
Cartography and the State Cadaster for Monitoring Soil Salinity (Certificate of
October 20, 2017 No. 03-05 -8912 of the State Committee of the Republic of
Uzbekistan for Land Resources, Geodesy, Cartography and State Cadaster). As a
result of the introduction of these methods allowed to determine the weight of the
nominal and quantitative features in the process of soil salinization and visualize
the relationships between the objects, and to identify abnormal sample objects.

34

The structure and volume of the thesis.

The thesis consists of an

introduction, three chapters, conclusion and bibliography. The volume of the thesis
is 93 pages.

35

ЭЪЛОН ҚИЛИНГАН ИШЛАР РЎЙҲАТИ

СПИСОК ОПУБЛИКОВАННЫХ РАБОТ

LIST OF PUBLISHED WORKS

I бўлим (I часть; I part)

1.

Игнатьев Н.А., Саидов Д.Ю. Вычисление сложности эффективных

алгоритмов выбора оптимальных границ интервалов // Проблемы
информатики и энергетики, 2014, – Ташкент, N 6, C. 35-40. (05.00.00; № 5).

2.

Саидов Д.Ю. Аналитическое представление распознающих

операторов для вычисления обобщённых оценок // Вестник НУУз, 2016, –
Ташкент, N 2/2, C. 102-107. (01.00.00; № 8).

3.

Madraximov Sh.F., Saidov D.Y. Sinf obyektlarining turg`unligi va

alomatlarni guruhlash // Проблемы вычислительной и прикладной математики,
2016, – Ташкент, N 3(5), C. 50-55. (01.00.00; № 9).

4.

Саидов Д. Ю., Нуржанов Ш. Обобщающая способность алгоритмов

распознавания с учётом нелинейности // Проблемы информатики и
энергетики, 2016, – Ташкент, N 1, C. 33-39. (05.00.00; № 5).

5.

Saidov D.Y. Analytical representation of recognition operators to

calculate the generalized estimation //International Journal of Innovative Science,
Engineering & Technology, 2016, India, Vol. 3, Issue 10, pp. 197-200, (Scientific
Journal Impact Factor=4.332, №23).

6.

Saidov D.Y. Data visualization and its proof by compactness criterion of

objects of classes //International Journal of Intelligent Systems and Applications,
2017, Hang Kong, Vol 9, No. 8, pp. 51-58, (Global Impact Factor=0,743, №5).

7.

N.A. Ignatyev, Sh.F.Madrakhimov, D.Y.Saidov. Stability of object

classes and selection of the latent features // International journal of engineering
technology and sciences, 2017, Malaysia, Vol. 7, pp. 1-10, (Global Impact
Factor=0,562, №5).

8.

Саидов Д.Ю. Нелинейное отображение наборов признаков на

числовую ось и дискриминантный анализ данных // Проблемы
вычислительной и прикладной математики, 2017, – Ташкент, N 1(7), C. 18-23.
(01.00.00; №9).

II бўлим (II часть; II part)

9.

Саидов Д.Ю. Алгоритмы выбора оптимальных границ интервалов по

критерию компактности // Материалы научно-технической конференции
«Прикладная математика и информационная безопасность», 2014, Ташкент,
с. 242.

10.

Саидов Д.Ю. Нелинейные преобразования в признаковом

пространстве // Труды научной конференции «Неклассические уравнения
математической физики и их приложения», 2014, Ташкент, с. 332.

11.

Саидов

Д.Ю.

Нелинейные

преобразования

признакового

пространства и их аналитические представления // Международный
молодежный научный форум «Ломоносов-2015», 2015, - Россия

36

12.

Мадрахимов Ш.Ф., Саидов Д. Ю. Группировка признаков по

критерию устойчивости объектов классов // Материалы тезисов
Международной научно-технической конференции «Актуальные проблемы
прикладной математики, информатики и механики», 2016 – Воронеж C. 93-
96.

13.

Саидов Д.Ю. Нелинейные преобразования в задачах распознавания с

учителем и их Визуаллаштириш // Материалы Республиканской научно-
технической конференции «Проблемы информационных и
телекоммуникационных технологий», 2016, Ташкент, с. 62-65.

14.

Саидов Д.Ю. Выбор порогов в дискриминантный анализ данных //

Материалы тезисов Международной научно-технической конференции
«Актуальные проблемы прикладной математики и информационных
технологий – Аль-Хорезми 2016», 2016, Бухара, с. 30.

15.

Мадрахимов Ш.Ф., Саидов Д.Ю. Выбор латентных признаков по

результатам иерархической агломеративной группировки данных //
Материалы тезисов Международной научно-технической конференции
«Актуальные проблемы прикладной математики и информационных
технологий – Аль-Хорезми 2016», 2016, Бухара, с. 88-91.

16.

Игнатьев Н.А., Саидов Д.Ю. Анализ данных и принятие решений с

помощью логических закономерностей в форме полуплоскостей // Известия
СамНЦ, 2017, Том 19, № 4(2), С. 294-300. (РИНЦ Импакт-фактор 0,347)

17.

Saidov D.Y. Calculation and analysis the compactness values of classes

and the training sample as a whole // The 4th International Conference on BIG
DATA APPLICATIONS AND SERVICES, Vol.4, No.1, 2017, Tashkent, pp. 324-
327

18.

Игнатьев Н.А., Саидов Д.Ю.

Линейные дискриминантные функции и

выбор спрямляющего пространства для их реализации // Известия Академии
Вооруженных сил Республика Узбекистана, Ташкент, 2017.

№

1 (24). C. 128

–

135.

19.

Игнатьев Н.А., Саидов Д.Ю. Guruhlanuvchi alomatlar to`plamini son

o`qiga nochiziqli akslantirish, № DGU 03183, Ўзбекистон Республикаси
Интеллектуал Мулк Агентлиги, Тошкент , 2015

20.

Игнатьев

Н.А.,

Саидов

Д.Ю.

Разбиение

признаков

на

непересекающиеся интервалы по максимуму критерия внутриклассового
сходства и межклассового различия их значений, № DGU 04461, Ўзбекистон
Республикаси Интеллектуал Мулк Агентлиги, Тошкент , 2017

37

Авторефератнинг ўзбек, рус ва инглиз тилларидаги нусхалари

«ЎзМУ хабарлари» таҳририятида таҳрирдан ўтказилди.

Босишга рухсат этилди: 07.12.2017 йил

Бичими 60х44

1

/

16

, «Times New Roman»

гарнитурада рақамли босма усулида босилди.

Шартли босма табоғи 2,4. Адади: 100. Буюртма: № _____.

Ўзбекистон Республикаси ИИВ Академияси,

100197, Тошкент, Интизор кўчаси, 68

«АКАДЕМИЯ НОШИРЛИК МАРКАЗИ»

Давлат унитар корхонасида чоп этилди.

Библиографические ссылки

Игнатьев Н.А., Саидов Д.Ю. Вычисление сложности эффективных алгоритмов выбора оптимальных границ интервалов // Проблемы информатики и энергетики, 2014, - Ташкент, N 6, С. 35-40. (05.00.00; № 5).

Саидов Д.Ю. Аналитическое представление распознающих операторов для вычисления обобщённых оценок // Вестник НУУз, 2016, -Ташкент, N 2/2, С. 102-107. (01.00.00; № 8).

Madraximov Sh.F., Saidov D.Y. Sinf obycktlarining turg'unligi va alomatlarni guruhlash // Проблемы вычислительной и прикладной математики, 2016, - Ташкент, N 3(5), С. 50-55. (01.00.00; № 9).

Саидов Д. Ю., Нуржанов Ш. Обобщающая способность алгоритмов распознавания с учётом нелинейности // Проблемы информатики и энергетики, 2016, - Ташкент, N 1, С. 33-39. (05.00.00; № 5).

Saidov D.Y. Analytical representation of recognition operators to calculate the generalized estimation //International Journal of Innovative Science, Engineering & Technology, 2016, India, Vol. 3, Issue 10, pp. 197-200, (Scientific Journal Impact Factor=4.332, №23).

Saidov D.Y. Data visualization and its proof by compactness criterion of objects of classes //International Journal of Intelligent Systems and Applications, 2017, Hang Kong, Vol 9, No. 8, pp. 51-58, (Global Impact Factor=0,743, №5).

N.A. Ignatyev, Sh.F.Madrakhimov, D.Y.Saidov. Stability of object classes and selection of the latent features // International journal of engineering technology and sciences, 2017, Malaysia, Vol. 7, pp. 1-10, (Global Impact Factor=0,562, №5).

Саидов Д.Ю. Нелинейное отображение наборов признаков на числовую ось и дискриминантный анализ данных И Проблемы вычислительной и прикладной математики, 2017, - Ташкент, N 1(7), С. 18-23. (01.00.00; №9).

Саидов Д.Ю. Алгоритмы выбора оптимальных границ интервалов по критерию компактности // Материалы научно-технической конференции «Прикладная математика и информационная безопасность», 2014, Ташкент, с. 242.

Саидов Д.Ю. Нелинейные преобразования в признаковом пространстве // Труды научной конференции «Неклассические уравнения математической физики и их приложения», 2014, Ташкент, с. 332.

Саидов Д.Ю. Нелинейные преобразования признакового пространства и их аналитические представления // Международный молодежный научный форум «Ломоносов-2015», 2015, - Россия 12. Мадрахимов Ш.Ф., Саидов Д. Ю. Группировка признаков по критерию устойчивости объектов классов // Материалы тезисов Международной научно-технической конференции «Актуальные проблемы прикладной математики, информатики и механики», 2016 - Воронеж С. 93-96.

Саидов Д.Ю. Нелинейные преобразования в задачах распознавания с учителем и их Визуаллаштириш // Материалы Республиканской научно-технической конференции «Проблемы информационных и телекоммуникационных технологий», 2016, Ташкент, с. 62-65.

Саидов Д.Ю. Выбор порогов в дискриминантный анализ данных // Материалы тезисов Международной научно-технической конференции «Актуальные проблемы прикладной математики и информационных технологий - Аль-Хорезми 2016», 2016, Бухара, с. 30.

Мадрахимов Ш.Ф., Саидов Д.Ю. Выбор латентных признаков по результатам иерархической агломеративной группировки данных // Материалы тезисов Международной научно-технической конференции «Актуальные проблемы прикладной математики и информационных технологий - Аль-Хорезми 2016», 2016, Бухара, с. 88-91.

Игнатьев Н.А., Саидов Д.Ю. Анализ данных и принятие решений с помощью логических закономерностей в форме полуплоскостей // Известия СамНЦ, 2017, Том 19, № 4(2), С. 294-300. (РИНЦ Импакт-фактор 0,347)

Saidov D.Y. Calculation and analysis the compactness values of classes and the training sample as a whole // The 4th International Conference on BIG DATA APPLICATIONS AND SERVICES, Vol.4, No.l, 2017, Tashkent, pp. 324-327

Игнатьев Н.А., Саидов Д.Ю. Линейные дискриминантные функции и выбор спрямляющего пространства для их реализации // Известия Академии Вооруженных сил Республика Узбекистана, Ташкент, 2017. No. 1 (24). С. 128-135.

Игнатьев Н.А., Саидов Д.Ю. Guruhlanuvchi alomatlar to'plamini son o'qiga nochiziqli akslantirish, № DGU 03183, Узбекистан Республикаси Интеллектуал Мулк Агентлиги, Тошкент , 2015

Игнатьев Н.А., Саидов Д.Ю. Разбиение признаков на непересекающиеся интервалы по максимуму критерия внутриклассового сходства и межклассового различия их значений, № DGU 04461, Узбекистан Республикаси Интеллектуал Мулк Агентлиги, Тошкент , 2017