Аудио для фонетической сегментации и говори для говори

CC BY f
146-149
35
14
Поделиться
Ахатов, А., Улугмуродов, Ш. А., & Таджиев, . М. . (2022). Аудио для фонетической сегментации и говори для говори. Современные инновационные исследования актуальные проблемы и развитие тенденции: решения и перспективы, 1(1), 146–149. извлечено от https://inlibrary.uz/index.php/zitdmrt/article/view/5273
Акмал Ахатов, Самаркандский государственный университет

проректор по международному сотрудничеству

Шох Аббос Улугмуродов, Джизакский филиал Национального университета Узбекистана

Ассистент кафедры компьютерных наук и программирования

Маруф Таджиев, Джизакский филиал Национального университета Узбекистана

Старший преподаватель кафедры компьютерных наук и программирования

Crossref
Сrossref
Scopus
Scopus

Аннотация

SPPAS — это инструмент для автоматического построения комментариев, включая сегментацию произношения, слова, слога и фонемы из записанного звука речи и его транскрипцию. SPPAS распространяется на условиях общественной лицензии GNU. Он успешно использовался во время кампании Evalita 2011, на итальянской карте и в диалогах задач.[ 1] Он также может работать с французским, английским и китайским, узбекским, и есть простой способ добавить другие языки. После сравнения необходимых методов (методы сегментации на основе VAD, жесткой длины и гибридной сегментации) в этой статье мы предлагаем расширенные гибридные решения для быстрого достижения хороших результатов. Путем экспериментов, проведенных в разных областях и на разных языках пары, мы показываем, что наши методы превосходят все остальные методы, что сокращает разрыв между традиционным подходом на основе VAD и оптимальной ручной сегментацией не менее чем на 30%.


background image

146

1-rasm. Quick Bird tasviri

2-rasm.

Avtomatlashtirilgan qurilmaga misol

ekin

maydonini

dekodlash

QUIRC BIRD COP bilan o'simliklar,
shu

jumladan

yorqin

infraqizil

qatlam.

Tajribalar shuni ko'rsatdiki, yaqin infraqizil spektrga ega bo'lgan qatlamning kiritilishi

talqin qilish tartibini sezilarli darajada yaxshilaydi, o'rganilayotgan hududdagi o'simliklar, shu
jumladan daraxtlarning holati gradatsiyasini oshiradi. 2-rasmda yorqin infraqizil qatlamni o'z
ichiga olgan Quick Bird COP-larning avtomatlashtirilgan dekodlash misoli ko'rsatilgan.
Yuqoridagi rasmda to'rtta kanal, jumladan, yorqin infraqizildan foydalangan holda tasvir
ko'rsatilgan. Pastki rasmda to'rtta kanal yordamida avtomatlashtirilgan shifrni ochish natijasi
ko'rsatilgan. Qishloq xo‘jaligi ekinlarining holati juda yaxshi bo'lgan hududlar yashil rang bilan
ajratilgan. Qishloq xo‘jaligi ekinlarining holati o'ta qoniqarsiz bo'lgan hududlar qizil rang bilan
belgilangan. Tasvirni tahlil qilishdan ko'rinib turibdiki, yorqin infraqizil kanalni jalb qilish
qishloq xo‘jaligi ekinlarining holati haqida batafsilroq ma'lumot olish va olish imkonini berdi.

Foydalanilgan adabiyotlar

1. Киенко Ю.П. Основы космического природоведения. М.: «Картгеоцентр-Геодезиздат»,
1999. 285 с.
2. Курбанов Б.Т., Салахутдинов Р.З. Оценка состояния окружающей среды: новые
подходы и решения. // Geodeziya, kartografiya va kadastr. – 1998. - № 1. – С.42-46.
3. Смирнов Л.Е. Аэрокосмические методы географических исследований. –Л., Наука.
1975г.
4. Рогов А.Н. Особенности интеграции технологий географических информационных
систем и дистанционного зондирования при изучении природных ресурсов // Отеч. геол.
1994. -N 6.-С. 60-68.
5. Baumgartner M.F., Apfi G. Towards an integrated geographic analysis system with remote
sensing, GIS and consecutive modelling for snow cover monitoring// Int. ). Remote Sens. -1994.
-15,N7. -P.1507-1517
6. Нenderson F.B. Remote Sensing for GIS // GIS World. - 1995. - N 2. - P. 42-45.
7. Wulder M., Franklin S., Lavigne M. Polygon decomposition: a procedure for using remotely
sensed data to supplement GIS forest inventories. Technology Transfer Note 24, February 2001
8. Franklin J. Thematic mapper analysis on coniferous forest structure and composition.
International Journal of Remote Sensing 7, 1287-1301.
9. Iisaka J. Automated detection of man-made disturbance in the forest from remotely sensed
images. In Proceedings of the Second International Conference on Geospatial Information in
Agriculture and Forestry, Lake Buena Vista, Florida, 10-12 January 2000.
10. Е. В. Лопатин. К вопросу об автоматизированной актуализации информации о лесном
фонде по космическим снимкам. Труды Сыктывкарского лесного института. –
Сыктывкар: СЛИ, 2002. – Т.3. – 420 с.



АУДИО ДЛЯ ФОНЕТИЧЕСКОЙ СЕГМЕНТАЦИИ И ГОВОРИ ДЛЯ ГОВОРИ

Ахатов Акмал Рустамович,

проректор по международному сотрудничеству,

Самаркандский государственный университет

Улугмуродов Шох Аббос Баходир угли

Ассистент кафедры компьютерных наук и программирования

Джизакского филиала Национального университета

Узбекистана

Таджиев Маруф Рузикулович

Старший преподаватель кафедры компьютерных наук и программирования


background image

147

Джизакского филиала Национального университета Узбекистана

Аннотация:

SPPAS — это инструмент для автоматического построения

комментариев, включая сегментацию произношения, слова, слога и фонемы из
записанного звука речи и его транскрипцию. SPPAS распространяется на условиях
общественной лицензии GNU. Он успешно использовался во время кампании Evalita 2011,
на итальянской карте и в диалогах задач.[1] Он также может работать с французским,
английским и китайским, узбекским, и есть простой способ добавить другие языки.
После сравнения необходимых методов (методы сегментации на основе VAD, жесткой
длины и гибридной сегментации) в этой статье мы предлагаем расширенные гибридные
решения для быстрого достижения хороших результатов. Путем экспериментов,
проведенных в разных областях и на разных языках пары, мы показываем, что наши
методы превосходят все остальные методы, что сокращает разрыв между
традиционным подходом на основе VAD и оптимальной ручной сегментацией не менее
чем на 30%.

Ключевые слова.

фонетика, аннотация, сегментация

Последние десять лет или около того стали свидетелями резкого увеличения

количества лингвистических данных, которые стали доступны в качестве доказательства
природы лингвистических репрезентаций речи.[3] Если еще несколько лет назад было
принято формулировать фонетические модели на основе довольно ограниченных данных,
то сегодня это становится все более ожидаемым для лингвистов. Учитывать большое
количество эмпирических данных, часто включающих несколько часов записанной речи.
Еще несколько лет назад было трудно, если не невозможно, манипулировать такими
большими объемами данных за пределами специализированных лабораторий, используя
дорогие ЭВМ. Программное обеспечение для анализа акустических данных часто было
сложно установить и использовать, оно почти всегда было привязано к конкретной
платформе и, прежде всего, было очень дорогим. Сегодня ситуация коренным образом
изменилась и наличие все более и более дешевых хранилищ данных позволило
предусмотреть анализ данных, охватывающих несколько сотен гигабайт данных.[4] В тот
же период стал доступен ряд программных инструментов для анализа аудио- и/или
видеозаписей речи, таких как Anvil (Kipp, 2001), Elan (Sloetjes et al., 2010), Praat (Boersma
and Weenink, 2009 г.), Transcriber (TranscriberAG, 2011 г.) и WaveSurfer (WaveSurfer, 2012
г.) — это лишь некоторые из самых популярных инструментов, которые являются
бесплатными и мультиплатформенными. Подробный список программного обеспечения
для анализа речи см. (Llisterri, 2011). Самое большое препятствие, с которым сегодня
сталкиваются лингвисты, — это не хранение данных и не их анализ, а их аннотация.[2]

Преобразование речи в текст (ST) заключается в переводе высказываний на одном

языке в текст на другом языке. С архитектурной точки зрения системы ST традиционно
делят на каскадные и прямые. Каскадные решения сначала расшифровывают аудио с
помощью автоматического распознавания речи (ASR), а затем переводить
сгенерированные стенограммы с помощью компонента машинного перевода (MT). В
прямом ST работает единственная сквозная модель без промежуточных представлений.
Это позволяет уменьшить распространение ошибок и задержку, а также использовать
больше информации (например, вокальные данные и просодию говорящего). В отличие от
МП, где разбиение на уровне предложений представляет собой естественный (хотя и не
обязательно оптимальный) критерий сегментации входных данных, обработка
аудиоданных более проблематична.


background image

148

Рисунок 1: Оценки BLEU (ось Y) с различной сегментацией фиксированной длины (в

секундах - ось X).

Рисунок 2: Рабочий процесс SPPAS.

Заключение

SPPAS — это инструмент для выполнения автоматической фонетической

сегментации. SPPAS предназначен не только для специалистов по информатике.

Он скорее посвящен фонетикам, потому что такой инструмент не существует под

лицензией GPL. Единственный шаг в процедура, которая, вероятно, не под силу лингвисту
без посторонней помощи, — это создание новой акустической модель, когда она не
существует для языка проанализировано. Тем не менее, это нужно сделать только один
раз для каждого языка, и мы планируем предоставить подробные спецификации
информации, необходимой для обучения акустической модели. На соответствующем
наборе записей и словарей или транскрипций. Акустические модели, полученные в
результате такого совместного процесса, будут предоставлены в свободный доступ для
научных кругов сообщество.

Литература

1. Akhatov Akmal Rustamovich, Kayumov Oybek Achilovich, Ulug'murodov Shoh Abbos
Baxodir ugli. Scientific and theoretical basis of development and introduction of innovative
methods in inclusive education
2021// Universum: психология и образование 7 (85) // 46-48.
Общество с ограниченной ответственностью «Международный центр науки и
образования»
2. Akhatov A.R.,

Qayumov O.A., Ulugmurodov Sh.A.B.

Working with robot simulation using ros

and gazebo in inclusion learning // ―Фан, таълим ва ишлаб чиқариш интеграциясида рақамли
иқтисодиѐт истиқболлари‖ республика илмий-техник анжуман, ЎзМУ Жиззах филиали,
5-6 май 2021 йил, Жиззах – 194-199 б.
3. Aхatov A.R.,

Ulugʻmurodov Sh.A.B., Primqulov O.D.

Development of algorithms for

determining the breadth of digital economic change in access to open CV, open NI and PCL //


background image

149

―Фан, таълим ва ишлаб чиқариш интеграциясида рақамли иқтисодиѐт истиқболлари‖
республика илмий-техник анжуман, ЎзМУ Жиззах филиали, 5-6 май 2021 йил, Жиззах –
182-185 б.
4. Ахатов А.Р., Улугмуродов Ш.А., Умаров Х.А. Разработка методов и алгоритмов
системы генерации речи по данным сенсорных устройств считывания с элементами
искусcтвенного интеллекта // «Zamonaviy tadqiqotlar, innovatsiyalarning dolzarb muammolari
va rivojlanish tendensiyalari: yechimlar va istiqbollar» Respublika ilmiy-amaliy konferensiya
toʻplami, O‘zMU Jizzax filiali, Jizzax - 2021-yil 29-30-oktabr – 56-60 б.
5. Ахатов А.Р., Улугмуродов Ш.А. Development of methods and algorithms for a speech
generation system based on data from sensor reading devices with elements of artificial
intelligence //«Zamonaviy tadqiqotlar, innovatsiyalarning dolzarb muammolari va rivojlanish
tendensiyalari: yechimlar va istiqbollar» Respublika ilmiy-amaliy konferensiya toʻplami, O‘zMU
Jizzax filiali, Jizzax - 2021-yil 29-30-oktabr – 60-65 б.
6. Akhatov A.R., Nazarov F. Rashidov A. Mechanisms of Information Reliability In big data and
Blockchain Technologies. // International conference on information science and
communications technologies: applications, trends and opportunities 4-6 November. ICISCT
2021(IEEE).
7. Ruzibaev O., Muhamediyeva D., Ismailov I. Selecting a Suitable Initial Approximation Of
Multi-Component Cross-Diffusion Systems //2021 International Conference on Information
Science and Communications Technologies (ICISCT). – IEEE, 2021. – С. 1-4.
8. D. Khasanov, M. Tojiyev and O. Primqulov, "Gradient descent in machine learning," 2021
International Conference on Information Science and Communications Technologies (ICISCT),
2021, pp. 1-3, doi: 10.1109/ICISCT52966.2021.9670169.

ИСПОЛЬЗОВАНИЕ ОДНОРАЗОВЫХ ПАРОЛЕЙ ДЛЯ ОДНОГО СЕАНСА

АУТЕНТИФИКАЦИИ

Арзиева Жамила Тилеубаевна - PhD., доцент

Каракалпакский государственный университет им. Бердаха, г. Нукус

(кафедра «Прикладная математика и информатика»)

Аннотация:

В работе рассматривается преимущество одноразового пароля по

сравнению со статическим, что пароль невозможно использовать повторно. Защищает
от атак, основанных на активном вмешательстве в канал связи, используемый для
аутентификации.

Ключевые слова:

Одноразовый пароль, атака, технология, алгоритмы OTP

(

англ.

one time password, OTP), математический алгоритм, злоумышленник.

Одноразовый пароль

(

англ.

one

time

password,

OTP

) —

это пароль,

действительный только для одного сеанса

аутентификации

. Действие одноразового

пароля также может быть ограничено определѐнным промежутком времени.
Преимущество одноразового пароля по сравнению со статическим состоит в том, что
пароль невозможно использовать повторно. Таким образом, злоумышленник,
перехвативший данные из успешной сессии аутентификации, не может использовать
скопированный пароль для получения доступа к защищаемой информационной системе.
Использование одноразовых паролей само по себе не защищает от атак, основанных на
активном вмешательстве в канал связи, используемый для аутентификации (например, от
атак типа

«человек посередине»

) [1]. Человек не в состоянии запомнить одноразовые

пароли. Поэтому требуются дополнительные технологии для их корректной работы.

Алгоритмы создания OTP обычно используют случайные числа. Это необходимо,

потому что иначе было бы легко предсказать последующие пароли на основе знания

Библиографические ссылки

Akhatov Akmal Rustamovich, Kayumov Oybck Achilovich, Ulug'murodov Shoh Abbos Baxodir ugli. Scientific and theoretical basis of development and introduction of innovative methods in inclusive education 2021// Universum: психология и образование 7 (85) // 46-48. Общество с ограниченной ответственностью «Международный центр науки и образования»

Akhatov A.R., Qayumov О.A., Ulugmurodov Sh.A.B. Working with robot simulation using ros and gazebo in inclusion learning // “Фан, таълим ва ишлаб чикариш интсграциясида ракамли иктисодиёт истикболлари” республика илмий-техник анжуман, УзМУ Жиззах филиали, 5-6 май 2021 йил, Жиззах - 194-199 б.

Axatov A.R., Ulug'murodov Sh.A.B., Primqulov O.D. Development of algorithms for determining the breadth of digital economic change in access to open CV, open N1 and PCL //

“Фан, таълим ва ишлаб чикариш интсграциясида ракамли иктисодиёт истикболлари” республика илмий-техник анжуман, УзМУ Жиззах филиали, 5-6 май 2021 йил, Жиззах -182-185 б.

Ахатов А.Р., Улугмуродов Ш.А., Умаров Х.А. Разработка методов и алгоритмов системы генерации речи по данным сенсорных устройств считывания с элементами искусственного интеллекта // «Zamonaviy tadqiqotlar, innovatsiyalarning dolzarb muammolari va rivojlanish tcndcnsiyalari: yechimlar va istiqbollar» Rcspublika ilmiy-amaliy konferensiya to’plami, O’zMU Jizzax filiali, Jizzax - 2021-yil 29-30-oktabr - 56-60 6.

Ахатов A.P., Улугмуродов Ш.А. Development of methods and algorithms for a speech generation system based on data from sensor reading devices with elements of artificial intelligence //«Zamonaviy tadqiqotlar, innovatsiyalarning dolzarb muammolari va rivojlanish tcndcnsiyalari: yechimlar va istiqbollar» Rcspublika ilmiy-amaliy konferensiya to’plami, O’zMU Jizzax filiali, Jizzax - 2021-yil 29-30-oktabr - 60-65 6.

Akhatov A.R., Nazarov F. Rashidov A. Mechanisms of Information Reliability In big data and Blockchain Technologies. // International conference on information science and communications technologies: applications, trends and opportunities 4-6 November. ICISCT 2021 (IEEE).

Ruzibacv O., Muhamcdiyeva D., Ismailov I. Selecting a Suitable Initial Approximation Of Multi-Component Cross-Diffusion Systems //2021 International Conference on Information Science and Communications Technologies (ICISCT). - IEEE, 2021. - C. 1-4.

D. Khasanov, M. Tojiyev and O. Primqulov, "Gradient descent in machine learning," 2021 International Conference on Information Science and Communications Technologies (ICISCT), 2021, pp. 1-3, doi: 10.1109/ICISCT52966.2021.9670169.

inLibrary — это научная электронная библиотека inConference - научно-практические конференции inScience - Журнал Общество и инновации UACD - Антикоррупционный дайджест Узбекистана UZDA - Ассоциации стоматологов Узбекистана АСТ - Архитектура, строительство, транспорт Open Journal System - Престиж вашего журнала в международных базах данных inDesigner - Разработка сайта - создание сайтов под ключ в веб студии Iqtisodiy taraqqiyot va tahlil - ilmiy elektron jurnali yuridik va jismoniy shaxslarning in-Academy - Innovative Academy RSC MENC LEGIS - Адвокатское бюро SPORT-SCIENCE - Актуальные проблемы спортивной науки GLOTEC - Внедрение цифровых технологий в организации MuviPoisk - Смотрите фильмы онлайн, большая коллекция, новинки кинопроката Megatorg - Доска объявлений Megatorg.net: сайт бесплатных частных объявлений Skinormil - Космецевтика активного действия Pils - Мультибрендовый онлайн шоп METAMED - Фармацевтическая компания с полным спектром услуг Dexaflu - от симптомов гриппа и простуды SMARTY - Увеличение продаж вашей компании ELECARS - Электромобили в Ташкенте, Узбекистане CHINA MOTORS - Купи автомобиль своей мечты! PROKAT24 - Прокат и аренда строительных инструментов