Nutq signallari belgilar toplamini shakllantirishning mfcc usuli

CC BY f
179-182
125
71
Поделиться
Маматов, Н., & Дусанов, Х. (2022). Nutq signallari belgilar toplamini shakllantirishning mfcc usuli. Современные инновационные исследования актуальные проблемы и развитие тенденции: решения и перспективы, 1(1), 179–182. извлечено от https://inlibrary.uz/index.php/zitdmrt/article/view/5286
Нарзулло Маматов, Toshkent irrigatsiya va qishloq xojaligini mexanizatsiyalash muhandislari instituti milliy

tadqiqot universiteti professori

Хуршид Дусанов, Ozbekiston Milliy universitetining Jizzax filiali ―Kompyuter ilmlari va dasturlashtirish

kafedrasi tayanch doktoranti

Crossref
Сrossref
Scopus
Scopus

Ключевые слова:

Аннотация

Hozirgi kunda nutqni tanib olish masalasi jadal o’rganilmoqda. Ko’plab tadqiqotchilar nutqni tanib olishning bir qancha usullari bo’lishiga qaramay, nutq beglilar to'plamini shakllantirish uchun signalm qayta ishlash usullarini ham rivojlantirishni davom ettirishmoqda. Bunin asosiy sabablaridan biri mavjud usullarning etarli darajada samara bermayotganligi hisoblanadi. Ushbu maqola shaxsni ovozi asosida tanib olishda keng qo ’llaniladigan beglilar to ‘plamini shakllantirishning MFCC(Mel Frequency Cepstral Coefficients) usuliga bag'ishlangan bo’lib, unda MFCC belgilar to’plamini shakllantish algoritmi bosqichlari ко ’rib chiqilgan.


background image

179

Foydalanilgan adabiyotlar roʻyxati:

1.

O'zbekiston Respublikasi Prezidentining 2019 yil 8 oktyabrь ―O'zbekiston Respublikasi oliy

ta'lim tizimini 2030 yilgacha rivojlantirish kontseptsiyasini tasdiqlash to'g'risida‖gi PF-5847-
sonli Farmoni.
2.

Хакимова М. Ф. Aхборот таълим муҳитида инновация ва рақамли технологияларнинг

жорий этилиши //Academic research in educational sciences. – 2021. – Т. 2. – №. NUU
Conference 1. – С. 149-152.

3.

Musakxanova, gulnora. (2019). OPPORTUNITIES OF INNOVATION TECHNOLOGIES

IN HIGHER EDUCATION. Архив научных исследований, 1(1). извлечено от

https://tsue.scienceweb.uz/index.php/archive/article/view/495

4.

Musakhanova, G. (2022). https://masterjournals.com/index.php/crjp : Design and research

method as an innovative approach aimed at the development of organizational abilities of
students in the process of independent work. Архив научных исследований, 2(1). извлечено
от http://journal.tsue.uz/index.php/archive/article/view/600

NUTQ SIGNALLARI BELGILAR TO‗PLAMINI SHAKLLANTIRISHNING MFCC

USULI.

Mamatov Narzillo Solidjonovich

Toshkent irrigatsiya va qishloq xo‗jaligini mexanizatsiyalash muhandislari instituti milliy

tadqiqot universiteti professori

Dusanov Xurshid Toshpulotovich

O‗zbekiston Milliy universitetining Jizzax filiali ―Kompyuter ilmlari va dasturlashtirish‖

kafedrasi tayanch doktoranti

Annotatsiya:

Hozirgi kunda nutqni tanib olish masalasi jadal o‗rganilmoqda. Ko‗plab

tadqiqotchilar nutqni tanib olishning bir qancha usullari bo‗lishiga qaramay, nutq beglilar
to‗plamini shakllantirish uchun signalni qayta ishlash usullarini ham rivojlantirishni davom
ettirishmoqda. Bunin asosiy sabablaridan biri mavjud usullarning etarli darajada samara
bermayotganligi hisoblanadi. Ushbu maqola shaxsni ovozi asosida tanib olishda keng
qo‘llaniladigan beglilar to‗plamini shakllantirishning MFCC(Mel Frequency Cepstral
Coefficients) usuliga bag‗ishlangan bo‘lib, unda MFCC belgilar to‘plamini shakllantish
algoritmi bosqichlari ko‘rib chiqilgan.

Kalit so‗zlar:

signal

,

nutq, belgi, MFCC, LPCC, PLP, MSFB, gradient

.

Hozirgi kunda nutq signallariga raqamli ishlov berish, nutq signallari asosida shaxsni

tanib olish, nutqni matnga o‗tkazish masalalari dolzarb bo‗lib qolmoqda. Nutq bilan bog‘liq
tizimlar tibbiyot, ishlab chiqarish, qishloq xo‗jaligi va biznesning turli sohalarida keng
qo‗llanilmoqda, jumladan, klinikada shifokor tomonidan elektron kartaga kiritiladigan tashxislar
yoki telefondagi interaktiv ilovalarda nutqni avtomatik aniqlash va sintez qilish kabi tizimlar.

Nutq insonlar muloqotini qulay tabiiy shakli bo‗lib, uni tanib olish- kompyuter dasturlari

yordamida so‗zlar ketma-ketligiga o‗tkazishdan iborat. Nutqni tanib olish - bu nutq signalini
matnli ma‘lumotlarga o‘tkazishning avtomatik jarayonidir. Teskari jarayon esa - nutq sintezi deb
ataladi. Hozirgi kunda nutq signallari belgilarini shakllantirishning ko‗plab usullari mavjud.
Masalan, LPCC, PLP, MSFB, MFCC va boshqalar[2].

Quyida shaxsni ovozi asosida tanib olishda keng qo‘llaniladigan beglilar to‗plamini

shakllantirishning MFCC usuli va uni joriy etish bosqichlari ko‘rib chiqiladi.

MFCC -

bu

signal spektrining ixcham ko‗rinishi (to‗lqin shakli cheksiz sonli

sinusoidalarning yig‘indisi bilan ifodalanganda) bo‘lib, uning algoritmi 1-rasmda keltirilgan[1].


background image

180

1-rasm. MFCC algoritmi

Diskretlash:

Ushbu bosqichda kirish signalini analog signaldan raqamli signalga16 kHz

namuna olish chastotasi bilan almashtirish amalga oshiriladi.

Freymlarga ajratish:

bunda nutq signalini freymlarga ajratish uchun qo‗llanilishi

mumkin bo‗lgan audio signalni 16 kHz chastotada yozilgan 1 sekund misolida ko‗rib chiqiladi.
Odatda

25 ms(millisekund) davomiylikdagi audio signal 400 ta namunadan tashkil topadi.

Masalan, davomiyligi 10 ms bo‗lgan audio signal bir vaqtning o‗zida 160 ta namunadan iborat
oynani anglatadi. Bunda har bir oyna uchun 0,025 * 16000 = 400 ta namuna, 0,01 * 16000 = 160
ta namuna hosil bo‗ladi.

Natijada

har bir freymning kengligi 25 ms bo‗lgan va 2-rasmda

keltirilgan 100 ta freymlarga ajratiladi[3].

2-rasm. Nutq signalini freymlarga ajratish

Xemming oynasi:

Birinchi 400 ta namuna 0 dan boshlanganligi sababli, keyingi 400 ta

namuna 160 dan boshlanadi, ya‘ni 240 ta namuna bir-biriga mos keladi.

3-rasm. Xemming oynasi

Odatda Xemming oynasidan nutq bilan bog‘liq masalalarni yechishda foydalaniladi.

Xemming oynasi yordamida signal quyidagi formula orqali almashtiriladi:

 

2

0.54

0.46cos

, 0

n

w n

n

N

N

 

(1)

Diskret Furye almashtirish (DFA):

Diskret Furye almashtirishni qo‗llash orqali signalni

vaqtli sohadan chastota sohaga o‘tkaziladi. Nutq signallari uchun chastotali sohada tahlil qilish


background image

181

vaqtli sohaga nisbatan qulaydir. Vaqt signali uchun Furye almashtirish quyidagi formula orqali
amalga oshiriladi[5]:

 

 

2

1

, 0

j

kn

N

N

n

H k

x n e

k

K

 

(2)

bu yerda:

 

x n

- vaqt sohasidagi signal,

N

- n ta namunadan iborat oyna uzunligi,

K

- DFA uzunligi. Quvvat spektori namuna energiyasining formulasi quyidagicha olinadi:

2

1

(k)

(k)

i

P

H

N

(3)

Mel-filtr bankini qo‗llash:

20-40 (26 ta standart) uchburchak filtrlar toʻplami boʻlib,

filtr bankining energiyalarini hisoblash uchun har bir filtr bankini quvvat spektriga ko‗paytiriladi
va koeffitsientlarni hosil qilinadi. Bu amalga oshirilgandan so‗ng, har bir filtr bankida qancha
energiya borligi haqida ma‘lumot beruvchi 40 ta son olinadi.

4-rasm.

Mel-filtr banklari. Filtrlar soni

26 ta

Mel-filtr bankini quyida formula orqali hisoblanadi:

(f) 1127 ln(1

)

700

f

mel

(4)

Logarifmlash:

Inson past chastotadagi o‘zgarishlarni yuqori chastotadagi o‗zgarishlarga

nisbatan aniqroq sezadi. Logarifmlash shunga o‗xshash xususiyatga ega. Kirishning x past
qiymatida log funksiyasining gradienti yuqori bo‗ladi, lekin kirishning yuqori qiymatida gradient
qiymati kichikroq bo‗ladi. Bu esa inson eshitish tizimiga mos Mel-filtr chiqishiga logarifmlashni
qo‗llash imkonini beradi.

Diskret kosinus almashtirish

: Ushbu bosqichda oldingi bosqichdagi chiqish uchun

teskari o‗zgartirish amalga oshiriladi. MFCC usuli diskret kosinus almashtirishni qo‗llaganidan
so‘ng signalni 12 koeffitsienti hosil bo‘ladi. Olingan belgilar (har bir freym uchun 12 ta raqam)
Mel-chastotali kepstral koeffitsientlar deb ataladi, ya‘ni MFCC usuli nutq signali uchun kirish
sifatida olinayotgan audio signalning har bir freymdan 12 ta belgi ajratadi[6].

Olib borilgan tajribalar shaxsni ovozi asosida tanib olishda MFCC usuli yordamida

shakllantirilgan beglilar to‗plaminidan foydalanish boshqa usullarga nisbatan samarador
ekanligini ko‘rsatdi.

Foydalanilgan adabiyotlar roʻyxati:

1.

S. Dhingra, G. Nijhawan and P. Pandit, Isolated Speech Recognition using MFCC and

DTW, International journal of Advanced Research in Electrical, Electronics and Instrumentation
Engineering,8(2), 2013.
2.

Mamatov N., Nurimov P.B., Samijonov A., Niyozmatova N. Automatic Speaker

Identification by Voice Based on Vector Quantization Method International Journal of


background image

182

Innovative Technology and Exploring Engineering (IJITEE) ISSN: 2278-3075, Volume-8 Issue-
10, August 2019
3.

Narzillo Mamatov, Nilufar Niyozmatova, Abdurashid Samijonov Software for

preprocessing voice signals International Journal of Applied Science and Engineering Vol.18(1)
https://doi.org/10.6703/IJASE.202103_18(1).006
4.

Narzillo, M., Abdurashid, S., Parakhat, N., Nilufar, N. 2019. Automatic speaker

identification by voice based on vector quantization method, Int. J. Innov. Technol. Explor. Eng.,
8, 2443–2445.
5.

Narzillo, M., Abdurashid, S., Parakhat, N., Nilufar, N. Karakalpak speech recognition with

CMU sphinx, Int. J. Innov. Technol. Explor. Eng., 8, 2446–2448.
6.

M. H. Savoji, "A robust algorithm for accurate end pointing of speech," Speech

Communication, pp. 45–60, 1989.
7.

Wiedecke, B., Narzillo, M., Payazov, M., Abdurashid, S. 2019. Acoustic signal analysis and

identification, Int. J. Innov. Technol. Explor. Eng., 8, 2440–2442.
8.

Nilsson M., Ejnarsson M. Speech recognition using hidden Markov model // 2002. Degree

of Master of Science in Electrical Engineering. Blekinge Institute of Technology. Karlskrona:
Kazerntryckriet AB, 2002.
9.

Aida-Zade К. R. Investigation of combined use of MFCC and LPC features in speech

recognition systems / К. R. Aida-Zade, C. Ardil, S. S. Rustamov. World Acad. of Sci., Eng. and
Technol. 2006.

TA‘LIM JARAYONILARIDA KAHOOT PLATFORMASIDAN FOYDALANISH

Ilmiyrahbar: Abduraxmanov R.A.

Mamiraliyev Akmal Sayfidinovich

Oʻzbekiston Milliy universitetining Jizzax filiali ―Kompyuter ilmlari va dasturlashtirish‖

yoʻnalishi magistranti

Annotatsiya:

Ushbu maqolada zamonaviy axborot texnologiyalari va aloqa

vositalaridan o'quv jarayonida foydalanish muhokama qilinadi.

Kahoot platformasiga o'quv jarayonini yaxshilaydigan amaliy vosita sifatida qarashga

alohida e'tibor beriladi. Mazkur platformaning inkoniyatlari o‗quvchilarning intellektual va
ijodiy qobiliyatlarini rivojlantirish, o‗qishga bo‗lgan ishtiyoqini oshirishdagi afzalliklari
ta‘kidlanadi. Amaliy mashg'ulotlarda qo'llash natijalaridan kelib chiqib Kahoot platformasi
haqiqatan ham sifatli ta'lim olishda juda ham samarali degan xulosaga kelishimizga imkon
beradi.

Kalit soʻzlar:

Kahoot, axborot-kommunikatsiya texnologiyalari; ta'lim jarayoni; o'quv

platformasi; ilova; o‘yin metodlari; dasturiy ta'minot va apparat vositalari.

Axborot-kommunikatsiya texnologiyalarining faol rivojlanishi ta'lim jarayoniga tobora

ko'proq yangi o'qitish usullarini yaratish va joriy etishni nazarda tutadi. Kompyuterlar,
smartfonlar va Internet bizning kundalik va professional hayotimizning ajralmas qismiga
aylandi. An'anaviy o'qitish usullari hozirgi talabalarda qiziqish va motivatsiyani yo'qotadi. Shu
munosabat bilan ta‘lim tizimi zamonaviy talablarga moslashishi, axborot texnologiyalari
yutuqlarini hisobga olgan holda o‗qitishning faol usullaridan foydalangan holda yangi o‗qitish
usullarini shakllantirishi va rivojlantirishi zarur.[1]

Ta'lim jarayoniga o'yin usullarini joriy etish amaliy malakalarni, fikrlash va mantiqni

rivojlantiradi, shuningdek, materialni o'rganish samaradorligini oshiradi. Bundan tashqari,
o'yin elementlari o'quvchilarning ta'lim jarayoniga jalb qilish darajasini oshiradi.

Internet resurslari va o‗quvchilar smartfonlari yordamida samarali interaktiv ta‘lim

muhitini tashkil etish mumkin. Shunday manbalardan biri Kahoot.com hisoblanadi.

Kahoot bilan ishlash uchun siz Internetga ulangan shaxsiy kompyuter, noutbuk,

planshet yoki smartfondan foydalanishingiz mumkin.

Библиографические ссылки

S. Dhingra, G. Nijhawan and P. Pandit, Isolated Speech Recognition using MFCC and DTW, International journal of Advanced Research in Electrical, Electronics and Instrumentation Engineering,8(2), 2013.

Mamatov N., Nurimov P.B., Samijonov A., Niyozmatova N. Automatic Speaker Identification by Voice Based on Vector Quantization Method International Journal ofInnovative Technology and Exploring Engineering (IJ1TEE) ISSN: 2278-3075, Volume-8 Issue-10, August 2019

Narzillo Mamatov, Nilufar Niyozmatova, Abdurashid Samijonov Software for preprocessing voice signals International Journal of Applied Science and Engineering Vol. 18(1) https://d0i.0rg/l 0.6703/IJASE.202103_l 8( 1 ).006

Narzillo, M., Abdurashid, S., Parakhat, N., Nilufar, N. 2019. Automatic speaker identification by voice based on vector quantization method, Int. J. Innov. Technol. Explor. Eng., 8, 2443-2445.

Narzillo, M., Abdurashid, S., Parakhat, N., Nilufar, N. Karakalpak speech recognition with CMU sphinx, Int. J. Innov. Technol. Explor. Eng., 8, 2446-2448.

M. H. Savoji, "A robust algorithm for accurate end pointing of speech," Speech Communication, pp. 45-60, 1989.

Wiedecke, B., Narzillo, M., Payazov, M., Abdurashid, S. 2019. Acoustic signal analysis and identification, Int. J. Innov. Technol. Explor. Eng., 8, 2440-2442.

Nilsson M., Ejnarsson M. Speech recognition using hidden Markov model // 2002. Degree of Master of Science in Electrical Engineering. Blckinge Institute of Technology. Karlskrona: Kazcrntryckrict AB, 2002.

Aida-Zade K. R. Investigation of combined use of MFCC and LPC features in speech recognition systems / K. R. Aida-Zade, C. Ardil, S. S. Rustamov. World Acad, of Sci., Eng. and Technol. 2006.

inLibrary — это научная электронная библиотека inConference - научно-практические конференции inScience - Журнал Общество и инновации UACD - Антикоррупционный дайджест Узбекистана UZDA - Ассоциации стоматологов Узбекистана АСТ - Архитектура, строительство, транспорт Open Journal System - Престиж вашего журнала в международных базах данных inDesigner - Разработка сайта - создание сайтов под ключ в веб студии Iqtisodiy taraqqiyot va tahlil - ilmiy elektron jurnali yuridik va jismoniy shaxslarning in-Academy - Innovative Academy RSC MENC LEGIS - Адвокатское бюро SPORT-SCIENCE - Актуальные проблемы спортивной науки GLOTEC - Внедрение цифровых технологий в организации MuviPoisk - Смотрите фильмы онлайн, большая коллекция, новинки кинопроката Megatorg - Доска объявлений Megatorg.net: сайт бесплатных частных объявлений Skinormil - Космецевтика активного действия Pils - Мультибрендовый онлайн шоп METAMED - Фармацевтическая компания с полным спектром услуг Dexaflu - от симптомов гриппа и простуды SMARTY - Увеличение продаж вашей компании ELECARS - Электромобили в Ташкенте, Узбекистане CHINA MOTORS - Купи автомобиль своей мечты! PROKAT24 - Прокат и аренда строительных инструментов