Авторы

  • Muhriddin Qulmatov
    UMFT universiteti “Kommunikatsiya va raqamli texnologiyalar” kafedrasi katta o‘qituvchisi
  • O‘rinboy Naziraliyev
    UMFT universiteti “Kommunikatsiya va raqamli texnologiyalar” kafedrasi katta o‘qituvchisi
  • Ilhom Jumabekov
    UMFT universiteti “Kommunikatsiya va raqamli texnologiyalar” kafedrasi assistent o‘qituvchisi

DOI:

https://doi.org/10.71337/inlibrary.uz.canrms.98276

Ключевые слова:

NLP BERT GPT Self-Attention TensorFlow HuggingFace Multi-Head RNN LSTM GRU.

Аннотация

Mazkur ilmiy ishda Transformer arxitekturasi asosida tabiiy tilni qayta ishlash (NLP) usullarini tadqiq qilish yoritilgan. Transformer modellarining asosiy komponentlari – Self-Attention va Multi-Head Attention mexanizmlari tahlil qilinib, ularning NLP vazifalaridagi roli o‘rganildi. Tadqiqot davomida Python dasturlash tilida TensorFlow va HuggingFace kutubxonalari yordamida BERT va GPT modellarini amaliyotda qo‘llash tajribasi o‘tkazildi.


background image

CURRENT APPROACHES AND NEW RESEARCH IN

MODERN SCIENCES

International scientific-online conference

56

TRANSFORMER ARXITEKTURASI ASOSIDA TABIIY TILNI QAYTA

ISHLASH USULLARINI TADQIQ QILISH

Muhriddin Qulmatov

Naziraliyev O‘rinboy

Ilhom Jumabekov

*UMFT universiteti “Kommunikatsiya va raqamli texnologiyalar” kafedrasi katta

o‘qituvchisi muxroka2525@gmail.com , Tel:+998-95-039-25-25

UMFT universiteti “Kommunikatsiya va raqamli texnologiyalar” kafedrasi katta

o‘qituvchisi naziraliyevurinboy1996@gmail.com

UMFT universiteti “Kommunikatsiya va raqamli texnologiyalar” kafedrasi

assistent o‘qituvchisi jumabekovilhom@gmail.com

https://doi.org/10.5281/zenodo.15518392

Аннотация:

В этой научной работе рассматриваются методы

обработки естественного языка (NLP), основанные на архитектуре
Transformer. Были проанализированы ключевые компоненты моделей
Transformer – механизмы само-внимания и многоголовочного внимания -
и изучена их роль в задачах NLP. В ходе исследования был проведен
эксперимент с использованием моделей BERT и GPT на практике с
использованием библиотек TensorFlow и HuggingFace на языке
программирования Python.

Annotation:

In this scientific work, research on Natural Language

Processing (NLP) methods based on Transformer architecture is covered. The
key components of Transformer models – self-Attention and Multi-Head
Attention mechanisms-were analyzed and their role in NLP tasks studied.
During the study, an experiment was conducted using BERT and GPT models in
practice using the TensorFlow and HuggingFace libraries in the Python
programming language.

Annotatsiya:

Mazkur ilmiy ishda Transformer arxitekturasi asosida tabiiy

tilni qayta ishlash (NLP) usullarini tadqiq qilish yoritilgan. Transformer
modellarining asosiy komponentlari – Self-Attention va Multi-Head Attention
mexanizmlari tahlil qilinib, ularning NLP vazifalaridagi roli o‘rganildi. Tadqiqot
davomida Python dasturlash tilida TensorFlow va HuggingFace kutubxonalari
yordamida BERT va GPT modellarini amaliyotda qo‘llash tajribasi o‘tkazildi.

Kalit so‘zlar:

NLP,

BERT, GPT, Self-Attention, TensorFlow, HuggingFace,

Multi-Head, RNN, LSTM, GRU.

Tabiiy tilni qayta ishlash (Natural Language Processing, NLP) —

kompyuter tizimlari yordamida inson tilini tahlil qilish, tushunish va generatsiya
qilishga qaratilgan sun'iy intellekt sohasi hisoblanadi. So‘nggi yillarda ushbu
sohada sezilarli natijalarga erishildi, ayniqsa 2017-yilda Google tomonidan taklif


background image

CURRENT APPROACHES AND NEW RESEARCH IN

MODERN SCIENCES

International scientific-online conference

57

etilgan Transformer arxitekturasi bu yo‘nalishda inqilobiy o‘zgarishlarga sabab
bo‘ldi.

An’anaviy rekurrent neyron tarmoqlar (RNN) va ularning modifikatsiyalari

(LSTM, GRU) matnlarni ketma-ketlik asosida tahlil qilgan bo‘lsa, Transformer
modellar paralel ravishda butun matnga ishlov bera oladi, bu esa o‘rgatish
jarayonini tezlashtiradi va uzoq masofadagi so‘zlar o‘rtasidagi bog‘liqlikni
samarali aniqlashga yordam beradi.

Transformer modelining asosiy komponentlari:
Self-Attention mexanizmi
Self-Attention – har bir so‘zning kontekstda boshqa so‘zlar bilan

munosabatini baholash imkonini beradi.

Formulasi:

Attention(Q, K, V) = softmax(

QK

T

√d

k

)

V (1.1)

Bu yerda:

Q – Query,

K – Key,

V – Value,

d

k

– Key vektorining o‘lchami.

Multi-Head Attention:
bir nechta self-attention natijalarini birlashtirib, modelga turli kontekstual

munosabatlarni aniqlash imkonini beradi:

MultiHead(Q, K, V) = Concat(head

1

, … , head

h

)W

O

(1.2)

Bu yerda har bir head – alohida Self-Attention mexanizmidan tashkil

topgan.

Position Encoding:
Transformer arxitekturasi so‘zlar ketma-ketligiga bog‘liq bo‘lmagan holda

ishlaydi. Shu sababli so‘zlarning pozitsiyasini belgilash uchun pozitsion kodlash
qo‘llaniladi.

PE

pos,2i

= sin (

pos

10000

2i

dmodel

),

(1.3)

PE

pos,2i+1

= cos (

pos

10000

2i

dmodel

),

(1.4)




Transformer modellarining NLP dagi asosiy qo‘llanilishi:


background image

CURRENT APPROACHES AND NEW RESEARCH IN

MODERN SCIENCES

International scientific-online conference

58

Model

Vazifasi

Trilliyard
so‘zlar

bilan

o‘qitilgan

Qo‘llanilish
sohasi

BERT

Masked

Language

Modeling

Ha

Savol-javob,
matn
klassifikatsiyasi

GPT

Causal

Language

Modeling

Ha

Matn
generatsiyasi,
suhbatlar

T5

Text-to-Text Transfer

Ha

Mashinalar
tarjimasi,
yakunlash

RoBERTa

MLM(yanada
yaxshilangan)

Ha

Matn

tahlili,

emotsiyalar

Transformer modellarining afzalliklari

Paralel ishlov berish imkoniyati

Uzoq masofali bog‘liqlikni yaxshi aniqlash

Oldingi modellarga qaraganda samarador va o‘rganishga qulay

Transformer arxitekturasi NLP sohasida yangi davrni boshlab berdi. Uning

asosidagi self-attention mexanizmi matnning chuqur kontekstini tushunishga
imkon yaratadi. Kelajakda Transformer modellari yanada samarali va ixcham
shaklda ishlab chiqilishi kutilmoqda (masalan: DistilBERT, TinyGPT).

Adabiyotlar:

1.

Vaswani, A., Shazeer, N., Parmar, N., et al. (2017).

2.

Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2018). "BERT: Pre-

training of Deep Bidirectional Transformers for Language Understanding".
3.

Radford, A., Wu, J., Child, R., et al. (2019). "Language Models are

Unsupervised Multitask Learners".Bird, Steven, Ewan Klein va Edward Loper.
4.

Raffel, C., et al. (2020). "Exploring the Limits of Transfer Learning with a

Unified Text-to-Text Transformer" (T5 model).Yuldoshev D. Python dasturlash
tilida matnni qayta ishlash usullari. Toshkent: Dasturlash Akademiyasi, 2021.
5.

Lewis, M., Liu, Y., Goyal, N., et al. (2020). "BART: Denoising Sequence-to-

Sequence Pre-training for Natural Language Generation, Translation, and
Comprehension".
6.

Jurafsky, D., & Martin, J. H. (2023).

7.

"Speech and Language Processing (3rd Edition, Draft)".


background image

CURRENT APPROACHES AND NEW RESEARCH IN

MODERN SCIENCES

International scientific-online conference

59

8.

Eisenstein, J. (2019).

9.

"Natural Language Processing"

Библиографические ссылки

Vaswani, A., Shazeer, N., Parmar, N., et al. (2017).

Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2018). "BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding".

Radford, A., Wu, J., Child, R., et al. (2019). "Language Models are Unsupervised Multitask Learners".Bird, Steven, Ewan Klein va Edward Loper.

Raffel, C., et al. (2020). "Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer" (T5 model).Yuldoshev D. Python dasturlash tilida matnni qayta ishlash usullari. Toshkent: Dasturlash Akademiyasi, 2021.

Lewis, M., Liu, Y., Goyal, N., et al. (2020). "BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension".

Jurafsky, D., & Martin, J. H. (2023).

"Speech and Language Processing (3rd Edition, Draft)".

Eisenstein, J. (2019).

"Natural Language Processing"