Mualliflar

  • Bahronov Otabek Najmiddinovich

DOI:

https://doi.org/10.71337/inlibrary.uz.ustozlar.106697

Kalit so‘zlar:

Kalit so'zlar: tasvirni qayta ishlash obyekt obyekt matn qo'shish sun'iy intellekt kompyuter vision tasvir segmentatsiyasi generativ modellar augmented reality optik asboblarni tekshirish mashinaviy o'qitish.

Annotasiya

Annotatsiya:   Rasmga boshqa obyektlarni va matn qo'shish zamonaviy raqamli tasvirlarni qayta ishlash, sun'iy intellekt va kompyuter vision vision muhim yo'nalishlardan biridir. Uch maqola ushbu jarayonning usullari, algoritmlari qo' va kelajakdagi istiqbollarini keng qamrovli yoritadi. Obyektlarni boshqarishda quvvatlanadigan tasvirni segmentatsiya qilish, generativ model va auged reality texnologiyani tahlil qilish. Matn qo'shish jarayonida optik vositalarni aniqlash (OCR), font moslashuvi va kontekstual davolash usullari ko'rib chiqiladi. Maqola ushbu texnologiyaning dasturiy ta'minoti media, reklama ta'lim va tibbiyot sohalaridagi ahamiyatini muhokama qiladi, bu boradagi tadqiqotlarni va texnik yordamni olish. Maqo tasvirlarni ilmiy tekshirishlarni, dasturchilar va rasmlarni qayta ishlash ishlovchi mutaxassislar uchun mo'ljallangan.


background image

Ustozlar uchun

pedagoglar.org

73-son 4–to’plam Iyun-2025

Sahifa: 80

RASMGA BOSHQA OBYEKTLARNI JOYLASHTIRISH VA MATN QO'SHISH:

ZAMONAVIY TEXNOLOGIYALAR VA ALGORITMLAR

Bahronov Otabek Najmiddinovich

Buxoro viloyati G‘ig‘duvon tuman 1-son Politexnikumi

Fan: Informatika va axborot texnalogiyasi

bahronovotabek082@gmail.com

91 924 04 42

Annotatsiya:

Rasmga boshqa obyektlarni va matn qo'shish zamonaviy raqamli

tasvirlarni qayta ishlash, sun'iy intellekt va kompyuter vision vision muhim yo'nalishlardan
biridir. Uch maqola ushbu jarayonning usullari, algoritmlari qo' va kelajakdagi
istiqbollarini keng qamrovli yoritadi. Obyektlarni boshqarishda quvvatlanadigan tasvirni
segmentatsiya qilish, generativ model va auged reality texnologiyani tahlil qilish. Matn
qo'shish jarayonida optik vositalarni aniqlash (OCR), font moslashuvi va kontekstual
davolash usullari ko'rib chiqiladi. Maqola ushbu texnologiyaning dasturiy ta'minoti media,
reklama ta'lim va tibbiyot sohalaridagi ahamiyatini muhokama qiladi, bu boradagi
tadqiqotlarni va texnik yordamni olish. Maqo tasvirlarni ilmiy tekshirishlarni, dasturchilar
va rasmlarni qayta ishlash ishlovchi mutaxassislar uchun mo'ljallangan.

Kalit so'zlar:

tasvirni qayta ishlash, obyekt obyekt, matn qo'shish, sun'iy intellekt,

kompyuter vision, tasvir segmentatsiyasi, generativ modellar, augmented reality, optik
asboblarni tekshirish, mashinaviy o'qitish.

Kirish

Rasmga boshqa obyektlarni binolar va matn qo'shish zamonaviy kompyuter

texnologiyalarining muhim yo'nalishlaridan biridir. Uch jarayonlar tasvirni qayta ishlash,
sun'iy intellekt (AI) va kompyuter vision sohalarida keng qo'riqnoma. Obyektlarni sifatli
tasvirga yangi qo'shish orqali uning mazmunini o' Bu yoki bo'yitish qiladi, masalan,
augmented reality (AR) ilovalarida virtual obyektlarni real dunyoga integratsiya qilish.
Matn qo'shish asosiy tasvirlarga ma'lumotli matnlar sahifasidagi fayl informatsion yoki
dekorativ materiallarni kelib chiqishi, masalan, reklama bannerlari yoki ta'lim
materiallarida.

Bu texnologiya 20-asrning oxirlarida oddiy grafik muharrirlar (masalan, Adobe

Photoshop) yordamida amalga oshirilgan bo'lsa, bugungi kunda sun'iy intellekt va
mashinaviy o'qitish (mashina o'rganish) algoritmlarini avtomatlashtirilgan. Deep learning
modellar, generativ adversial networks (GANs) va tasvir segmentatsiyasi usullari bu
jarayonlarni yanada samarali va realistik qildi. Uch rasmga ob'ekt va matnni qo'shishning
asosiy usullari, qo'shimcha sohadagi texnik va etik algoritmlarni ishlab chiqish, shu bilan
birgalikda ishlab chiqarish sohadagi texnik va etik algoritmlarni ishlab chiqish.


background image

Ustozlar uchun

pedagoglar.org

73-son 4–to’plam Iyun-2025

Sahifa: 81

Rasmga obyektlarni jihozlar

Rasmga boshqa obyektlarni tasvirni qayta ishlashning murakkab jarayoni bo'lib, unda

yangi tasvirga realistik integratsiyalashgan holda. Bu jarayon turli texnologiyalar va
algoritmlarga asoslanadi, har biri o'ziga xos xususiyat ega.

Tasvir segmentatsiyasi

Tasvir segmentatsiyasi rasmni bir qator joylarga bo'lgan

ob'ektlar uchun asosli zamin uchun. Bu jarayonni tasvirdagi obyektlarga yordam beradi.
Zamonaviy segmentatsiya algoritmlari masalan, Mask R-CNN va U-Net kabi deep
learning modellar, obyektlarning chegaralarini aniq tahlil qilish.

Segmentatsiya jarayonida tasvirning semantik tasviri (masalan, “mashina” yoki

“odam”) va har bir pikselning qaysi obyektga tegishli bo'lishi mumkin. Bu yangi obyektni
korxonada uning fon bilan uyg'un tarzda ta'minlash. Masalan, virtual mebelni uy ichki
dizaynga korxonada segmentatsiya yordamida pol yoki devor chegaralari, bu esa
obyektning realistik ko'rinishini ta'minlash.

Generativ modellar

Generativ adversial tarmoqlar (GANs) rasmga yangi ob'ektlarni

binolarda inqilobiy yoritishdir. GANlar ikkita neyron tarmoqdan iborat – generator va
diskriminator. Generator yangi tasvirlar yoki obyektlar sayt, diskriminator esa haqiqiy yoki
sun'iy baholash baholaydi. Bu jarayon realistik tasvirlar hosil beradi.

Masalan, CycleGAN va StyleGAN kabi modellar tasvirga yangi ob'ektlar (masalan,

daraxt yoki mashina) qo'shilishi mumkin, bunda ular tasvirning umumiy uslubi va
yorug'ligiga moslashtiriladi. GANlar reklama, kino va o'yin sanoatida keng qo'llanma,
chunki ular realistik va yuqori sifatli tasvirlarga qodir.

Augment reality (AR)

Augmented reality texnologiyalari real dunyoga virtual

ob'ektlarda muhim rol o'ynaydi. AR ilovalarida (masalan, IKEA Place yoki Pokémon GO)
kameralar va sensorlar yordamida real muhit skanerlanadi, keyin virtual obyektlar muhitga
joylashadi. Bu jarayon 3D modellashtirish, real vaqtda tracking va rendering texnologiyaga
asoslanadi.

ARda obyekt qulayda muhimdan biri yorug'lik va soya moslashuvidir. Masalan,

virtual mebelda, uning soyasi xonaning yorug'lik sharoitlariga mos bo'lishi kerak. Bu
SLAM (Simultaneous Localization and Mapping) algoritmlari yordamida amalga oshirish,
ular 3D muhitini va obyektni realistik oziqlantirishni ta'minlash.

Rasmga matn qo'shish usullari

Rasmga matn qo'shish tasvirlarini informatsion yoki

estetik boyitishning muhim usuli hisoblanadi. Bu jarayon reklama, ta'lim materiallari,
ijtimoiy media va keng qo' veb-sayti. Matn qo'shish bir qator algoritmlar va texnologiyaga
asoslanadi.

Optik xususiyatlarini aniqlash (OCR)

Optik dalillarni baholash (OCR) texnologiya

tasvirdagi matnni va tahlil qilishda mavjud. Bu yangi jarayon matn qo'shishda tasvirning
kontekstini yordamga yordam beradi. Masalan, reklama plakatiga matn qo'shishda OCR
yordamida mavjud matnning uslubi va joylashuvi tahlil, bu yangi matnning uyg'un
yaratishini ta'minlash.


background image

Ustozlar uchun

pedagoglar.org

73-son 4–to’plam Iyun-2025

Sahifa: 82

Zamonaviy OCR algoritmlari masalan, Tesseract va Google Cloud Vision, deep

learningga asoslanadi va turli shriftlar, tillar va tasvir sifatlarida yuqori aniqlik bilan
ishlaydi. OCR matn qo'shish jarayonida tasvirning semantik mazmunini ko'rsatadi va mos
shrift tasvirida.

Font va uslub moslashuvi

Rasmga matn qo'shishda shriftning turi, o'lchami va rangi

tasvirning umumiy estetikasi bilan uyg'un bo'lishi kerak. Masalan, reklama bannerida qalin
va shriftlar mumkin, ta'lim materiallarida esa o'qilishi oson, oddiy shriftlar afzal ko'riladi.
Deep learning algoritmlari masalan, font sintezlovchi modellar, tasvirning uslubiga mos
shriftlarni avtomatik tuzatishga yordam beradi.

Matn tasvirida soya, kontur valik kabi effektlar ko'rinishida, bu matnning tashqi

ko'rinishida belgilangan. Masalan, Photoshop va Canva kabi uskunalar bu jarayonni
avtomatlashtirish, AI-ga ishlab chiqarish (masalan, Adobe Sensei) matnni kontekstual
rag'batlantirishda yanada samarali.

Kontaktual yordam

Matnning tasvirdagilashuvi uning ma'nosi va o'qilishi uchun. Kontekstual

materiallarda tasvirning mazmuni ob'ekt joylashuvi va foydalanuvchi e'tibori mahsuloti.
Masalan, ijtimoiy media postlarida matn tasvirning markaziy yoki bo'sh qismlariga joyladi,
bu esa o'quvchining diqqatini jalb qiladi.

Deep Learning modellar, masalan, tasvirdagi diqqat markazlarini aniqlovchi

“saliency maps” algoritmlari matnning eng mos joyini aniqlashda qo'shimcha. Bu
algoritmlar tasvirning muhimni kiritish (masalan, yuzlar yoki logotiplar) aniqlab, matnni
ularga xalaqit bermas uchun joy yaratish.

Qo'shish va amaliy ahamiyati

Rasmga ob'ekt va matn qo'shish texnologiyalari turli sohalarda keng qo'shimcha

hujjatlar, har biri o'ziga xos talablarga ega.

Reklama va marketing

Reklama sanoatida bu texnologiya mahsulotlari tasvirlariga logotip, reklama

shiorlari yoki maxsus effektlar qo'shishda qo'llaniladigan. Masalan, GAN tasvirlar
yordamida mahsulot virtual muhitdagi yaratiladi, bu esa reklama kampaniyalarini yanada
jozibador qiladi. Matn qo'shish esa brend xabarini yetkazishda.

Ta'lim va media

Ta'lim materiallarida tasvirlarga izohlar yoki annotatsiyalar qo'shish o'quv jarayonini

yaxshilaydi. Masalan, tibbiy tasvirlardagi organlarning nomlari yoki tahlillari matn sifatida
qo'shiladi. Ijtimoiy mediada matnli tasvirlar (memlar, infografikalar) foydalanuvchilarning
e'tiborini jalb qilishda.

Tibbiyot va ilmiy tadqiqot

Tibbiyotda tasvirlarga ob'ekt yoki qo'shish diagnostika matni va ko'rinishidagi

ko'rsatkich. Masalan, CT tasvirlariga MRI larga qo'shishga yoki kasallikni aniqlashga


background image

Ustozlar uchun

pedagoglar.org

73-son 4–to’plam Iyun-2025

Sahifa: 83

yordam beradi. AR texnologiyalari yordami real anatomiyalarida virtual tasvirlarni
qurilmalarda.

O'yin va kino sanoati

O'yin va kino sanoatida ob'ekt va matn qo'shish virtual o'yinlarni kerakli

materiallarda. Masalan, o'yinlarda realistik muhit uchun GANlar va AR texnologiyalari
uchun. Kinoda esa matn qo'shish subtitrlaridan tortib maxsus effektlargacha keng
qo'llanma.

Texnik va kelajak istiqbollari

Rasmga ob'ekt va matn qo'shish texnologiyalari bir qator quvvatga ega. Masalan,

GANlar ba'zida realistik bo'lmagan tasvirlar hosil qilishi mumkin, ayniqsa yorug' soya
moslashuvida muammolar keladi. OCR algoritmlari o'tgan sifatli tasvirlarda yoki
murakkab shriftlarda samaradorlikni yo'qotishi mumkin. Texnologik, bu texnologiyaning
etik usullari, masalan, deepfakelar yoki mualliflik huquqini buzish, jiddiy ishlab chiqarish
talab qiladi.

Kelajakda bu sohada yangi yutuqlarga erishilishi kutilmoqda. Masalan, yanada

kengaytirilgan tasvir generativ modellar sifatini qayta, real vaqtda AR ilovalari esa yanada
aniqroq bo'ladi. Sun'iy intellektning kontekstual tushunchasi yaxshilanishi matn qo'shish
jarayonlarini yanada avtomatlashtirish. , qayta ishlash algoritmlarini qayta ishlash
mumkin.

Xulosa

Rasmga

boshqa

obyektlarni

va

matn

qo'shish

zamonaviy

kompyuter

texnologiyalarining muhim yo'nalishi sifatida turli sohalarda keng qo'llanilmoqda. Tasvir
segmentatsiyasi, generativ modellar va augmented reality kabi texnologiya ob'yektlarini
realistik muammolarni ta'minlasa, OCR va kontekstual yuridik algoritmlari matn qo'shish
jarayonlarini soddalashtirish. Bu texnologiya reklama, ta'lim, tibbiyot va o'yin sanoatida
inqilobiy o' natijalar keltirdi.

Ammo, texnik va etik muammolar bu sohaning rivojlanishida muhim to'siqlardir.

Kelajakda yanada kengaytirilgan AI modellar, real vaqtda rendering va kvant
texnologiyalari ishlab chiqarishni tiklashi kutilmoqda. Ushbu kompyuter dunyoda
tasvirlarni qayta ishlashning yangiligini ochadi va insonning vizual axborot bilan ishlash
usullarini tubdan o'zgartiradi.

Foydalanilgan adabiyotlar

Goodfellow, I., Pouget-Abadie, J., Mirza, M., va boshqalar. (2014). Generativ raqib
tarmoqlari. Neyron axborotni qayta ishlash tizimlaridagi yutuqlar, 27, 2672-2680.

U, K., Gkioxari, G., Dollar, P. va Girshick, R. (2017). Mask R-CNN. Kompyuterni
ko'rish bo'yicha IEEE xalqaro konferentsiyasi materiallari, 2961-2969.

Ronneberger, O., Fischer, P. va Brox, T. (2015). U-Net: Biomedikal tasvirni
segmentatsiyalash uchun konvolyutsion tarmoqlar. Tibbiy tasvirni hisoblash va
kompyuter yordamida aralashuv bo'yicha xalqaro konferentsiya, 234-241.


background image

Ustozlar uchun

pedagoglar.org

73-son 4–to’plam Iyun-2025

Sahifa: 84

Zhu, JY, Park, T., Isola, P. va Efros, AA (2017). Cycle-Consistent Adversarial
Networks yordamida tasvirdan tasvirga bog'lanmagan tarjima. Kompyuterni ko'rish
bo'yicha IEEE xalqaro konferentsiyasi materiallari, 2223-2232.

Karras, T., Laine, S. va Aila, T. (2019). Generativ raqib tarmoqlari uchun uslubga
asoslangan generator arxitekturasi. Kompyuterda ko'rish va naqshlarni aniqlash
bo'yicha IEEE konferentsiyasi materiallari, 4401-4410.

Smit, R. (2007). Tesseract OCR dvigatelining umumiy ko'rinishi. Hujjatlarni tahlil
qilish va tan olish bo'yicha to'qqizinchi xalqaro konferentsiya, 2, 629-633.

Azuma, RT (1997). Kengaytirilgan haqiqat bo'yicha tadqiqot. Mavjudligi:
Teleoperatorlar va virtual muhitlar, 6(4), 355-385.

Milgram, P. va Kishino, F. (1994). Aralash haqiqatdagi vizual displeylar
taksonomiyasi. Axborot va tizimlar bo'yicha IEICE operatsiyalari, 77(12), 1321-
1329.

Lou, DG (2004). Scale-Invariant Keypoints dan o'ziga xos tasvir xususiyatlari.
International Journal of Computer Vision, 60(2), 91-110.

Redmon, J., Divvala, S., Girshick, R., & Farhodi, A. (2016). Siz faqat bir marta
qaraysiz: birlashtirilgan, real vaqtda obyektni aniqlash. Kompyuterni ko'rish va
naqshlarni aniqlash bo'yicha IEEE konferentsiyasi materiallari, 779-788.


Bibliografik manbalar

• Goodfellow, I., Pouget-Abadie, J., Mirza, M., va boshqalar. (2014). Generativ raqib tarmoqlari. Neyron axborotni qayta ishlash tizimlaridagi yutuqlar, 27, 2672-2680.

• U, K., Gkioxari, G., Dollar, P. va Girshick, R. (2017). Mask R-CNN. Kompyuterni ko'rish bo'yicha IEEE xalqaro konferentsiyasi materiallari, 2961-2969.

• Ronneberger, O., Fischer, P. va Brox, T. (2015). U-Net: Biomedikal tasvirni segmentatsiyalash uchun konvolyutsion tarmoqlar. Tibbiy tasvirni hisoblash va kompyuter yordamida aralashuv bo'yicha xalqaro konferentsiya, 234-241.

• Zhu, JY, Park, T., Isola, P. va Efros, AA (2017). Cycle-Consistent Adversarial Networks yordamida tasvirdan tasvirga bog'lanmagan tarjima. Kompyuterni ko'rish bo'yicha IEEE xalqaro konferentsiyasi materiallari, 2223-2232.

• Karras, T., Laine, S. va Aila, T. (2019). Generativ raqib tarmoqlari uchun uslubga asoslangan generator arxitekturasi. Kompyuterda ko'rish va naqshlarni aniqlash bo'yicha IEEE konferentsiyasi materiallari, 4401-4410.

• Smit, R. (2007). Tesseract OCR dvigatelining umumiy ko'rinishi. Hujjatlarni tahlil qilish va tan olish bo'yicha to'qqizinchi xalqaro konferentsiya, 2, 629-633.

• Azuma, RT (1997). Kengaytirilgan haqiqat bo'yicha tadqiqot. Mavjudligi: Teleoperatorlar va virtual muhitlar, 6(4), 355-385.

• Milgram, P. va Kishino, F. (1994). Aralash haqiqatdagi vizual displeylar taksonomiyasi. Axborot va tizimlar bo'yicha IEICE operatsiyalari, 77(12), 1321-1329.

• Lou, DG (2004). Scale-Invariant Keypoints dan o'ziga xos tasvir xususiyatlari. International Journal of Computer Vision, 60(2), 91-110.

• Redmon, J., Divvala, S., Girshick, R., & Farhodi, A. (2016). Siz faqat bir marta qaraysiz: birlashtirilgan, real vaqtda obyektni aniqlash. Kompyuterni ko'rish va naqshlarni aniqlash bo'yicha IEEE konferentsiyasi materiallari, 779-788.