ISSN:
2181-3906
2024
International scientific journal
«MODERN SCIENCE АND RESEARCH»
VOLUME 3 / ISSUE 6 / UIF:8.2 / MODERNSCIENCE.UZ
1214
KOMPYUTER KO‘RISH BILAN TANISHISH, TASVIRLARGA ISHLOV BERISH VA
CHUQUR O‘QITISH
Nurmurodov J. N,
Nigmatov S.N.
Ahmadjonov I.A.
Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalari universiteti
Kompyuter injiniringi fakulteti.
https://doi.org/10.5281/zenodo.12598521
Annotatsiya.
Ushbu maqola kompyuter ko‘rish (Computer Vision) sohasida tasvirlarga
ishlov berish va chuqur o‘qitish (Deep Learning) texnikalarini o‘rganish haqida batafsil ma’lumot
beradi. Kompyuter ko‘rish inson ko‘rish qobiliyatini simulyatsiya qilishga qaratilgan bo‘lib,
zamonaviy texnologiyalar, ayniqsa chuqur o‘qitish yordamida sezilarli darajada rivojlandi.
Chuqur o‘qitish neyron tarmoqlari, ayniqsa konvolyutsion neyron tarmoqlar (CNN),
tasvirlarni tahlil qilish va ulardan ma’lumot olishda muhim rol o‘ynaydi. Maqola chiziqli algebra
va algoritmlash asoslari bo‘yicha dastlabki bilimlarga ega bo‘lgan o‘quvchilar uchun
mo‘ljallangan.
Kalit so‘zlar:
CNN, sun’iy intellekt, modellar, Deep Learning, Le-Net5 modeli.
INTRODUCING COMPUTER VISION, IMAGE PROCESSING AND DEEP LEARNING
Abstract.
This article provides detailed information on the study of image processing and
deep learning techniques in the field of Computer Vision. Computer vision aims to simulate human
vision and has advanced significantly with the help of modern technologies, especially deep
learning. Deep learning neural networks, especially convolutional neural networks (CNNs), play
an important role in image analysis and information extraction. The article is intended for students
who have basic knowledge of linear algebra and algorithms.
Keywords:
CNN, artificial intelligence, models, Deep Learning, Le-Net5 model.
ПРЕДСТАВЛЯЕМ КОМПЬЮТЕРНОЕ ЗРЕНИЕ, ОБРАБОТКУ ИЗОБРАЖЕНИЙ И
ГЛУБОКОЕ ОБУЧЕНИЕ
Аннотация.
В данной статье представлена подробная информация об
исследовании методов обработки изображений и глубокого обучения в области
компьютерного зрения. Компьютерное зрение направлено на имитацию человеческого
зрения и значительно продвинулось вперед благодаря современным технологиям, особенно
глубокому обучению. Нейронные сети глубокого обучения, особенно сверточные нейронные
сети (CNN), играют важную роль в анализе изображений и извлечении информации.
Статья предназначена для студентов, имеющих базовые знания линейной алгебры
и алгоритмов.
Ключевые слова:
CNN, искусственный интеллект, модели, глубокое обучение,
модель Le-Net5.
Kirish.
Kompyuterni ko‘rish
- bu sun’iy intellekt (AI) sohasi bo‘lib, u kompyuterlar va
tizimlarni raqamli tasvirlar, videolar va boshqa vizual ma’lumotlardan mazmunli ma’lumot
olishga o‘rgatish uchun mashinani o‘rganish va neyron tarmoqlardan foydalanadi va ular
nuqsonlar yoki muammolarni ko‘rganlarida tavsiyalar berish yoki choralar ko‘rishni o‘rgatadi. U
ISSN:
2181-3906
2024
International scientific journal
«MODERN SCIENCE АND RESEARCH»
VOLUME 3 / ISSUE 6 / UIF:8.2 / MODERNSCIENCE.UZ
1215
kompyuterlarni vizual dunyoni tushunishga o‘rgatadi va ularga imkon beradi. Kompyuterlar
ob’yektlarni aniq aniqlash va tasniflash va ularga munosabat bildirish uchun raqamli tasvirlar va
chuqur o‘rganish modellaridan foydalanishi mumkin.
1-rasm. Kompyuter ko‘rish
Kompyuter ko‘rishning tarixi bir necha muhim bosqichlarni o‘z ichiga oladi. Ushbu
bosqichlar davrida ilmiy yutuqlar va texnologik rivojlanishning katta roli bor.
1960-yillarda MIT professori Marvin Minsky "Summer Vision Project" loyihasini boshladi
va bu kompyuter ko‘rishning dastlabki tadqiqotlari uchun asos qo‘ydi.
1970-yillarda Shapiro va Haralick tasvirlarni strukturaviy tavsiflashga oid muhim ishlar
qatoriga kirganlar.
1980-yillarda Kunihiko Fukushima "Neocognitron" deb nomlangan konvolyutsion neyron
tarmoqlarini taklif etdi, bu hamkorligi natijasida CNN ning rivojlanishiga olib kelgan.
1990-yillarda Yann LeCun "LeNet-5" modelini ishlab chiqdi va bu model kompyuter
ko‘rishning ilg‘or o‘rganish algoritmalaridan biri hisoblanadi.
2000-yillarda Geoffrey Hinton "deep learning" tushunchasini rivojlantirdi va chuqur
o‘qitishning kengaytirilishi uchun katta qadam edi.
2010-yillarda Alex Krizhevsky "AlexNet" modelini ishlab chiqdi va bu model kompyuter
ko‘rish sohasida qanday yuqori natijalarga erishish mumkinligini ko‘rsatdi.
Bugungi kunda kompyuter ko‘rish texnologiyasi sun’iy intellektning muhim sohasi
hisoblanadi va uning amaliy qo‘llanilishi har kuni kengayib bormoqda. Zamonaviy tadqiqotlar va
innovatsiyalar kompyuter ko‘rishning yanada rivojlanishiga va yangi imkoniyatlarning paydo
bo‘lishiga turtki bermoqda. Tibbiyotda tashxis qo‘yish, transportda o‘zini o‘zi boshqaruvchi
avtomobillar, sanoatda ishlab chiqarish jarayonlarini avtomatlashtirish va xavfsizlik tizimlarida
yuzni aniqlash kabi ko‘plab sohalarda bu texnologiya ishlatilmoqda.
Kompyuter ko‘rishning asosiy jihatlari ko‘plab sohalarda muhim rol o‘ynaydi va turli
vazifalarni bajarishda yordam beradi. Bu asosiy jihatlarni quyidagicha tushuntirish mumkin:
Tasvirni Aniqlash
: Bu jihat tasvirdagi muayyan ob’yektni, shaxsni yoki harakatni
aniqlashni o‘z ichiga oladi. Masalan, avtomobilni tasvirdan aniqlash, shaxsning yuzini tanib olish
yoki biror harakatni aniqlash bu jihatga misol bo‘lishi mumkin.
ISSN:
2181-3906
2024
International scientific journal
«MODERN SCIENCE АND RESEARCH»
VOLUME 3 / ISSUE 6 / UIF:8.2 / MODERNSCIENCE.UZ
1216
2-rasm. Tasvirni aniqlash.
Ob’yektni Aniqlash
: Bu usul tasvir ichidagi bir nechta ob’yektlarni tanib olish va ularning
joylashuvini aniqlashda ishlatiladi. Misol uchun, avtomobillar, insonlar, hayvonlar yoki boshqa
ob’yektlarni tasvirdan aniqlash.
3-rasm. Ob’ektni aniqlash.
Tasvirni Segmentatsiyalash
: Bu jarayon tasvirdagi ob’yektlarni bir-biriga ajratib chiqishda
yordam beradi. Tasvirni mazmunliroq va tahlil qilish uchun tasvirni bir nechta segmentlarga
ajratadi. Masalan, tibbiy tasvirlashda organlarni yoki vositalarni ajratib chiqish.
ISSN:
2181-3906
2024
International scientific journal
«MODERN SCIENCE АND RESEARCH»
VOLUME 3 / ISSUE 6 / UIF:8.2 / MODERNSCIENCE.UZ
1217
4-rasm. Tasvir segmentatsiyasi.
Yuzni Tanib Olish
: Bu jihat tasvirdagi yuzlarni aniqlash va tanib olish uchun foydalaniladi.
Bu, masalan, ta’qibotchilar uchun yuz tanib olish va avtomatik o‘zini o‘zi tanib olishda
qo‘llaniladi.
5-rasm. Yuzni tanib olish.
Harakat Tahlili
: Bu usul videodagi harakatlanuvchi ob’yektlarning trayektoriyasini
tushunishga yordam beradi. Bu xavfsizlik, kuzatuv va sport tahlilida ishlatiladi.
6-rasm. Harakatni tahlil qilish.
Mashinani Ko‘rish
: Bu jihatda, kompyuter ko‘rish vizual ma'lumotlarni qayta ishlash va
avtomatlashtirilgan zavod yig‘ish liniyalari kabi ilovalarda apparat harakatlarini boshqarish uchun
foydalaniladi.
Bu jihatlar, kompyuter ko‘rishning amaliy qo‘llanilishi bo‘yicha keng doirada muhimdir
va turli sohalarda samarali o‘zlashtirilgan. Ular, bizga tasvirlarning tahlili, ob’yektlarni aniqlash
va harakatlarni tushunishda yordam beradi va turli sohalarda avtomatlashtirish imkonini yaratadi.
Tasvirlarga ishlov berish texnikalari.
Tasvirlarga ishlov berish texnikalari kompyuter
ko‘rishda juda muhimdir. Bu texnikalar tasvirlarni dastlabki holatdan o‘tkazib, ularga ma'lumotlar
olish, tahlil qilish va so‘nggi natijalarni olishda yordam beradi.
Kompyuter Vision yordamida tasvirni tahlil qilish
ISSN:
2181-3906
2024
International scientific journal
«MODERN SCIENCE АND RESEARCH»
VOLUME 3 / ISSUE 6 / UIF:8.2 / MODERNSCIENCE.UZ
1218
Kompyuter ko‘rish yordamida tasvirni tahlil qilish turli xil hisoblash texnikasi yordamida
tasvirlardan mazmunli ma'lumotlarni olishni o‘z ichiga oladi. Bu jarayon sog‘liqni saqlash,
avtomobilsozlik, xavfsizlik va o‘yin-kulgi kabi ko‘plab sohalardagi ko‘plab ilovalarda asosiy
hisoblanadi. Bu erda tasvir tahlili odatda kompyuter ko‘rish texnologiyalari yordamida qanday
amalga oshirilishi haqida ma'lumot:
1. Tasvirga oldindan ishlov berish
Tahlil qilishdan oldin tasvirlar sifatini yaxshilash va keyingi qayta ishlash uchun muhim
xususiyatlarni yaxshilash uchun ko‘pincha oldindan ishlov berishdan o‘tadi. Umumiy ishlov
berish bosqichlari quyidagilarni o‘z ichiga oladi:
Kulrang rangga aylantirish
: rangni qayta ishlash zaruratini bartaraf etish orqali tahlilni
soddalashtirish uchun tasvirni kul rangga qisqartirish.
Shovqinni kamaytirish
: tasvirni tekislash va tahlilga xalaqit beradigan shovqinni
kamaytirish uchun filtrlarni qo‘llash.
Normalizatsiya
: bir xillik uchun piksel intensivligini sozlash.
Chegaralarni aniqlash
: chegaralar va shakllarni yaxshiroq aniqlash uchun tasvirdagi
qirralarni ajratib ko‘rsatish.
2. Xususiyatlarni chiqarish
Xususiyatlarni ajratib olish tasvirning turli xususiyatlarini yoki atributlarini aniqlash va
ajratishni o‘z ichiga oladi. Xususiyatlar shakllar, teksturalar, ranglar yoki muayyan naqshlarni o‘z
ichiga olishi mumkin. Xususiyatlarni samarali ajratib olish juda muhim, chunki u keyingi tahlil
bosqichlarining aniqligi va samaradorligiga bevosita ta'sir qiladi.
3. Segmentatsiya
Segmentatsiya tasvirni soddalashtirish va yanada mazmunliroq narsaga o‘zgartirish uchun
tasvirni bir nechta segmentlarga (piksellar to‘plami, shuningdek, superpiksellar deb ham ataladi)
ajratadi. Segmentatsiya qilishning turli usullari mavjud :
Eshik chegarasi
: oldindan belgilangan mezon asosida piksellarni ajratish.
Hududga asoslangan segmentatsiya
: Tasvirni oldindan belgilangan mezonlar bo‘yicha
hududlarga bo‘lish.
Chekka asoslangan segmentatsiya
: chegaralarni topish uchun qirralarni aniqlash.
Klasterlash
: o‘xshashlik asosida piksellarni klasterlarga guruhlash.
4. Obyektni aniqlash va tanib olish
Ushbu bosqich tasvir ichidagi ob’yektlarni aniqlash va ularni ma'lum toifalarga tasniflashni
o‘z ichiga oladi. Bunga turli usullar bilan erishish mumkin:
Shablonni moslashtirish
: Muayyan ob’yektlar mavjudligini aniqlash uchun tasvirning turli
qismlarini shablonga solishtirish.
Mashinani o‘rganish
: ob’yektlarni tanib olish uchun o‘rgatilgan algoritmlardan
foydalanish. Bu odatda etiketli tasvirlar bilan katta ma'lumotlar to‘plamida modelni o‘rgatishni o‘z
ichiga oladi.
Chuqur o‘rganish
: tasvirdagi turli ob’yektlarni yuqori aniqlik bilan avtomatik ravishda
aniqlay oladigan va tasniflay oladigan konvolyutsion neyron tarmoqlarni (CNN) qo‘llash.
5. Tahlil va talqin qilish
ISSN:
2181-3906
2024
International scientific journal
«MODERN SCIENCE АND RESEARCH»
VOLUME 3 / ISSUE 6 / UIF:8.2 / MODERNSCIENCE.UZ
1219
ob’yektlarni aniqlash va tasniflashdan so‘ng, tizim tushunchalarni olish uchun kontekstni
yoki vaqt o‘tishi bilan o‘zgarishlarni (videoda) tahlil qiladi. Ushbu bosqich quyidagilarni o‘z
ichiga olishi mumkin:
Pattern Recognition
: Tasvirdagi naqsh yoki anomaliyalarni aniqlash.
Statistik tahlil
: ob’yektlar soni yoki o‘lchamlarni taqsimlash kabi turli xil statistik
ma'lumotlarni hisoblash.
Mashinani ko‘rish
: harakatni boshqarish uchun tasvirlarni talqin qilish (masalan, robot
jarayonlarini avtomatlashtirishda).
6. Qaror qabul qilish
Yakuniy bosqich tahlil qilingan ma'lumotlar asosida qaror qabul qilishni o‘z ichiga oladi.
Bu ma'lum bir ob’yekt aniqlanganda ogohlantirishni ishga tushirishdan tortib, tibbiy
tasvirlarda diagnostik tushunchalarni taqdim etishgacha bo‘lishi mumkin.
Asboblar va kutubxonalar kompyuter ko‘rishda tasvirlarni tahlil qilishni osonlashtirishda
juda muhimdir. Quyidagi asboblar va kutubxonalar bu vazifani bajarishda yordam beradi:
OpenCV
: OpenCV (Open Source Computer Vision Library) tasvirni yuklash, saqlash,
ko‘rish, tahlil qilish, filtrlash, segmentatsiya qilish, tasniflash va boshqa ko‘plab amallarni
bajarishda ishlatiladi. Bu, dastlabki platforma bo‘lib, Python, C++, Java va boshqa dasturlash
tillariga integratsiya qilinishi mumkin.
TensorFlow va PyTorch
: TensorFlow va PyTorch deep learning va chuqur o‘rganish
ilovalari uchun mashhur ramkalar hisoblanadi. Ular tasvir tasnifi, ob’yektni aniqlash,
segmentatsiya va boshqa kompyuter ko‘rish vazifalarini bajarishda qo‘llaniladi. TensorFlow
TensorFlow Lite yordamida mobil ilovalarda, TensorFlow.js web ilovalarda, PyTorch esa
PyTorch Mobile yordamida mobil ilovalarda ishlatiladi.
Scikit-Image
: Bu Python kutubxonasi tasvirni qayta ishlash, segmentatsiya, filtrlash,
morfologiya va boshqa amallarni bajarish uchun mo‘ljallangan. Bu kutubxona tasvirlarni ko‘rib
chiqish, ular ustida qayta ishlash, tashqi qaytish, segmentatsiya qilish va boshqa amallarni
osonlashtiradi.
Fastai
: Fastai TensorFlow va PyTorchda ishlaydigan chuqur o‘rganish ilovasi hisoblanadi.
Tasvir tasnifi, ob’yektni aniqlash, tasvir generatsiyasi va boshqa amallarni bajarishda
foydalaniladi.
Bu asboblar va kutubxonalar kompyuter ko‘rishda tasvirlarni tahlil qilishda yordam beradi
va turli vazifalarni bajarish uchun muhimdir.
Rasmni o‘qish, ko‘rsatish va yozish.
OpenCV, dunyodagi eng katta kompyuter ko‘rish kutubxonasi ushbu uchta o‘rnatilgan
funksiyaga ega, keling, ularning har biri aynan nima qilishini bilib olaylik:
imread()
- tasvirni o‘qishga yordam beradi
imshow()
- oynada tasvirni ko‘rsatadi
imwrite()
- fayl katalogiga rasm yozadi
Bu yerda barcha funktsiyalarni ko‘rsatish uchun biz quyidagi rasmdan foydalanamiz.
Xulosa.
Xulosa qilib aytadigan bo‘lsak, kompyuterni ko‘rish - bu avtonom avtotransport
vositalaridan tortib, yuzni tanib olishgacha bo‘lgan hayotimizning ko‘plab sohalarida
ISSN:
2181-3906
2024
International scientific journal
«MODERN SCIENCE АND RESEARCH»
VOLUME 3 / ISSUE 6 / UIF:8.2 / MODERNSCIENCE.UZ
1220
qo‘llanilayotgan kuchli va tez rivojlanayotgan texnologiya. U insoniyatga turli yo‘llar bilan foyda
keltirish imkoniyatiga ega. Texnologiya taraqqiyotda davom etar ekan, KK potentsiali va uning
yanada murakkab sun’iy intellekt tizimlarini yaratish qobiliyati ham oshib bormoqda. Kompyuter
ko‘rishning barcha turlari foydalidir. Ulardan asosiy maqsadni, Ma’lumotlar manbalarini, harakat
miqdorini va hisoblash quvvatini tushunishni o‘z ichiga olgan to‘g‘ri ish uchun foydalanish
muhimdir.
REFERENCES
1.
Concise Computer Vision: An Introduction into Theory and Algorithms.
2.
Computer Vision: Algorithms And Applications.
3.
Computer Vision: Models, Learning, and Inference.
4.
Learning OpenCV 5 Computer Vision with Python
5.
Modern Computer Vision With Pytorch
