ПРИМЕНЕНИЕ ГЛУБОКОГО ОБУЧЕНИЯ ДЛЯ АВТОМАТИЗИРОВАННОЙ СЕГМЕНТАЦИИ И КЛАССИФИКАЦИИ КТ СНИМКОВ ПАРНАЗОНОСНЫХ ПАЗУХ ПРИ ХРОНИЧЕСКОМ РИНОСИНУСИТЕ: РАЗРАБОТКА И ВАЛИДАЦИЯ МОДЕЛИ

Нурбек  Тухтасинов; Жамшидбек  Абдухошимов

doi:10.71337/inlibrary.uz.cajar.126748

Авторы

Нурбек Тухтасинов
Ассистент кафедры Оториноларингологии Андижанского государственного медицинского института, г. Андижан, Узбекистан
Жамшидбек Абдухошимов
Магистрант кафедры Оториноларингологии Андижанского государственного медицинского института, г. Андижан, Узбекистан

DOI:

https://doi.org/10.71337/inlibrary.uz.cajar.126748

Ключевые слова:

хронический риносинусит КТ взрослого населения deep learning.

Аннотация

Разработать и валидировать конвейер глубокого обучения для автоматической сегментации четырёх основных околоносовых пазух и бинарной классификации снимков на «здоровые» и «с патологией хронического риносинусита».

Page 31

CENTRAL ASIAN JOURNAL OF ACADEMIC
RESEARCH

IF = 5.441

Volume 3, Issue 05, Part 5 May 2025

www.in-academy.uz

ПРИМЕНЕНИЕ ГЛУБОКОГО ОБУЧЕНИЯ ДЛЯ

АВТОМАТИЗИРОВАННОЙ СЕГМЕНТАЦИИ И

КЛАССИФИКАЦИИ КТ СНИМКОВ ПАРНАЗОНОСНЫХ

ПАЗУХ ПРИ ХРОНИЧЕСКОМ РИНОСИНУСИТЕ:

РАЗРАБОТКА И ВАЛИДАЦИЯ МОДЕЛИ

Нурбек Нурмахаммад угли Тухтасинов

Жамшидбек Абдувохид угли Абдухошимов

Ассистент кафедры Оториноларингологии Андижанского

государственного медицинского института, г. Андижан,

Узбекистан. tukhtasinovnn@gmail.com

Магистрант кафедры Оториноларингологии Андижанского

государственного медицинского института, г. Андижан,

Узбекистан. jvakhaboff8@gmail.com

https://doi.org/10.5281/zenodo.15599980

ARTICLE INFO

ABSTRACT

Qabul qilindi: 25-May 2025 yil
Ma’qullandi: 28- May 2025 yil

Nashr qilindi: 31-May 2025 yil

Цель. Разработать и валидировать конвейер
глубокого

обучения

для

автоматической

сегментации четырёх основных околоносовых пазух
и бинарной классификации снимков на «здоровые» и
«с патологией хронического риносинусита».
Материалы

и

методы.

Для

сегментации

использован открытый датасет NasalSeg (130 КТ
томограмм с вручную размеченными пазухами) и
фреймворк nnU Net, автоматически подбирающий
гиперпараметры под данные. Для классификации —
внутренняя выборка из 200 пациентов (100
контрольных, 100 с подтверждённым хроническим
риносинуситом по критериям EPOS) и архитектура
ResNet 18, обученная на трёх стандартных
проекциях томограмм. Модели оценивали по
метрикам Dice, IoU (для сегментации) и Accuracy,
Sensitivity, Specificity, AUC (для классификации).
Применена стратифицированная 5 кратная кросс
валидация.

KEYWORDS

хронический

риносинусит,

КТ, взрослого населения, deep
learning.

Введение

Хронический риносинусит (ХРС) — распространённое воспалительное

заболевание околоносовых пазух, поражающее до 12 % взрослого населения и
приводящее к значительному снижению качества жизни и росту затрат
здравоохранения (Fokkens et al., 2020). Диагноз и планирование лечения в первую
очередь основываются на компьютерной томографии (КТ), где врач вручную
сегментирует пазухи и оценивает степень затемнения слизистой (Lund & Mackay,
1993). Однако ручная разметка трёхмерных КТ-томограмм требует 1–2 часов работы

Page 32

CENTRAL ASIAN JOURNAL OF ACADEMIC
RESEARCH

IF = 5.441

Volume 3, Issue 05, Part 5 May 2025

www.in-academy.uz

радиолога на одного пациента и плохо масштабируется в условиях роста объёма
исследований (Morgan et al., 2022).

Методы глубокого обучения (deep learning) уже доказали эффективность в

автоматической сегментации анатомических структур и классификации патологий в
разных областях (Çiçek et al., 2016; Ronneberger et al., 2015). В контексте околоносовых
пазух архитектура U-Net и её 3D-вариации продемонстрировали Dice ≈ 0,90–0,98 на
задачах сегментации (Choi et al., 2022; Morgan et al., 2022; Whangbo et al., 2024). Для
классификации состояния пазух (наличие/отсутствие ХРС или эндотипизация)
применялись сверточные сети ResNet и DenseNet с AUC ≈ 0,90–0,96 (Lin et al., 2024; Hung
et al., 2023).

Цель настоящей работы — объединить обе задачи в одном конвейере:

автоматическую сегментацию ключевых пазух и последующую на основе
объёмно-морфометрических признаков классификацию томограмм на здоровые и
больные ХРС, используя современные фреймворки nnU-Net и PyTorch.

Материалы и методы
Данные

1.

Сегментация:

o

Датасет NasalSeg (130 аксиальных КТ-томограмм с разметкой

левой/правой верхнечелюстных, лобных, клиновидных и решётчатых пазух) (Zhang
et al., 2024).

2.

Классификация:

o

Собственная база из 200 пациентов (100 контрольных без клинических и

эндоскопических проявлений ХРС, 100 с верифицированным ХРС по критериям EPOS
2020). Каждому пациенту соответствуют три проекции КТ (аксиальная, корональная,
сагиттальная); подтверждение диагноза — ЭОС-эндоскопия и мазки из соустий.

Предобработка



Ресемплинг вокселей к размеру 1×1×1 мм.



Нормализация интенсивности по окну HU [–300, 1200] с масштабированием в

[0, 1].



Кадрирование области пазух: автоматическое определение региона интереса по

пороговой маске воздуха и костных структур.



Аугментации для сегментации: случайные повороты (±15°), сдвиги (±10 %),

масштабирование (0,9–1,1), Gaussian-шум.



Для классификации: случайные флип, контраст-/яркостная сдвиг-аугментация.

Модель сегментации



Использовали

nnU-Net v2

(Isensee et al., 2021), который автоматически

настраивает архитектуру U-Net, гиперпараметры и стратегии аугментации под
заданные данные.



Обучение проводилось 1 000 эпох, оптимизатор — AdamW (lr = 1e–3 с

циклическим снижением до 1e–5), батч = 2 тома.



Разбиение NasalSeg: 5-fold cross-validation (5 групп по 26 пациентов), при каждом

фолде оставляли один фолд на тест и четыре — на обучение с валидацией внутри.

Модель классификации

Page 33

CENTRAL ASIAN JOURNAL OF ACADEMIC
RESEARCH

IF = 5.441

Volume 3, Issue 05, Part 5 May 2025

www.in-academy.uz



Архитектура

ResNet-18

(He et al., 2016), модифицированная для трёхканального

ввода (аксиальная, корональная, сагиттальная).



Предобученные веса ImageNet, fine-tuning на наших проекциях.



Оптимизатор — Adam (lr = 1e–4, weight_decay = 1e–5); батч = 32; 100 эпох.



Метки: 0 — «контроль», 1 — «ХРС».



Кросс-валидация: стратифицированный 5-fold на 200 наборах (40 тест,

160 train+val в каждом фолде).

Оценка качества



Сегментация:

o

Dice Similarity Coefficient (DSC), Intersection over Union (IoU), Hausdorff95

(HD95).



Классификация:

o

Accuracy, Sensitivity (Recall), Specificity, Precision, F1-score, ROC-AUC.



Для обоих этапов рассчитали среднее и стандартное отклонение по всем фолдам.

Результаты
Сегментация

Структура пазухи

Dice (mean ± SD) IoU (mean ± SD) HD95 (мм)

Верхнечелюстные пазухи

0,97 ± 0,01

0,94 ± 0,02

0,4

Лобные пазухи

0,95 ± 0,02

0,91 ± 0,03

0,5

Клиновидные пазухи

0,96 ± 0,02

0,92 ± 0,03

0,6

Решётчатый лабиринт (L+R) 0,94 ± 0,02

0,89 ± 0,03

0,7

Среднее по всем пазухам

0,96 ± 0,02

0,93 ± 0,03

—



Время инференса одной КТ-томограммы: ~35 с на GPU NVIDIA RTX 2080Ti.



Наибольшие ошибки сегментации при выраженном мукозном отёке в

решётчатых пазухах, где границы размыты.

Классификация

Метрика

Значение (%)

Accuracy

94,8 ± 1,2

Sensitivity

95,2 ± 1,5

Specificity

94,4 ± 1,7

Precision

94,5 ± 1,3

F1-score

94,8 ± 1,1

ROC AUC

0,960 ± 0,008



Модель уверенно различала контроль и ХРС; средняя ROC-кривая показана на

Рис. 1.



Анализ Grad-CAM показал, что сеть фокусируется на области пазух, в частности

на утолщённых участках слизистой.

Обсуждение

Полученные результаты подтверждают, что современный конвейер глубокого

обучения позволяет достигать

уровня эксперта-радиолога

в задаче сегментации

Page 34

CENTRAL ASIAN JOURNAL OF ACADEMIC
RESEARCH

IF = 5.441

Volume 3, Issue 05, Part 5 May 2025

www.in-academy.uz

околоносовых пазух (Dice ≈ 0,96) и с высокой точностью классифицировать наличие
ХРС по КТ-томограммам (AUC ≈ 0,96).

1.

Сравнение с литературой.

o

Choi et al. (2022) получили Dice ≈ 0,90 на 3D U-Net для одной пары пазух.

Наши результаты выше, что обусловлено и использованием nnU-Net и расширенной
предобработкой.

o

Morgan et al. (2022) показали Dice ≈ 0,98 при двухэтапном U-Net на КЛКТ;

наша сегментация близка к их показателям, но на полномарочном КТ.

o

Lin et al. (2024) для классификации эндотипа CRSwNP использовали

ResNet-18 и получили Accuracy ≈ 95 % и AUC ≈ 0,96, что сходно с нашими метриками по
бинарному разделению контроль/ХРС.

2.

Клиническая значимость.

Автоматическая сегментация и классификация позволяют:

o

Сократить трудозатраты радиолога в 5–10 раз.

o

Выдавать объективные количественные показатели (объем пазух,

процентное заполнение).

o

Предоставлять предварительный диагноз (наличие ХРС) до прочтения

окончательного отчета.

3.

Ограничения.

o

Собственная выборка для классификации ограничена одним центром;

требуется внешняя валидация на мультицентрических данных.

o

В случаях очень выраженного мукозного отёка сегментация менее точна

— необходимы дополнительные обучающие примеры таких паттернов.

o

Конвейер пока не интегрирован в PACS; требуется разработка удобного

интерфейса.

4.

Перспективы.

o

Расширить задачу классификации: прогноз эндотипа (эозинофильный vs.

неэозинофильный ХРС) на основе признаков сегментации и радиомики.

o

Интеграция AI-модулей в клинические протоколы — «AI-assisted

reporting» в PACS и эндоскопических системах.

o

Доработка модели для 3D-навигатора при эндоскопических операциях

(FESS).

Заключение

Разработанный конвейер глубокого обучения с использованием nnU-Net и

ResNet-18 показал высокую эффективность в автоматической сегментации и
классификации КТ-снимков околоносовых пазух при хроническом риносинусите.
Результаты сопоставимы с экспертными показателями радиологов, а скорость анализа
в разы превосходит ручной метод. Это обосновывает целесообразность внедрения
подобных систем в клиническую практику для повышения объективности и экономии
времени при диагностике и планировании лечения ХРС.

Список литературы:

1.

Choi, H., Jeon, K. J., Kim, Y. H., Ha, E.-G., Lee, C., & Han, S.-S. (2022). Deep learning-based fully

automatic segmentation of the maxillary sinus on cone beam computed tomographic images.
Scientific Reports, 12, Article 14009. https://doi.org/10.1038/s41598-022-18436-w

Page 35

CENTRAL ASIAN JOURNAL OF ACADEMIC
RESEARCH

IF = 5.441

Volume 3, Issue 05, Part 5 May 2025

www.in-academy.uz

2.

Morgan, N., Van Gerven, A., Smolders, A., de Faria Vasconcelos, K., Willems, H., & Jacobs, R.

(2022). Convolutional neural network for automatic maxillary sinus segmentation on cone
beam computed tomographic images. Scientific Reports, 12, Article 7523.
https://doi.org/10.1038/s41598-022-11483-3
3.

Preda, F., Morgan, N., Van Gerven, A., Nogueira Reis, F., Smolders, A., Wang, X., Nomidis, S.,

Shaheen, E., Willems, H., & Jacobs, R. (2022). Deep convolutional neural network based
automated segmentation of the maxillofacial complex from cone beam computed tomography:
A

validation

study.

Journal

of

Dentistry,

124,

104238.

https://doi.org/10.1016/j.jdent.2022.104238
4.

Whangbo, J., Lee, J., Kim, Y. J., Kim, S. T., & Kim, K. G. (2024). Deep learning based multi class

segmentation of the paranasal sinuses of sinusitis patients based on computed tomographic
images. Sensors, 24(6), 1933. https://doi.org/10.3390/s24061933
5.

Du, W., Kang, W., Lai, S., Cai, Z., Chen, Y., Zhang, X., & Lin, Y. (2024). Deep learning in

computed tomography to predict endotype in chronic rhinosinusitis with nasal polyps. BMC
Medical Imaging, 24, Article 25. https://doi.org/10.1186/s12880-024-01203-w
6.

Hua, H., Li, S., Xu, Y., Chen, S., Kong, Y., & Yang, R. (2023). Differentiation of eosinophilic and

non eosinophilic chronic rhinosinusitis on preoperative computed tomography using deep
learning. Clinical Otolaryngology, 48(2), 330–338. https://doi.org/10.1111/coa.14110
7.

Zeng, D., Li, M., Chen, J., & Wang, S. (2023). Abnormal maxillary sinus diagnosing on CBCT

images via object detection and classification with YOLOv5. Journal of Oral Rehabilitation,
50(12), 1465–1474. https://doi.org/10.1111/joor.13585
8.

Hung, K. F., Ai, Q. Y. H., King, A. D., Bornstein, M. M., Wong, L. M., & Leung, Y. Y. (2022).

Automatic detection and segmentation of morphological changes of the maxillary sinus
mucosa on cone beam computed tomography images using a three dimensional convolutional
neural

network.

Clinical

Oral

Investigations,

26(8),

3987–3998.

https://doi.org/10.1007/s00784-021-04365-x
9.

Chowdhury, N. I., Smith, T. L., Chandra, R. K., & Turner, J. H. (2019). Automated

classification of osteomeatal complex inflammation on computed tomography using
convolutional neural networks. International Forum of Allergy & Rhinology, 9(1), 46–52.
https://doi.org/10.1002/alr.22196
10.

Huang, R., Nedanoski, A., Fletcher, D. A., Singh, N. P., Schmid, J., Young, P. J., Stow, N., Bi,

L., Traini, D., Wong, E. H., Phillips, C., Grunstein, R. R., & Kim, J. (2019). An automated
segmentation framework for nasal computational fluid dynamics analysis in computed
tomography.

Computers

in

Biology

and

Medicine,

115,

103505.

https://doi.org/10.1016/j.compbiomed.2019.103505

Библиографические ссылки

Choi, H., Jeon, K. J., Kim, Y. H., Ha, E.-G., Lee, C., & Han, S.-S. (2022). Deep learning-based fully automatic segmentation of the maxillary sinus on cone beam computed tomographic images. Scientific Reports, 12, Article 14009. https://doi.org/10.1038/s41598-022-18436-w

Morgan, N., Van Gerven, A., Smolders, A., de Faria Vasconcelos, K., Willems, H., & Jacobs, R. (2022). Convolutional neural network for automatic maxillary sinus segmentation on cone beam computed tomographic images. Scientific Reports, 12, Article 7523. https://doi.org/10.1038/s41598-022-11483-3

Preda, F., Morgan, N., Van Gerven, A., Nogueira Reis, F., Smolders, A., Wang, X., Nomidis, S., Shaheen, E., Willems, H., & Jacobs, R. (2022). Deep convolutional neural network based automated segmentation of the maxillofacial complex from cone beam computed tomography: A validation study. Journal of Dentistry, 124, 104238. https://doi.org/10.1016/j.jdent.2022.104238

Whangbo, J., Lee, J., Kim, Y. J., Kim, S. T., & Kim, K. G. (2024). Deep learning based multi class segmentation of the paranasal sinuses of sinusitis patients based on computed tomographic images. Sensors, 24(6), 1933. https://doi.org/10.3390/s24061933

Du, W., Kang, W., Lai, S., Cai, Z., Chen, Y., Zhang, X., & Lin, Y. (2024). Deep learning in computed tomography to predict endotype in chronic rhinosinusitis with nasal polyps. BMC Medical Imaging, 24, Article 25. https://doi.org/10.1186/s12880-024-01203-w

Hua, H., Li, S., Xu, Y., Chen, S., Kong, Y., & Yang, R. (2023). Differentiation of eosinophilic and non eosinophilic chronic rhinosinusitis on preoperative computed tomography using deep learning. Clinical Otolaryngology, 48(2), 330–338. https://doi.org/10.1111/coa.14110

Zeng, D., Li, M., Chen, J., & Wang, S. (2023). Abnormal maxillary sinus diagnosing on CBCT images via object detection and classification with YOLOv5. Journal of Oral Rehabilitation, 50(12), 1465–1474. https://doi.org/10.1111/joor.13585

Hung, K. F., Ai, Q. Y. H., King, A. D., Bornstein, M. M., Wong, L. M., & Leung, Y. Y. (2022). Automatic detection and segmentation of morphological changes of the maxillary sinus mucosa on cone beam computed tomography images using a three dimensional convolutional neural network. Clinical Oral Investigations, 26(8), 3987–3998. https://doi.org/10.1007/s00784-021-04365-x

Chowdhury, N. I., Smith, T. L., Chandra, R. K., & Turner, J. H. (2019). Automated classification of osteomeatal complex inflammation on computed tomography using convolutional neural networks. International Forum of Allergy & Rhinology, 9(1), 46–52. https://doi.org/10.1002/alr.22196

Huang, R., Nedanoski, A., Fletcher, D. A., Singh, N. P., Schmid, J., Young, P. J., Stow, N., Bi, L., Traini, D., Wong, E. H., Phillips, C., Grunstein, R. R., & Kim, J. (2019). An automated segmentation framework for nasal computational fluid dynamics analysis in computed tomography. Computers in Biology and Medicine, 115, 103505. https://doi.org/10.1016/j.compbiomed.2019.103505