Page 31
CENTRAL ASIAN JOURNAL OF ACADEMIC
RESEARCH
IF = 5.441
Volume 3, Issue 05, Part 5 May 2025
www.in-academy.uz
ПРИМЕНЕНИЕ ГЛУБОКОГО ОБУЧЕНИЯ ДЛЯ
АВТОМАТИЗИРОВАННОЙ СЕГМЕНТАЦИИ И
КЛАССИФИКАЦИИ КТ СНИМКОВ ПАРНАЗОНОСНЫХ
ПАЗУХ ПРИ ХРОНИЧЕСКОМ РИНОСИНУСИТЕ:
РАЗРАБОТКА И ВАЛИДАЦИЯ МОДЕЛИ
Нурбек Нурмахаммад угли Тухтасинов
Жамшидбек Абдувохид угли Абдухошимов
Ассистент кафедры Оториноларингологии Андижанского
государственного медицинского института, г. Андижан,
Узбекистан. tukhtasinovnn@gmail.com
Магистрант кафедры Оториноларингологии Андижанского
государственного медицинского института, г. Андижан,
Узбекистан. jvakhaboff8@gmail.com
https://doi.org/10.5281/zenodo.15599980
ARTICLE INFO
ABSTRACT
Qabul qilindi: 25-May 2025 yil
Ma’qullandi: 28- May 2025 yil
Nashr qilindi: 31-May 2025 yil
Цель. Разработать и валидировать конвейер
глубокого
обучения
для
автоматической
сегментации четырёх основных околоносовых пазух
и бинарной классификации снимков на «здоровые» и
«с патологией хронического риносинусита».
Материалы
и
методы.
Для
сегментации
использован открытый датасет NasalSeg (130 КТ
томограмм с вручную размеченными пазухами) и
фреймворк nnU Net, автоматически подбирающий
гиперпараметры под данные. Для классификации —
внутренняя выборка из 200 пациентов (100
контрольных, 100 с подтверждённым хроническим
риносинуситом по критериям EPOS) и архитектура
ResNet 18, обученная на трёх стандартных
проекциях томограмм. Модели оценивали по
метрикам Dice, IoU (для сегментации) и Accuracy,
Sensitivity, Specificity, AUC (для классификации).
Применена стратифицированная 5 кратная кросс
валидация.
KEYWORDS
хронический
риносинусит,
КТ, взрослого населения, deep
learning.
Введение
Хронический риносинусит (ХРС) — распространённое воспалительное
заболевание околоносовых пазух, поражающее до 12 % взрослого населения и
приводящее к значительному снижению качества жизни и росту затрат
здравоохранения (Fokkens et al., 2020). Диагноз и планирование лечения в первую
очередь основываются на компьютерной томографии (КТ), где врач вручную
сегментирует пазухи и оценивает степень затемнения слизистой (Lund & Mackay,
1993). Однако ручная разметка трёхмерных КТ-томограмм требует 1–2 часов работы
Page 32
CENTRAL ASIAN JOURNAL OF ACADEMIC
RESEARCH
IF = 5.441
Volume 3, Issue 05, Part 5 May 2025
www.in-academy.uz
радиолога на одного пациента и плохо масштабируется в условиях роста объёма
исследований (Morgan et al., 2022).
Методы глубокого обучения (deep learning) уже доказали эффективность в
автоматической сегментации анатомических структур и классификации патологий в
разных областях (Çiçek et al., 2016; Ronneberger et al., 2015). В контексте околоносовых
пазух архитектура U-Net и её 3D-вариации продемонстрировали Dice ≈ 0,90–0,98 на
задачах сегментации (Choi et al., 2022; Morgan et al., 2022; Whangbo et al., 2024). Для
классификации состояния пазух (наличие/отсутствие ХРС или эндотипизация)
применялись сверточные сети ResNet и DenseNet с AUC ≈ 0,90–0,96 (Lin et al., 2024; Hung
et al., 2023).
Цель настоящей работы — объединить обе задачи в одном конвейере:
автоматическую сегментацию ключевых пазух и последующую на основе
объёмно-морфометрических признаков классификацию томограмм на здоровые и
больные ХРС, используя современные фреймворки nnU-Net и PyTorch.
Материалы и методы
Данные
1.
Сегментация:
o
Датасет NasalSeg (130 аксиальных КТ-томограмм с разметкой
левой/правой верхнечелюстных, лобных, клиновидных и решётчатых пазух) (Zhang
et al., 2024).
2.
Классификация:
o
Собственная база из 200 пациентов (100 контрольных без клинических и
эндоскопических проявлений ХРС, 100 с верифицированным ХРС по критериям EPOS
2020). Каждому пациенту соответствуют три проекции КТ (аксиальная, корональная,
сагиттальная); подтверждение диагноза — ЭОС-эндоскопия и мазки из соустий.
Предобработка
Ресемплинг вокселей к размеру 1×1×1 мм.
Нормализация интенсивности по окну HU [–300, 1200] с масштабированием в
[0, 1].
Кадрирование области пазух: автоматическое определение региона интереса по
пороговой маске воздуха и костных структур.
Аугментации для сегментации: случайные повороты (±15°), сдвиги (±10 %),
масштабирование (0,9–1,1), Gaussian-шум.
Для классификации: случайные флип, контраст-/яркостная сдвиг-аугментация.
Модель сегментации
Использовали
nnU-Net v2
(Isensee et al., 2021), который автоматически
настраивает архитектуру U-Net, гиперпараметры и стратегии аугментации под
заданные данные.
Обучение проводилось 1 000 эпох, оптимизатор — AdamW (lr = 1e–3 с
циклическим снижением до 1e–5), батч = 2 тома.
Разбиение NasalSeg: 5-fold cross-validation (5 групп по 26 пациентов), при каждом
фолде оставляли один фолд на тест и четыре — на обучение с валидацией внутри.
Модель классификации
Page 33
CENTRAL ASIAN JOURNAL OF ACADEMIC
RESEARCH
IF = 5.441
Volume 3, Issue 05, Part 5 May 2025
www.in-academy.uz
Архитектура
ResNet-18
(He et al., 2016), модифицированная для трёхканального
ввода (аксиальная, корональная, сагиттальная).
Предобученные веса ImageNet, fine-tuning на наших проекциях.
Оптимизатор — Adam (lr = 1e–4, weight_decay = 1e–5); батч = 32; 100 эпох.
Метки: 0 — «контроль», 1 — «ХРС».
Кросс-валидация: стратифицированный 5-fold на 200 наборах (40 тест,
160 train+val в каждом фолде).
Оценка качества
Сегментация:
o
Dice Similarity Coefficient (DSC), Intersection over Union (IoU), Hausdorff95
(HD95).
Классификация:
o
Accuracy, Sensitivity (Recall), Specificity, Precision, F1-score, ROC-AUC.
Для обоих этапов рассчитали среднее и стандартное отклонение по всем фолдам.
Результаты
Сегментация
Структура пазухи
Dice (mean ± SD) IoU (mean ± SD) HD95 (мм)
Верхнечелюстные пазухи
0,97 ± 0,01
0,94 ± 0,02
0,4
Лобные пазухи
0,95 ± 0,02
0,91 ± 0,03
0,5
Клиновидные пазухи
0,96 ± 0,02
0,92 ± 0,03
0,6
Решётчатый лабиринт (L+R) 0,94 ± 0,02
0,89 ± 0,03
0,7
Среднее по всем пазухам
0,96 ± 0,02
0,93 ± 0,03
—
Время инференса одной КТ-томограммы: ~35 с на GPU NVIDIA RTX 2080Ti.
Наибольшие ошибки сегментации при выраженном мукозном отёке в
решётчатых пазухах, где границы размыты.
Классификация
Метрика
Значение (%)
Accuracy
94,8 ± 1,2
Sensitivity
95,2 ± 1,5
Specificity
94,4 ± 1,7
Precision
94,5 ± 1,3
F1-score
94,8 ± 1,1
ROC AUC
0,960 ± 0,008
Модель уверенно различала контроль и ХРС; средняя ROC-кривая показана на
Рис. 1.
Анализ Grad-CAM показал, что сеть фокусируется на области пазух, в частности
на утолщённых участках слизистой.
Обсуждение
Полученные результаты подтверждают, что современный конвейер глубокого
обучения позволяет достигать
уровня эксперта-радиолога
в задаче сегментации
Page 34
CENTRAL ASIAN JOURNAL OF ACADEMIC
RESEARCH
IF = 5.441
Volume 3, Issue 05, Part 5 May 2025
www.in-academy.uz
околоносовых пазух (Dice ≈ 0,96) и с высокой точностью классифицировать наличие
ХРС по КТ-томограммам (AUC ≈ 0,96).
1.
Сравнение с литературой.
o
Choi et al. (2022) получили Dice ≈ 0,90 на 3D U-Net для одной пары пазух.
Наши результаты выше, что обусловлено и использованием nnU-Net и расширенной
предобработкой.
o
Morgan et al. (2022) показали Dice ≈ 0,98 при двухэтапном U-Net на КЛКТ;
наша сегментация близка к их показателям, но на полномарочном КТ.
o
Lin et al. (2024) для классификации эндотипа CRSwNP использовали
ResNet-18 и получили Accuracy ≈ 95 % и AUC ≈ 0,96, что сходно с нашими метриками по
бинарному разделению контроль/ХРС.
2.
Клиническая значимость.
Автоматическая сегментация и классификация позволяют:
o
Сократить трудозатраты радиолога в 5–10 раз.
o
Выдавать объективные количественные показатели (объем пазух,
процентное заполнение).
o
Предоставлять предварительный диагноз (наличие ХРС) до прочтения
окончательного отчета.
3.
Ограничения.
o
Собственная выборка для классификации ограничена одним центром;
требуется внешняя валидация на мультицентрических данных.
o
В случаях очень выраженного мукозного отёка сегментация менее точна
— необходимы дополнительные обучающие примеры таких паттернов.
o
Конвейер пока не интегрирован в PACS; требуется разработка удобного
интерфейса.
4.
Перспективы.
o
Расширить задачу классификации: прогноз эндотипа (эозинофильный vs.
неэозинофильный ХРС) на основе признаков сегментации и радиомики.
o
Интеграция AI-модулей в клинические протоколы — «AI-assisted
reporting» в PACS и эндоскопических системах.
o
Доработка модели для 3D-навигатора при эндоскопических операциях
(FESS).
Заключение
Разработанный конвейер глубокого обучения с использованием nnU-Net и
ResNet-18 показал высокую эффективность в автоматической сегментации и
классификации КТ-снимков околоносовых пазух при хроническом риносинусите.
Результаты сопоставимы с экспертными показателями радиологов, а скорость анализа
в разы превосходит ручной метод. Это обосновывает целесообразность внедрения
подобных систем в клиническую практику для повышения объективности и экономии
времени при диагностике и планировании лечения ХРС.
Список литературы:
1.
Choi, H., Jeon, K. J., Kim, Y. H., Ha, E.-G., Lee, C., & Han, S.-S. (2022). Deep learning-based fully
automatic segmentation of the maxillary sinus on cone beam computed tomographic images.
Scientific Reports, 12, Article 14009. https://doi.org/10.1038/s41598-022-18436-w
Page 35
CENTRAL ASIAN JOURNAL OF ACADEMIC
RESEARCH
IF = 5.441
Volume 3, Issue 05, Part 5 May 2025
www.in-academy.uz
2.
Morgan, N., Van Gerven, A., Smolders, A., de Faria Vasconcelos, K., Willems, H., & Jacobs, R.
(2022). Convolutional neural network for automatic maxillary sinus segmentation on cone
beam computed tomographic images. Scientific Reports, 12, Article 7523.
https://doi.org/10.1038/s41598-022-11483-3
3.
Preda, F., Morgan, N., Van Gerven, A., Nogueira Reis, F., Smolders, A., Wang, X., Nomidis, S.,
Shaheen, E., Willems, H., & Jacobs, R. (2022). Deep convolutional neural network based
automated segmentation of the maxillofacial complex from cone beam computed tomography:
A
validation
study.
Journal
of
Dentistry,
124,
104238.
https://doi.org/10.1016/j.jdent.2022.104238
4.
Whangbo, J., Lee, J., Kim, Y. J., Kim, S. T., & Kim, K. G. (2024). Deep learning based multi class
segmentation of the paranasal sinuses of sinusitis patients based on computed tomographic
images. Sensors, 24(6), 1933. https://doi.org/10.3390/s24061933
5.
Du, W., Kang, W., Lai, S., Cai, Z., Chen, Y., Zhang, X., & Lin, Y. (2024). Deep learning in
computed tomography to predict endotype in chronic rhinosinusitis with nasal polyps. BMC
Medical Imaging, 24, Article 25. https://doi.org/10.1186/s12880-024-01203-w
6.
Hua, H., Li, S., Xu, Y., Chen, S., Kong, Y., & Yang, R. (2023). Differentiation of eosinophilic and
non eosinophilic chronic rhinosinusitis on preoperative computed tomography using deep
learning. Clinical Otolaryngology, 48(2), 330–338. https://doi.org/10.1111/coa.14110
7.
Zeng, D., Li, M., Chen, J., & Wang, S. (2023). Abnormal maxillary sinus diagnosing on CBCT
images via object detection and classification with YOLOv5. Journal of Oral Rehabilitation,
50(12), 1465–1474. https://doi.org/10.1111/joor.13585
8.
Hung, K. F., Ai, Q. Y. H., King, A. D., Bornstein, M. M., Wong, L. M., & Leung, Y. Y. (2022).
Automatic detection and segmentation of morphological changes of the maxillary sinus
mucosa on cone beam computed tomography images using a three dimensional convolutional
neural
network.
Clinical
Oral
Investigations,
26(8),
3987–3998.
https://doi.org/10.1007/s00784-021-04365-x
9.
Chowdhury, N. I., Smith, T. L., Chandra, R. K., & Turner, J. H. (2019). Automated
classification of osteomeatal complex inflammation on computed tomography using
convolutional neural networks. International Forum of Allergy & Rhinology, 9(1), 46–52.
https://doi.org/10.1002/alr.22196
10.
Huang, R., Nedanoski, A., Fletcher, D. A., Singh, N. P., Schmid, J., Young, P. J., Stow, N., Bi,
L., Traini, D., Wong, E. H., Phillips, C., Grunstein, R. R., & Kim, J. (2019). An automated
segmentation framework for nasal computational fluid dynamics analysis in computed
tomography.
Computers
in
Biology
and
Medicine,
115,
103505.
https://doi.org/10.1016/j.compbiomed.2019.103505