Представители НОШ «Мозг, когнитивные системы, искуственный интеллект» разработали метод увеличения данных для обучения нейросетей, позволяющий повысить точность диагностики туберкулеза по рентгеновским снимкам. Результаты опубликованы в сборнике ISPRS International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences.
Туберкулез остается одной из главных инфекций в мире, ежегодно унося более миллиона жизней. Несмотря на успехи медицины, ранняя диагностика по-прежнему затруднена, особенно в регионах, где не хватает квалифицированных рентгенологов. Современные алгоритмы машинного обучения могут помогать врачам в распознавании болезни по снимкам грудной клетки, однако их качество сильно зависит от объема и качества данных для обучения.
Коллектив студентов и сотрудников МГУ – Сенотова Ю.Д., к.ф.-м.н. Пчелинцев Я.А. и проф. Крылов А.С., предложили использовать алгоритм Fast and Adaptive Bidimensional Empirical Mode Decomposition (FABEMD) для «увеличения данных» — создания новых вариантов рентгеновских изображений путем адаптивного удаления фоновых структур. Этот метод позволяет получить дополнительные снимки, сохраняющие диагностически важные особенности, но разнообразные по структуре, что повышает устойчивость и точность работы нейросетей.
Тестирование проводилось на нескольких открытых международных наборах данных (Montgomery, Shenzhen, TBX11K, Sakha-TB и др.), включающих тысячи рентгеновских снимков. Эксперименты показали, что добавление таких синтетических изображений в обучающие выборки повышает диагностическую точность моделей, особенно на сложных наборах с ограниченным числом данных.
«Мы показали, что использование FABEMD позволяет не только улучшить качество классификации снимков, но и сделать модели более устойчивыми к изменениям качества данных. Это особенно важно в медицинских задачах, где наборы изображений часто ограничены, а их характеристики зависят от оборудования и условий съемки», — подчеркивает Андрей Крылов, профессор кафедры математической физики ВМК МГУ.
Авторы отмечают, что разработанный подход может применяться и в других медицинских задачах анализа изображений, где есть нехватка данных и требуется высокая точность — от диагностики легочных заболеваний до офтальмологии и онкологии.
Источник информации: ВМК МГУ имени М.В. Ломоносова
Источник фото: ru.123rf.com




















