Математики улучшили автоматическое распознавание спутниковых изображений

С помощью современных спутниковых систем можно отслеживать землетресения, извержения вулканов и пожары. Также можно следить за состоянием почв, растительности, рек. Чтобы автоматизировать этот процесс используют алгоритмы распознавания и классификации объектов, которые позволяют компьютеру по набору пикселей понять, что изображено на снимке.

Для этого используют машинное обучение — компьютер «просматривает» тысячи примеров и учится распознавать изображения самостоятельно. Математик РУДН разработал метод обучения с использованием трех алгоритмов для обработки данных из нескольких источников. Он точнее, чем прошлые разработки, может определить, какой вид растений посажен на полях.

Математики использовали данные пяти мини-спутников RapidEye и авиационного радара UAVSAR за 5 и 7 июля 2012 года — они снимали один и тот же участок местности в Канаде. Съемка RapidEye велась в пяти диапазонах светового спектра: синем (B), зеленом (G), красном (R), ближнем инфракрасном (NIR) и области, называемой «красный край» (RE), в которой происходит резкое усиление отражения зелёной растительности. Данные содержали 38 характеристик — спектральные каналы, индексы растительности, текстурные параметры и так далее. Их пространственное разрешение — то есть минимальный размер объекта, различимый на снимках, — около пяти метров. Радиолокационные изображения UAVSAR включали 49 различных характеристик, их пространственное разрешение — около 15 метров.

Полученные снимки сопоставили со справочными данными об этой территории, собранными летом 2012 года. В них выделили семь типов растений — широколиственные растения, рапс, кукуруза, овес, горох, соя и пшеница. Новый алгоритм «обучили» на основе примеров полученных изображений и данных о типе посадок, а затем сравнили его предсказание с результатами работы других программ, устроенных по похожему принципу.

«Наш метод может быть предложен для системы классификации землепользования и растительного покрова с помощью данных, полученных из разных источников. Например, спутников Landsat или Sentinel constellation», — отметил доцент департамента механики и мехатроники РУДН Владимир Разумный.

Новый метод показал более высокую точность распознавания объектов. Если обучение проходило на 5% от всех данных, то новый алгоритм распознавал изображения верно в 65% случаев, против 52-60% у других алгоритмов. С увеличением доли обучающих данных до 50% точность нового алгоритма повышалась до почти 90%, а других — до 75-86%.