Авторы
Достовалова А.М., Горшенин А.К.
Организации
Федеральный Исследовательский Центр "Информатика и Управление" Российской Академии Наук
Секция
Дистанционное зондирование Земли
Научный руководитель
Горшенин А.К.
Место работы научного руководителя
Федеральный Исследовательский Центр "Информатика и Управление" Российской Академии Наук
Текст тезисов
Решение задачи обнаружения на аэрокосмических снимках Земной поверхности малоразмерных методами глубокого обучения сопряжено с разработкой эффективных методов анализа многомасштабных характеристик изображений. Архитектура нейросетевого квадродерева, ранее предложенная авторами в статье [1], состоящая из базового сверточного кодировщика признаков и графово-сверточной сети, устанавливающей взаимосвязи между отдельными элементами изображения в разных пространственных разрешениях, продемонстрировала эффективность при сегментировании малоразмерных объектов, таких как поселения или корабли. В докладе представлено обобщение данного подхода, в том числе для возможности обработки изображений высокого разрешения. Для повышения эффективности обработки пространственной информации в суперпиксельном [2] представлении изображения в докладе предложена модификация стандартного слоя графовой свертки с вниманием [3]. Кроме того, для улучшения качества сегментирования объектов размера, близкого к размеру суперпикселя, архитектура была дополнена специальным блоком учета взаимосвязей между элементами суперпикселей. Тестирование предложенного подхода было проведено на открытых наборах изображений, включающих в себя радиолокационные изображения кораблей (наборы HRSID и SSDD) и данные съемок беспилотных летательных аппаратов (наборы UAVid и UDD). Предлагаемая вероятностно-информированная графово-сверточная архитектура позволила повысить качество распознавания малых объектов для всех тестовых наборов данных, прежде всего в ситуациях, когда размеры исследуемых объектов близки к величине суперпикселей. В сравнении с базовыми сверточными кодировщиками, в качестве которых использовались сети DeepLabv3, U-Net, PsPNet, средний прирост метрики F1 у предложенной архитектуры по всем рассмотренным наборам данных достигает 18.82 %.
Исследование проводилось c использованием инфраструктуры Центра коллективного пользования <<Высокопроизводительные вычисления и большие данные>> (ЦКП <<Информатика>>) ФИЦ ИУ РАН (г. Москва)..
Литература
[1] Достовалова А.М. Нейросетевое квадродерево и его применение для сегментирования спутниковых изображений // Информатика и ее применения. 2024. Т. 18, № 4, с. 77--85.
[2] Liu X., Li Y., Liu X., Zou H. Dark Spot Detection from SAR Images Based on Superpixel Deeper Graph Convolutional Network // Remote Sensing. 2022. Vol. 14, Iss. 21, Art. 5618.
[3]
Vrahatis A.G., Lazaros K., Kotsiantis S. Graph Attention Networks: A Comprehensive Review of Methods and Applications // Future Internet. 2024; Vol. 16, Iss. 9. Art. 318.
Исследование проводилось c использованием инфраструктуры Центра коллективного пользования <<Высокопроизводительные вычисления и большие данные>> (ЦКП <<Информатика>>) ФИЦ ИУ РАН (г. Москва)..
Литература
[1] Достовалова А.М. Нейросетевое квадродерево и его применение для сегментирования спутниковых изображений // Информатика и ее применения. 2024. Т. 18, № 4, с. 77--85.
[2] Liu X., Li Y., Liu X., Zou H. Dark Spot Detection from SAR Images Based on Superpixel Deeper Graph Convolutional Network // Remote Sensing. 2022. Vol. 14, Iss. 21, Art. 5618.
[3]
Vrahatis A.G., Lazaros K., Kotsiantis S. Graph Attention Networks: A Comprehensive Review of Methods and Applications // Future Internet. 2024; Vol. 16, Iss. 9. Art. 318.