近日,人工智能领域国际顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》(IEEE TPAMI,影响因子:23.6)在线发表了武汉大学遥感信息工程学院张永军教授团队关于大幅面超高分遥感影像桥梁目标检测的最新成果。
论文题为“Learning to Holistically Detect Bridges From Large-Size VHR Remote Sensing Imagery”(基于整体学习的大幅面超高分遥感影像桥梁目标检测)。遥感信息工程学院李彦胜教授为第一作者,张永军教授和硕士生罗俊伟为该论文的通讯作者。
遥感影像桥梁目标检测在灾害救援、交通运输、军事行动等方面具有重要应用价值。众所周知,桥梁目标在尺度和纵横比两个方面都呈现出剧烈的变化。为了保证不同大小桥梁目标的可见性和完整性,大幅面超高分遥感影像一体化桥梁目标检测势在必行。然而,现有遥感影像桥梁检测数据集在数据规模和影像尺寸上不足以支撑上述任务。由于计算设备显存容量的限制,现有基于深度学习的遥感目标检测方法往往需要对原始大幅面图像进行切块处理,极易破坏桥梁目标的完整性。总体来看,大幅面遥感影像桥梁目标检测在数据和方法上都面临着巨大挑战。
在数据建设方面,本文构建了一套面向全球采样的大幅面遥感影像桥梁目标检测数据集GLH-Bridge(含有6000张大幅面超高分遥感影像,人工精细标注接近6万座跨越不同背景的桥梁实例,影像幅面为2048×2048-16384×16384像素,拥有旋转框和水平框两套目标检测标签)。GLH-Bridge数据集为大幅面超高分遥感影像一体化的桥梁目标检测任务提供了有力的数据支撑,GLH-Bridge数据集已经开源https://luo-z13.github.io/GLH-Bridge-page/。
图1 GLH-Bridge数据集地理分布和示例
在方法研究方面,本文创新性提出了HBD-Net:提出一种动态图像金字塔结构,引入跨层特征蒸馏来实现大幅面图像的整图输入和多尺度目标的分治处理。针对极端纵横比桥梁目标检测难题,该研究设计了一种新的形状敏感样本重加权策略来提高其检测精度。HBD-Net能够在有限计算资源(如单张GPU)下处理大幅面图像,完成一体化桥梁目标检测任务。在基于GLH-Bridge数据集构建的水平框和旋转框检测实验任务上,HBD-Net显著优于现有方法,在大型桥梁检测方面体现了绝对优势。
图2 HBD-Net结构示意图
图3 本文方法与现有方法在旋转目标检测上的对比结果
以上工作得到国家自科基金、华为学术合作项目、武汉大学超算中心的支持。
论文链接: https://ieeexplore.ieee.org/document/10509806