近日,李彦胜课题组的点监督有向目标检测论文“PointOBB-v3: Expanding Performance Boundaries of Single Point-Supervised Oriented Object Detection”被人工智能领域顶级期刊《International Journal of Computer Vision》录用。章培源(武汉大学计算机学院本科生)、罗俊伟(武汉大学遥感信息工程学院硕士生)和杨学(上海交通大学自动化与感知学院助理教授)为论文共同第一作者,李彦胜为论文通讯作者。
近年来,以单点监督为代表的弱监督有向目标检测方法因其低成本标注条件下深度网络学习效益而备受关注(如图1所示)。现有点监督有向目标检测方法面临无法支持端到端训练、目标尺度感知能力弱等问题,其性能明显落后于全监督方法。如何缩小点监督方法与全监督方法的目标检测性能差异,提升点监督有向目标检测方法的实用性,是当下国际研究热点。

图1. 不同监督条件下有向目标检测方法对比示意图
论文提出了一种融合三种不同视图(原始视图、缩放视图和旋转视图)的单点监督有向目标检测框架。如图2所示,基于三种不同图像视图,论文创新构建了尺度增强模块和角度获取模块。在第一个模块中,引入了尺度敏感一致性损失和尺度敏感特征融合机制,以提升模型对目标尺度的估计能力。第二个模块则采用了基于对称性的自监督学习方法实现了精确角度预测。总体来说,PointOBB-v3通过整合预测分支可以支持端到端学习模式,提出尺度自适应特征融合方法,引入实例级感知加权策略来消除低质量伪标签的影响,可以有效提升点监督条件下有向目标检测性能。

图2. 论文提出的有向目标检测方法PointOBB-v3示意图
为了充分说明PointOBB-v3的泛化性及实用性,论文在DIOR-R、DOTA-v1.0/v1.5/v2.0、FAIR1M、STAR和RSAR等7个公开遥感影像目标检测数据集上进行了实验验证与分析。如图3所示,实验结果表明PointOBB-v3在可见光、SAR等不同模态遥感影像数据集上均展现出优越性能,相比现有方法在平均性能上提升3.56%。展望未来,结合预训练遥感大模型,点监督有向目标检测识别技术的性能有望进一步逼近全监督有向目标检测识别,实现在低标注成本条件下高精度有向目标检测识别模型的学习与部署。

图3. PointOBB-v3与现有方法在不同模态数据集上目标检测结果对比示意图
项目链接:https://github.com/VisionXLab/PointOBB-v3
论文链接:https://link.springer.com/article/10.1007/s11263-025-02486-4