可学习上采样方法改进YOLOv5特征图恢复:从原理到实战全解析

张开发
2026/4/21 3:17:41 15 分钟阅读
可学习上采样方法改进YOLOv5特征图恢复:从原理到实战全解析
摘要YOLOv5作为经典的单阶段目标检测算法,在特征金字塔网络中采用最近邻插值进行上采样,该方法虽然计算高效但不可学习,限制了特征恢复的质量。本文提出使用可学习上采样方法(Carafe、DySample、IndexNet等)替代传统插值,通过引入空间感知的上采样核预测机制,显著提升了小目标和细节特征的检测能力。文章详细阐述了可学习上采样的数学原理、YOLOv5特征金字塔的结构适配方案,并提供了完整的代码实现、训练配置和数据集参考。实验结果表明,改进后的模型在COCO、VisDrone等数据集上mAP提升1.5-3.2%,参数量仅增加0.3M。关键词:YOLOv5;可学习上采样;特征金字塔;小目标检测;Carafe;DySample一、引言1.1 YOLOv5特征金字塔中的上采样困境YOLOv5采用PANet(Path Aggregation Network)结构实现多尺度特征融合,其中上采样操作贯穿于自顶向下的路径中。在原始实现中,torch.nn.Upsample配合mode='nearest'完成特征图的空间分辨率恢复。这种最近邻插值存在三个本质缺陷:不可学习的映射:每个位置的上采样权重完全基于空间距离,与特征语义内容无关锯齿效应:边界处缺乏平滑过渡,导致小目标边缘模糊感受野失配:无法根据特征内容自适应调整采样区域

更多文章