YOLO系列算法改进 | C3k2改进篇 | 融合MambaOut轻量化门控架构 | 纯卷积实现超越Mamba性能的同时兼顾极致轻量化与边缘部署效率 | CVPR 2025

张开发
2026/4/21 13:21:15 15 分钟阅读
YOLO系列算法改进 | C3k2改进篇 | 融合MambaOut轻量化门控架构 | 纯卷积实现超越Mamba性能的同时兼顾极致轻量化与边缘部署效率 | CVPR 2025
0. 前言本文介绍MambaOut轻量化门控卷积模块,并将其集成到Ultralytics最新发布的YOLOv26目标检测算法中,构建C3k2_MambaOut创新模块。MambaOut由新加坡国立大学团队提出,通过移除Mamba架构中的核心令牌混合器SSM(状态空间模型),仅保留高效的门控CNN结构,旨在验证视觉任务中Mamba架构的必要性问题。将MambaOut嵌入YOLOv26的C3k2模块中,能够在ImageNet图像分类任务中超越包含SSM的视觉Mamba模型,同时凭借其纯卷积架构在边缘设备上实现更低的推理延迟与更高的硬件友好性,尤其适用于高分辨率航拍图像中的密集小目标检测、电网巡检中的微小缺陷识别、以及移动端实时检测等对轻量化与部署效率有严苛要求的场景,在保持检测精度的同时显著提升端侧推理吞吐量并降低内存占用。专栏链接:YOLO系列算法改进专栏链接专栏文章:YOLO26改进系列 | 卷积篇、轻量化、注意力、损失函数、Backbone、SPPF、C2PSA、Neck、检测头全方面保姆级优化合集 | 同样适配YOLOv11改进!!!目录0. 前言1.MambaOut模块简介2.MambaOut模块原理与创新点🧠MambaOut模块基本原理🎯 MambaOut模块创新点3.具体改进步骤🍀🍀步骤1:创建C3k2_MambaOut.py文件🍀🍀步骤2:tasks.py文件修改🍀🍀步骤3:创建YAML配置文件🍀🍀步骤4:新建train.py文件训练模型🍀🍀步骤5:模型结构打印结果1.MambaOut模块简介Mamba是一种具有RNN式令牌混合器的架构,其核心是状态空间模型(SSM),最近被提出用于解决注意力机制的二次复杂度问题,并随后被应用于视觉任务。然而,与基于卷积和注意力的模型相比,Mamba在视觉任务中的表现往往不尽如人意。本文深入探讨了Mamba的本质,从概念上得出结论:Mamba非常适合具有长序列和自回归特性的任务。对于视觉任务而言,由于ImageNet上的图像分类不符合上述任一特性,我们假设该任务不需要Mamba;COCO或ADE20K上的检测和分割任务虽然也不是自回归的,但它们具有长序列特性,因此我们认为探索Mamba在这些任务中的潜力仍然值得。为了实证验证我们的假设,我们通过堆叠Mamba模块并移除其核心令牌混合器SSM,构建了一系列名为MambaOut的模型。实验结果有力地支持了我们的假设。具体而言,我们的MambaOut模型在ImageNet图像分类上超越了所有视觉Mamba模型,表明Mamba确实对该任务是不必要的。至于检测和分割任务,MambaOut无法达到最先进的视觉Mamba模型的性能,这证明了Mamba在长序列视觉任务中的潜力。

更多文章