0. 前言
本文介绍2025 TGRS最新提出的频率-空间卷积(frequency–spatial convolution,FSConv),并集成到ultralytics最新发布的YOLO26目标检测算法中,改进Backbone或Neck特征提取部分。现有动态卷积工作仅赋予卷积核一个维度动态属性,而ODConv利用新颖的多维注意力机制和并行策略,在卷积核空间的四个维度学习互补注意力。它可作为常规卷积的替代品插入多种CNN架构。我们将ODConv集成进YOLO26,在 MS – COCO数据集上的实验表明,ODConv能带来显著的准确性提升,减少额外参数。
专栏链接:YOLO系列算法改进专栏链接
目录
0. 前言
1. FSConv卷积模块简介
2. FSConv卷积基本原理与创新点
🎯 FSConv卷积基本原理
🎯 FSConv卷积创新点
3. 具体改进步骤
🍀🍀步骤1:创建FSConv.py文件
🍀🍀步骤2:tasks.py文件修改
🍀🍀步骤3:创建YAML配置文件
🍀🍀步骤4:新建train.py文件训练模型
🍀🍀步骤5:模型结构打印结果
1. FSConv卷积模块简介
由于极低的信噪比,红外小目标检测仍具挑战性。现有方法难以在精度与速度之间取得平衡,尤其是在计算资源受限的情况下。为解决这些问题,我们提出了基于YOLOv10n架构的频率-空间上下文融合网络。特别地,我们设计了新颖的频率-空间卷积(FSConv),通过哈尔小波变换分解输入特征:高频信息聚焦于局部细节以突出小目标,低频信息则提供全局背景以补充空间特征。此外,我们开发了非对称跨域注意力(ACA) 以增强局部中心特征提取,该机制能反映小目标典型的空间高斯分布模式。进一步,我们引入了定制化的多尺度感受野上下文模块(MRCB),通过多样化的空洞卷积捕获长距离信息。同时,采用Wasserstein距离损失(WDL) 提升边界框质量。在三个公开数据集上的大量实验验证了FSCFNet的有效性。值得注意的是,在IRSTD-1k数据集上,FSCFNet在精度、召回率和AP@50上分别比基线提升4.7%、3.3%和3.9%,而参数量仅增加3.6%。FSCFNet为资源受限环境下的实时红外监视系统提供了稳健的解决方案。更多对比结果见文中。
网硕互联帮助中心




评论前必须登录!
注册