基于改进YOLOv4的目标检测算法

(整期优先)网络出版时间:2022-05-10
/ 2

基于 改进 YOLOv4的目标检测算法

王超

郑州机电工程研究所 河南郑州 450015

摘要:随着深度学习的不断进步,已经将应用延伸到光电跟踪设备,优质的检测跟踪算法决定光电跟踪设备的工作效率。本文提出一种改进YOLOv4的检测跟踪算法,结合空洞卷积对其网络结构进行改进,加入空洞空间金字塔池化模型,以此增大感受野,聚合多尺度上下文信息。然后,通过 K-means聚类方法生成更适合目标检测的初始候选框。其次,提出一种对象选择器,用来选择检测和跟踪轨迹中的最优候选框;最后,将最优候选框和跟踪轨

迹进行数据关联判断是否对跟踪轨迹进行更新。实验结果表明,联合检测的目标跟踪方法与其他几种已经成型算法对比平均准确率和精确率都有大幅度提高。同时该方法在面对环境变化、类别变化、光照强度、遮挡等复杂情况下仍然具有很好的鲁棒性。

  1. 引言

目前,YOLO系列的检测跟踪算法已经运用到生活的各个物品检测当中。穆思奇等[1]采用结合Mosaic数据增强的YOLOv4的X射线图像违禁品检测算法;管军霖等[2]提出一种基于图片高低频成分融合与YOLOv4卷积神经网络的口罩佩戴检测方法;蒋镕圻等[3]为解决目标检测任务中小目标检测精度低,错检、漏检率高等问题,提出一种scSE-IYOLOv4的改进YOLOv4的小目标检测算法;侯涛等[4]针对遥感图像中飞机目标检测精度低、检测速度慢、背景复杂等问题,提出了一种基于深度学习的改进YOLOv4目标检测算法;牟效乾[5]等针对强海杂波与海面目标的复杂特性使得海面目标回波微弱,通过模型的预训练和平面位置显示器(PPI)图像的帧间积累对INet进行了优化,得到了Optimized INet(O-INet)模型。经过多种天气条件下实测数据测试和验证,并与YOLOv3, YOLOv4,双参数CFAR和二维CA-CFAR对比后证明,所提方法在提高检测概率、降低虚警率和复杂条件下的强泛化能力有显著优势。基于YOLO的目标检测跟踪,虽然取得了一些研究成果和应用,但仍然存在动态适应性不足、不能在恶劣环境准确识别出物体及目标检测算法精度低、实时性差等问题。

本文在YOLOv4的基础上,结合空洞卷积对其网络结构进行改进,加入空洞空间金字塔池化模型,称为YOLOv4-M模型,以此增大感受野,聚合多尺度上下文信息,同时利用迁移学习训练网络,大大提高了目标的检测精度。

2.YOLOv4-M检测模型

本文构建的YOLOv4-M模型包括模型预训练、网络结构、锚框选择3个部分。

(1)引入迁移学习,利用公开的VOC数据集对YOLOv4网络进行预训练,将训练好的参数迁移到本文构建的YOLOv4-M模型进行微调。与正常卷积神将网络训练中的随机初始化不同,将预先训练的网络权重值作为初始化参数加载,可以有效加速收敛并提高检测性能。

(2)采用具有高性能和强稳定性的YOLOv4作为基本检测模型,结合上下文信息对于检测目标的重要性,将原网络中的空间金字塔池化改进为空洞空间金字塔池化,构建 YOLOv4-M检测网络。通过使用不同扩张率的空洞卷积实现不同尺度的最大值池化,在增大感受野的同时有效融合多尺度的上下文信息,增强模型对静止尺度变化的鲁棒性。

(3)根据目标的尺度分布特点重新设计了初始锚框。使用K-means聚类算法对静止目标的尺度进行聚类的结果作为初始锚框,使得网络候选框的初始化尺寸更加贴合静止目标。另外,在训练过程中采用学习率余弦退火衰减策略,实现模型训练过程的优化。

结合金字塔模型改进的YOLOv4框架如图1所示,其中金字塔模型采用扩张率r分别为1、3、5且卷积核为3×3的空洞卷积,在前一层的局部特征上关联到更广的视野,防止小目标特征在信息传递时丢失。

627a14a0d4a5e_html_37c6192d4daf3ede.png

图1 改进的YOLOv4框架

图1中,金字塔模型将输入的特征同时输出到5个支路中,第1 个支路是一个1×1的卷积,目的是保持原始的感受野;第2~4支路是不同扩张率的空洞卷积,并且包含BN层,目的是对特征进行提取,获得不同的感受野,最后的特征图能够融合不同尺度的信息;第5个支路的目的是获取全局特征,将特征做全局平均化池化后,经过1×1卷积和归一化处理,再进行上采样。本文模型通过金字塔模型池化可以学习到不同尺寸目标的特征,降低目标的漏检率。

3 实验与分析

算法实现平台:Ubuntu18.04TLS操作系统,YOLOv4在训练前需对配置文件相关参数进行设置,将批处理尺寸设置为64,最大迭代次数设置为6000,动量设置为0.940,学习率设置为0.001,衰减次数设置为最大迭代次数的80%和90%。

为验证改进后的算法与原始算法的对比效果,本文以相同数据分别使用YOLOv3、YOLOv4、YOLOv4-M进行模型训练和测试,在相同测试机下对比。精度评估分析如图4

所示,其中,平均准确率为所有类别准确率的平均值,准确率是指在所有判断中有多少判断准确;精确率表示预测为正的样本中有多少是对的。从图4中可以看,YOLOv4-M曲线整体呈上升趋势且高于YOLOv3、YOLOv4算法。YOLOv4-M模型检测结果相较 YOLOv3、YOLOv4在0.5阈值下、0.75阈值下及整体的准确率都有所提高,AP0.5从53.43%到88.05%,AP0.75从12.36%到60.55%,AP由80%提高到91%,实时速度达到30FPS,可以实现光电设备的实时目标检测。

627a14a0d4a5e_html_28b5613ddcfa0b45.png627a14a0d4a5e_html_aaf6f269aebc6a90.png

图4 平均准确率以及精确率

5 总 结

建立YOLOv4-M目标检测模型进行目标的感知检测。针对室内环境构建目标检测数据集,并进行数据增强处理,利用Kmeans聚类对自制数据集进行数据集先验框的优化设计,通过增加检测层,建立YOLOv4-M目标检测模型进行训练测试,结合对象选择器,在跟踪过程中不断与最有候选框进行对比,以达到解决跟踪漂移的问题,试验结果证明该算法在AP0.5阈值下可达到88.05%,实时速度为30FPS,有效提升了实时目标检测的精度;

参考文献

[1] 穆思奇,林进健,汪海泉,魏雄志.基于改进YOLOv4的X射线图像违禁品检测算法[J].兵工学报,2021,42(12):2675-2683.

[2] 管军霖,智鑫.基于YOLOv4卷积神经网络的口罩佩戴检测方法[J].现代信息科技,2020,4(11):9-12.DOI:10.19850/j.cnki.2096-4706.2020.11.002.

[3] 蒋镕圻,彭月平,谢文宣,谢郭蓉.嵌入scSE模块的改进YOLOv4小目标检测算法[J].图学学报,2021,42(04):546-555.

[4] 侯涛,蒋瑜.改进YOLOv4在遥感飞机目标检测中的应用研究[J].计算机工程与应用,2021,57(12):224-230.

[5] 牟效乾,陈小龙,关键,周伟,刘宁波,董云龙.基于INet的雷达图像杂波抑制和目标检测方法[J].雷达学报,2020,9(04):640-653.










作者简介:王超,(1988-12),男,汉族,河南郑州人,郑州机电工程研究所,硕士学历,研究方向:图像处理与识别