赞
踩
1、RCNN
RCNN是用于目标检测的经典方法,其核心思想是将目标检测任务分解为两个主要步骤:候选区域生成和目标分类。
2、Fast R-CNN(Fast Region-based Convolutional Neural Network)
Fast R-CNN是在RCNN和Selective Search基础上提出的改进方法,主要创新是将整个目标检测流程集成到一个卷积神经网络(CNN)种,从而显著提高了速度和性能。
3、Faster R-CNN(Faster Region-based Convolutional Neural Network)
Faster R-CNN 进一步改进了 Fast R-CNN,将目标检测模型的速度提高到了一个新的水平,同时保持了很高的准确性。
计算机视觉领域,目标检测是一个十分重要的研究主题, 广泛应用在人脸识别、车牌识别、安防、智慧交通、自动驾驶等领域。主要经典算法有:YOLO
1、YOLOv1
以往的二阶段检测算法,如Faster-RCNN,在检测时需要经过两步:边框回归和softmax分类。由于大量预选框的生成,该方法检测精度较高,但实时性较差。YOLO之父Joseph Redmon提出了通过直接回归的方式获取目标检测的具体位置信息和类别分类信息。极大的降低了计算量,显著提升了检测的速度。达到了45FPS(Fast YOLO版本达到了155FPS)。
2、YOLOv2
与YOLOv1相比,v2做了三点改变①更换骨干网络;②引入PassThrough;③借鉴了二阶段检测的思想,添加了预选框。
3、YOLOv3
针对YOLOv2的问题,YOLOv3引入了残差网络模块。①再darknet19的基础上推陈出新,引入残差,并加深网络深度,提出了Darknet53;②借鉴了金字塔的思想,在三个不同的尺寸上分别进行预测。
其中, 52×52 大小的特征图负责检测小目标, 26×26大小的特征图负责检测中目标, 13×13大小的特征图负责检测大目标。下图中,黄色表示目标框真值,蓝色表示3个预选框。
在训练之前,预先通过聚类的方式生成小,中,大三个尺寸的预选框,共9个。预测时最终会输出
3x(20+1+4)的数据。一个目标框的输出数据如下:
4、YOLOv4
Alexey Bochkovskiy大神对YOLOv3进行了升级改造,核心思想与之前基本一致,不过从数据处理、主干网络、网络训练、激活函数、损失函数等方面对子结构进行了大量的改进。
5、YOLOv5
YOLOv5版本 UltralyticsLLC 公司推出的,是在YOLOv4的基础上做了少许的修补,①将v4版本骨干网络中的CSP结构拓展到NECK结构中。②增加了FOCUS操作,但是后续6.1版本又剔除掉了该操作,使用一个6x6的卷积进行了替代。③使用SPPF结构代替SPP。
6、Yolov6
YOLOv6是由美团推出的,所作的主要工作是为了更加适应GPU设备,将2021年RepVGG结构引入到了YOLO。
7、Yolov7
YOLOv7是YOLO4团队的续作,主要是针对模型结构重参化和动态标签分配问题进行了优化。
技巧4: 引入了辅助训练模块-coarse-to-fine(由粗到细)引导标签分配策略,常用的方式是图(c)所示,即辅助头和引导头各自独立,分别利用ground truth和它们(辅助头、引导头)各自的预测结果实现标签分配。YOLOV7算法中提出了利用引导头的预测结果作为指导,生成从粗到细的层次标签,将这些层次标签分别用于辅助头和引导头的学习,如下图(d)和(e)所示。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。