当前位置:   article > 正文

Yolo(1)Yolo v1

Yolo(1)Yolo v1

目录

一、基础理论

优缺点

二、过程

1、对每张图像打格

2、损失函数

2-1、损失函数介绍

2-2、参数介绍 

2-3、注意事项


一、基础理论

步骤1:生成备选框。

步骤2:从备选框中找出物体边框。

  

根据像素的突变,进行图像分割,分出不同物体,画出不同颜色的区域,得到备选框(proposal)我们需要寻找的物体也在备选框中,我们需要把它从备选框中找出来

优缺点

二、过程

1、对每张图像打格

图像打格过程中,物体中心落在哪个格子,那个格子就负责预测哪个物体

 

预测框。(Yolo v1预测2个边框,多预测几个边框,留下最好的那个)

置信度(判断是否靠谱)(考虑两方面:(1)是某物体的概率;(2)重合的比例))

是某物体的概率。 (最后结果在0~1之间) 

交并比重合部分越高,交并比越大) 

得到的Bounding Box五维数据:x、y、w、h、confidence。(横、纵坐标、宽、高、置信度)

 (B不一定得是2)

 以上的五个数据分别为:width * height * (5维 * Box数量B + Confidence)

2、损失函数

由于上面有3个物体,所以获取3个中心:

2-1、损失函数介绍

损失函数坐标损失(Coordinate loss)、置信度损失(Confidence loss)、分类损失(Classification loss)

   

上述4个式子分别计算:坐标、 大小、物体、背景、分类概率的loss

(这里)误差 = 预测 - 真实

2-2、参数介绍 

(IoU:交并比)

 object:学习物体: 

no object:学习背景

2-3、注意事项

注:

1、(2)式用根号压缩物体的原因:

        小物体和大物体的差距过大,尽可能压缩减小差距。(不压缩的话,loss会被大物体严重影响)

2、(4)式noobject(背景)原因:

        增强泛化能力。除了要学习物体的信息,我们还需要学习背景信息(有时候背景中可能有和原物体比较像的物体,但不是原物体,为了加以区分)(学习非物体的东西,提高泛化能力)。

3、(4)式加\lambda的原因:

        为了减小背景的权重,因为背景通常更大,实际物体更小,所以背景会产生更多的损失。这样会导致网络去学习产生大loss的因素,即侧重于学习背景,而忽略掉学习物体的特征,这不是我们想要的。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/248890
推荐阅读
相关标签
  

闽ICP备14008679号