Yolo（1）Yolo v1

作者：我家自动化 | 2024-03-16 10:31:01

踩

Yolo（1）Yolo v1

一、基础理论

一、基础理论

步骤1：生成备选框。

步骤2：从备选框中找出物体边框。

根据像素的突变，进行图像分割，分出不同物体，画出不同颜色的区域，得到备选框（proposal）。我们需要寻找的物体也在备选框中，我们需要把它从备选框中找出来。

优缺点

二、过程

1、对每张图像打格

图像打格过程中，物体中心落在哪个格子，那个格子就负责预测哪个物体。

：预测框。（Yolo v1预测2个边框，多预测几个边框，留下最好的那个）

：置信度（判断是否靠谱）（考虑两方面：(1)是某物体的概率；(2)重合的比例）)

：是某物体的概率。（最后结果在0~1之间）

：交并比（重合部分越高，交并比越大）

得到的Bounding Box五维数据：x、y、w、h、confidence。（横、纵坐标、宽、高、置信度）

（B不一定得是2）

以上的五个数据分别为：width * height * (5维 * Box数量B + Confidence)

2、损失函数

由于上面有3个物体，所以获取3个中心：

2-1、损失函数介绍

损失函数：坐标损失（Coordinate loss）、置信度损失（Confidence loss）、分类损失（Classification loss）。

上述4个式子分别计算：坐标、大小、物体、背景、分类概率的loss。

（这里）误差 = 预测 - 真实

2-2、参数介绍

（IoU：交并比）

object：学习物体：

no object：学习背景：

2-3、注意事项

注：

1、(2)式用根号压缩物体的原因：

        小物体和大物体的差距过大，尽可能压缩减小差距。（不压缩的话，loss会被大物体严重影响）

2、(4)式noobject（背景）原因：

        增强泛化能力。除了要学习物体的信息，我们还需要学习背景信息（有时候背景中可能有和原物体比较像的物体，但不是原物体，为了加以区分）（学习非物体的东西，提高泛化能力）。

3、(4)式加 $\lambda$ 的原因：

        为了减小背景的权重，因为背景通常更大，实际物体更小，所以背景会产生更多的损失。这样会导致网络去学习产生大loss的因素，即侧重于学习背景，而忽略掉学习物体的特征，这不是我们想要的。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/我家自动化/article/detail/248890