赞
踩
Yolo V1的核心思想就是:One cell will be responsible for predicting an object as long as an object’s center locating in that cell.翻译为中文:只要物体落在哪个格子(cell)中,那么那个格子(cell)将会预测这个物体。如图:
因为一个格子(cell)只能预测一个物体,如果2个物体的中心点落在同一个格子(cell)内,那这2个物体就不能被同时预测。
Each cell predicts B bounding box with a confidence,翻译为:每个格子预测B个有置信度的边界框。
如上图第一行是边界框的中心。
第二行是边界框的置信度,包括两个部分,其中 P r ( o b j e c t ) P_{r}(object) Pr(object)表示预测的是不是物体,预测值在 0~1 之间, I o U p r d t r u t h IoU^{truth}_{prd} IoUprdtruth表示预测物体的置信度,即预测的准不准,预测值也在 0~1 之间,所以总体的置信度都在0~1之间;需要注意的是网络预测的是置信度,不预测具体的 P r ( o b j e c t ) P_{r}(object) Pr(object)、 I o U p r d t r u t h IoU^{truth}_{prd} IoUprdtruth。
第三行是网络预测的最终输出结果,从这里可以看出,一个格子预测的B个边界框都是属于同一个种类。
YoloV1的Loss由3部分组成,包括中心点的Loss,置信度的Loss,类别的Loss
关于 I i j o b j \mathbb{I}^{obj}_{ij} Iijobj,原论文是这样解释的:we have B predictions in each cell, only the one with largest IoU shall be labeled as 1。
x
,
y
x, y
x,y:predicated bbox center,
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。