赞
踩
论文:"You Only Look Once:Unified, Real-Time Object Detection"
论文地址:https://arxiv.org/abs/1506.02640
利用整张图作为网络的输入,直接在输出层回归 bounding box 的位置和 bounding box 的类别。
YOLO-V1输入图像默认尺寸为 。利用卷积神经网络进行特征提取,输出图像的尺寸固定为,然后经过卷积层和全连接层,输出特征图大小为,这里30是和检测的类别数量有关系。
实际操作:YOLO-V1将输入图像划分为的区域,见上图左侧所示,每一个区域对应于最后特征图上的一个点,该点的通道数为30(和检测类别数量有关)。YOLO-V1在每一个区域内预测两个 bounding box,见上图左侧的预测框A和预测框B。这样整张图一共预测个框。如果一个物体的中心点落在了某个区域内
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。