花生_TL007

这个屌丝很懒，什么也没留下！

热门标签

【YOLOv3】在 VOC 上训练 yolov3_yolov3 voc数据集训练

作者：花生_TL007 | 2024-06-16 19:55:14

踩

yolov3 voc数据集训练

训练前的准备工作

下载源代码： YOLOv3 项目源代码
也可以直接输入命令进行下载

git clone https://github.com/pjreddie/darknet
1

终端进入 darknet 文件夹下

cd darknet
1

如果使用 CPU 直接编译源代码，无须修改 Makefile 文件。

如果使用GPU训练，需要修改 Makefile

设置 Makefile 前两行 GPU 和 CUDNN 的配置：

GPU=1
CUDNN=1
1
2

如果调用摄像头，还需要设置

OPENCV=1
1

更改 NVCC 为自己的 CUDA 安装路径：

NVCC=/usr/local/cuda-9.0/bin/nvcc 
1

更改 CUDA 的路径： 在 Makefile 修改自己的 CUDA 安装路径。更改前默认路径为：

ifeq ($(GPU), 1) 
COMMON+= -DGPU -I/usr/local/cuda/include/
CFLAGS+= -DGPU
LDFLAGS+= -L/usr/local/cuda/lib64 -lcuda -lcudart -lcublas -lcurand
endif
1
2
3
4
5

修改后为：

ifeq ($(GPU), 1) 
COMMON+= -DGPU -I/usr/local/cuda-9.0/include/
CFLAGS+= -DGPU
LDFLAGS+= -L/usr/local/cuda-9.0/lib64 -lcuda -lcudart -lcublas -lcurand
endif
1
2
3
4
5

修改 ARCH： 要将 GPU 架构和本机 GPU 型号对应起来，比如 GTX 1080 设置为 61。

# ARCH= -gencode arch=compute_30,code=sm_30 \
#     -gencode arch=compute_35,code=sm_35 \
#     -gencode arch=compute_50,code=[sm_50,compute_50] \
#     -gencode arch=compute_52,code=[sm_52,compute_52]
#      -gencode arch=compute_20,code=[sm_20,sm_21] \ This one is deprecated?

# This is what I use, uncomment if you know your arch and want to specify
 ARCH = -gencode arch=compute_61,code=sm_61
1
2
3
4
5
6
7
8

最后进行编译

sudo make
1

如果出现如下输出，说明已经编译过了且你没有作任何改动。已经有了 libdarknet.a 和 libdarknet.so 文件。

make: Nothing to be done for 'all'.
1

在这里插入图片描述

运行 demo

首先下载权重文件，并运行 demo，测试得到的结果 predictions.jpg 会以图片的形式保存在 darknet 文件夹下

# 下载权重文件
wget https://pjreddie.com/media/files/yolov3.weights

# 测试 dog 图片
./darknet detect cfg/yolov3.cfg yolov3.weights /data/monn/darknet/data/dog.jpg
1
2
3
4
5

最后的 /data/monn/darknet/data/dog.jpg 是要进行测试的图片路径

输出结果：
layer     filters    size              input                output
  0 conv     32  3 x 3 / 1   608 x 608 x   3   ->   608 x 608 x  32  0.639 BFLOPs
  1 conv     64  3 x 3 / 2   608 x 608 x  32   ->   304 x 304 x  64  3.407 BFLOPs
  2 conv     32  1 x 1 / 1   304 x 304 x  64   ->   304 x 304 x  32  0.379 BFLOPs
  3 conv     64  3 x 3 / 1   304 x 304 x  32   ->   304 x 304 x  64  3.407 BFLOPs
  ...
  105 conv    255  1 x 1 / 1    76 x  76 x 256   ->    76 x  76 x 255  0.754 BFLOPs
  106 yolo
Loading weights from yolov3.weights...Done!
/data/monn/darknet/data/dog.jpg: Predicted in 26.420837 seconds.
dog: 100%
truck: 92%
bicycle: 99%
1
2
3
4
5
6
7
8
9
10
11
12
13
14

用 YOLO 训练 VOC 数据集

VOC 数据集下载地址：PASCAL VOC

准备工作

在 darknet 目录下新建 voc 文件夹，终端进入 voc 目录下，执行如下命令，下载 PASCAL VOC 数据集。打算用 2007 和 2012 一起进行训练，所以都要下载哈。

wget https://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar
wget https://pjreddie.com/media/files/VOCtrainval_06-Nov-2007.tar
wget https://pjreddie.com/media/files/VOCtest_06-Nov-2007.tar
1
2
3

或者可以直接下载好以后放在 voc 文件夹下，速度比较快。

下载完成后对数据集进行解压：

tar xf VOCtrainval_11-May-2012.tar
tar xf VOCtrainval_06-Nov-2007.tar
tar xf VOCtest_06-Nov-2007.tar
1
2
3

然后 voc 文件夹下就会出现 VOCdevkit/ 目录：

VOCdevkit 下包含了 VOC 2007 和 2012 两部分：PASCAL VOC 数据集格式见：

为 VOC 数据集生成标签

darknet 要求为图片数据集生成 txt 格式的标签文件，标签文件每行的格式为：

<object-class> <x> <y> <width> <height>
1

其中 x，y，width，deight 分别为图片的位置和宽高。
要生成标签，只需要运行 voc_label.py 即可。

下载 voc_label.py 到 VOCdevkit 同级目录下，并执行 voc_label.py 文件：（其实darknet/scripts/目录下也有voc_lable.py）

wget https://pjreddie.com/media/files/voc_label.py
python voc_label.py
1
2

然后就生成了一些标签文件，在 labels 中：

下面的 txt 文件就是为 VOC 数据集生成的标签文件：
在这里插入图片描述
此时，在 voc 文件夹下你能看到以下文件：

ls
2007_test.txt   VOCdevkit
2007_train.txt  voc_label.py
2007_val.txt    VOCtest_06-Nov-2007.tar
2012_train.txt  VOCtrainval_06-Nov-2007.tar
2012_val.txt    VOCtrainval_11-May-2012.tar
1
2
3
4
5
6

2007_train.txt，2012_train.txt 文件里是训练数据的路径；
2007_test.txt 文件是测试数据的路径；
2007_val.txt 和 2012_val.txt 文件时验证集路径（不过这里把除了测试文件以外全用来训练）；

我们将要训练的是除了 VOC 2007 测试集以外的所有数据集，所以先将它们整合为一个大的训练 list（train.txt）：
接下来执行：

cat 2007_train.txt 2007_val.txt 2012_*.txt > train.txt
1

为 VOC 修改配置文件

修改 cfg/voc.data 文件，将 < path-to-voc > 修改为存放 VOC 数据集的文件目录，比如：/data/monn/darknet/VOC

classes= 20
train  = <path-to-voc>/train.txt
valid  = <path-to-voc>/2007_test.txt
names = data/voc.names
backup = backup
1
2
3
4
5

修改之后：

classes= 20
train  = /data/monn/darknet/VOC/train.txt
valid  = /data/monn/darknet/VOC/2007_test.txt
names = data/voc.names
backup = backup
1
2
3
4
5

修改 cfg/yolov3-voc.cfg 配置文件：

[net]
# Testing
# batch=1
# subdivisions=1
# Training
batch=64  # 每轮迭代抽取 64 张图片
subdivisions=16  # 每轮迭代包含了 16 组
1
2
3
4
5
6
7

下载预训练权重文件

我们要使用在 ImageNet 上预训练的权重数据。进入 darknet 目录下，下载权重文件：

wget https://pjreddie.com/media/files/darknet53.conv.74
1

训练模型

开始训练模型：

./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg darknet53.conv.74
1

测试

训练结束后，将得到的 weights 文件拷贝到 darknet/weights 文件夹下，运行命令以检测图片：

./darknet detector test <data_cfg> <test_cfg> <weights> <image_file>
1

具体地：

# 输出一张检测结果图，显示画出的检测框、类别和置信度
./darknet detector test  cfg/voc.data cfg/yolov3-voc.cfg weights/yolov3.weights data/dog.jpg
1
2

生成预测结果可以参考如下命令：

./darknet detector valid <data_cfg> <test_cfg> <weights> <out_file>
1

<test_cfg>文件中batch和subdivisions两项必须为1
结果生成在 <data_cfg> 的 results 指定的目录下以 <out_file> 开头的若干文件中，若 <data_cfg> 没有指定 results，那么默认为 <darknet_root>/results

遇到的错误

CUDA Error：unknown error

在开始训练后，提示错误：
在这里插入图片描述
这是因为配置文件 Makefile 中配置的 GPU 架构和本机 GPU 型号不一致导致的。

# ARCH= -gencode arch=compute_30,code=sm_30 \
#     -gencode arch=compute_35,code=sm_35 \
#     -gencode arch=compute_50,code=[sm_50,compute_50] \
#     -gencode arch=compute_52,code=[sm_52,compute_52]
#      -gencode arch=compute_20,code=[sm_20,sm_21] \ This one is deprecated?

# This is what I use, uncomment if you know your arch and want to specify
ARCH= -gencode arch=compute_61,code=sm_61
1
2
3
4
5
6
7
8

compute_30 表示显卡的计算能力是 3.0，几款主流 GPU 的 compute capability 列表：

GTX Titan x ： 5.2
GTX 980 ： 5.2
Tesla K80 ： 3.7
Tesla K40 ： 3.5
K4200 ： 3.0

所以 Tesla K80 对应 compute_30，Tesla K40c 对应compute_35，Titan X 对应compute_52，根据自己的GPU型号的计算能力进行配置，例如这里用的 GTX 1080 配置为：

ARCH= -gencode arch=compute_61,code=compute_61 \
1

重新编译即可。

Couldn’t open file:backup/yolov3-voc.backup

darknet 文件夹下本来就有 backup，但是仍然会出错。这里把原本的 backup 文件夹删掉，新建一个一摸一样的，问题解决。（不知道是为了啥）

！Couldn’t open file：train.txt

第一次训练已经跑了20000次，第二天想用 log 日志接着训练，结果就开始报错。
在这里插入图片描述
对照了好几遍路径、文件名，都是对的，最后还是翻墙出去看到了有一个人和我同样的问题，原来是 windows 和 linux 系统的文件编码不一样，导致无法打开。折腾了一天…
解决：将 voc.data 删掉，在终端用 vim 重新写一个 voc.data，内容都不用变，保存退出后重新训练即可。

YOLO 训练过程中参数的含义

训练参数

看一下 /data/monn/darknet/cfg/ 文件夹下的 yolov3-voc.cfg 配置文件：

[net]
# Testing
# batch=1
# subdivisions=1
# Training
batch=64  # 每轮迭代抽取 batch 张图片
subdivisions=16  # 将一个 batch 分成 subdivisions 个子 batch
width=416  # 输入图像的宽
height=416  # 输入图像的高
channels=3  # 输入图像的通道数
momentum=0.9  # 动量
decay=0.0005  # 权重衰减
angle=0
saturation = 1.5  # 饱和度
exposure = 1.5  # 曝光度
hue=.1  # 色调

learning_rate=0.001  # 学习率
burn_in=1000  # 学习率控制的参数
max_batches = 50200  # 迭代次数，可以减小以缩短训练时间，但精度可能会下降
policy=steps  # 学习率策略
steps=40000,45000  # 学习率变动步长
scales=.1,.1  # 学习率变动因子
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

batch： 每轮迭代抽取 batch = 64 张图片，每个 batch 更新一次参数。内存不够时 batch 可以稍微减小，但不能太小，会造成目标丢失，模型无法收敛。batch 越大，训练效果越好；
subdivisions： 每轮迭代划分成了 subdivisions = 16 组，batch/subdivisions作为一次性送入训练器的样本数量，也就是说每次送入 batch / subdivision = 4 张图片进行训练。划分子 batch 的意义在于减轻内存占用的压力；
width、height、channels： 输入图像的宽、高、通道数都是参数信息，width 和 height 影响网络对输入图像的分辨率，从而影响到 precision，只能设置成 32 的倍数；
momentum： 最优化方法中的动量参数，这个值影响着梯度下降到最优值的速度；
decay： 权重衰减正则项，防止过拟合。该参数越大对过拟合的抑制能力越强；
angle 角度、saturation 饱和度、exposure 曝光度、hue 色调： 通过调整这四个值可以生成更多训练样本；
learning_rate： 决定权值更新的速度，设置得太大会使结果超过最优值，太小会使下降速度过慢。（学习率的调整）
burn_in： 迭代次数小于 burn_in 时，其学习率的更新有一种方式，大于burn_in时，才采用 policy 的更新方式；
max_batches： 训练达到 max_batches 后停止学习；
policy： 是学习率调整的策略，有policy：constant, steps, exp, poly, step, sig, RANDOM，constant等方式；
steps 和 scales：这两个参数是设置学习率的变化，比如迭代到40000次时，学习率衰减十倍。45000次迭代时，学习率又会在前一个学习率的基础上衰减十倍；
第一轮迭代的输出：有 16 * 3 条信息，即有 16 组、每组包含 3 条信息

每组输出的三条信息分别是：

Region 82 Avg IOU: 
Region 94 Avg IOU: 
Region 106 Avg IOU: 
1
2
3

三个尺度上预测不同大小的框：82 卷积层为最大的预测尺度，使用较大的 mask，但是可以预测出较小的物体；94 卷积层为中间的预测尺度，使用中等的 mask；106 卷积层为最小的预测尺度，使用较小的 mask，可以预测出较大的物体。

快输出：

Region 82 Avg IOU: 0.798032, Class: 0.559781, Obj: 0.515851, No Obj: 0.006533, .5R: 1.000000, .75R: 1.000000,  count: 2
1

Region 82 Avg IOU: 0.798032： 表示在当前 subdivision 内的图片的平均 IOU，代表预测的矩形框和真实目标的交集与并集之比，这里是 79.80%。
Class： 标注物体分类的正确率，期望该值趋近于1。
Obj： 越接近1越好。
No Obj： 期望该值越来越小，但不为零。
5R：1.000000： 以 IOU=0.5 为阈值时的 recall，recall = 检出的正样本/实际的正样本。
75R：1.000000： 以 IOU=0.75 为阈值时候的 recall
count： count 的值是所有的当前 subdivision 图片中包含正样本的图片的数量。

批输出：

2706: 1.350835, 1.386559 avg, 0.001000 rate, 3.323842 seconds, 173184 images
1

2706： 当前训练的迭代次数
1.350835： 总体 Loss（损失）
1.386559 avg ： 平均损失，这个数值应该越低越好。一般来说，一旦这个数值低于 0.060730 avg 就可以终止训练了
0.001000 rate： 当前的学习率，是在.cfg文件中定义的
3.323842 seconds： 当前 batch 训练所花的时间
173184 images ： 目前为止参与训练的图片总数 = 2706 * 64

网络参数

仍然在 /data/monn/darknet/cfg/ 文件夹下的 yolov3-voc.cfg 配置文件：

[convolutional]
batch_normalize=1  # 是否做BN
filters=32  # 输出特征图的数量
size=3  # 卷积核的尺寸
stride=1  # 做卷积运算的步长
pad=1  # 如果pad为0,padding由 padding参数指定;如果pad为1，padding大小为size/2，padding应该是对输入图像左边缘拓展的像素数量
activation=leaky  # 激活函数的类型
1
2
3
4
5
6
7

[yolo]
mask = 0,1,2  # 预测 anchor boxes
anchors = 10,13,  16,30,  33,23,  30,61,  62,45,  59,119,  116,90,  156,198,  373,326
classes=20  # 网络需要识别的物体类别数
num=9  # 每个 grid cell 预测 9 个 box
jitter=.3
ignore_thresh = .5
truth_thresh = 1
random=1
1
2
3
4
5
6
7
8
9

每个 yolo 层实际上只预测3个由 mask 定义的 anchors；
anchors 是可以事先通过 cmd 指令计算出来的，它和图片数量，width，height 以及 cluster（应该就是下面的 num 的值，即想要使用的 anchors 的数量）相关的预选框，可以手工挑选，也可以通过 kmeans 从训练样本中学出；
num：每个 grid cell 预测怒骂个box，和 anchors 的数量一致。当想要使用更多 anchors 时需要调大num，且如果调大 num 后训练时 Obj 趋近 0 的话可以尝试调大 object_scale；
ignore_thresh：决定是否需要计算 IOU 误差的参数，大于 thresh，IOU 误差不会加在 cost function 中；
random：如果为1，每次迭代图片大小随机从320到608，步长为32，如果为0，每次训练大小与输入大小一致；

其他问题

1. 多块 GPU 选择训练

当有多块 GPU 时，如果需要选择不同的 GPU 进行训练，参考以下命令：（0 或 1 表示 GPU 的序号）

 ./darknet detector -i 0 train cfg/voc.data cfg/yolov3-voc.cfg darknet53.conv.74
1

如果要用多个 GPU 同时训练，参考以下命令（在最后加上 gpu 的编号即可）：

 ./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg darknet53.conv.74 -gpus 0,1,2,3
1

2. 判断发散和训练不充分

在测试时没有 bbox 和 predict 结果，有两种可能：

- 训练发散了
判断：训练时看一下 loss 和 avg loss，如果这两个值不断变大到几百就说明训练发散，可以通过降低学习率和提高batch数量解决这个问题。

- 训练不充分
判断：在 test 时设置 threshold，darknet 默认是 0.25，可以逐渐降低这个值看看效果。

./darknet detector test cfg/voc.data cfg/yolov3-voc.cfg backup/yolov3-voc_20000.weights data/dog.jpg -thresh 0.05
1

在训练 20000 次时，阈值为 0.25，只能检测到 car：

Loading weights from backup/yolov3-voc_20000.weights...Done!
data/dog.jpg: Predicted in 0.041438 seconds.
car: 83%
1
2
3

在这里插入图片描述
设置 threshold = 0.13 时，误检出 bird：

Loading weights from backup/yolov3-voc_20000.weights...Done!
data/dog.jpg: Predicted in 0.021404 seconds.
car: 83%
bird: 14%
1
2
3
4

在这里插入图片描述

3. 训练过程被中断

可以将最后一次的模型（weights）作为预训练模型继续训练，比如在第 20000 次训练的基础上继续：

./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg backup/yolov3-voc_20000.weights
1

如果已经训练完成，想要在 final_weights 的基础上继续训练，可以修改 cfg 配置文件的 max_batches。

4. 修改训练时权重保存间隔

在 ./darknet/examples/ 的 detector.c 下修改权重保存间隔，这里默认是迭代小于 1000 次时每 100 次保存一下模型，迭代大于 1000 次以后，每训练 10000 次才会保存一下。可以根据自己需要进行修改。
在这里插入图片描述

可视化参数

在训练时生成训练日志文件

训练结束后要检测各种指标（比如 loss）是否达到了期望的数值。如果没有，要分析为什么，可视化这些参数可以帮我们分析问题。

可视化中间参数需要用到训练时保存的 log 文件：在原始训练命令上进行修改如下：（路径根据自己的实际路径进行修改）

先在 darknet 下建立 visualization 目录，后执行训练命令：

./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg darknet53.conv.74 2>1 | tee visualization/train_yolov3.log 
1

保存 log 时会生成文件：train_yolov3.log

解析日志文件

extravt_log.py

log 日志文件中保存了训练过程中的所有输出信息（包括快输出和批输出），所以在绘制曲线之前，需要先使用 extravt_log.py 解析 loss 行和 iou 行得到两个 txt 文件。

# coding=utf-8
# 该文件用来提取训练log，去除不可解析的log后使log文件格式化，生成新的log文件供可视化工具绘图

import inspect
import os
import random
import sys
def extract_log(log_file, new_log_file, key_word):
    with open(log_file, 'r') as f:
      with open(new_log_file, 'w') as train_log:
  #f = open(log_file)
    #train_log = open(new_log_file, 'w')
        for line in f:
    # 去除多gpu的同步log
          if 'Syncing' in line:
            continue
    # 去除除零错误的log
          if 'nan' in line:
            continue
          if key_word in line:
            train_log.write(line)
    f.close()
    train_log.close()

extract_log('train_yolov3.log','train_log_loss.txt','images')
extract_log('train_yolov3.log','train_log_iou.txt','IOU')
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

loss 曲线可视化

#!/usr/bin/python
#coding=utf-8

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# 根据log_loss.txt的行数修改lines, 修改训练时的迭代起始次数(start_ite)和结束次数(end_ite)。
lines = 27180
start_ite = 0  # train_log_loss.txt里面的最小迭代次数
end_ite = 27180  # train_log_loss.txt里面的最大迭代次数
step = 10  # 跳行数，决定画图的稠密程度
igore = 1000  # 当开始的loss较大时，忽略前igore次迭代，注意这里是迭代次数

y_ticks = [0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3]  # 纵坐标的值
data_path =  'train_log_loss.txt' # log_loss的路径。
result_path = 'avg_loss' # 保存结果的路径。

names = ['loss', 'avg', 'rate', 'seconds', 'images']
result = pd.read_csv(data_path, skiprows=[x for x in range(lines) if (x<lines*1.0/((end_ite - start_ite)*1.0)*igore or x%step!=9)], error_bad_lines=\
False, names=names)
result.head()
for name in names:
    result[name] = result[name].str.split(' ').str.get(1)

result.head()
result.tail()

for name in names:
    result[name] = pd.to_numeric(result[name])
result.dtypes
print(result['avg'].values)

fig = plt.figure()
ax = fig.add_subplot(1, 1, 1)

x_num = len(result['avg'].values)
tmp = (end_ite-start_ite - igore)/(x_num*1.0)
x = []
for i in range(x_num):
	x.append(i*tmp + start_ite + igore)
#print(x)
print('total = %d\n' %x_num)
print('start = %d, end = %d\n' %(x[0], x[-1]))

ax.plot(x, result['avg'].values, label='avg_loss')
#ax.plot(result['loss'].values, label='loss')
plt.yticks(y_ticks)#如果不想自己设置纵坐标，可以注释掉。
plt.grid()
ax.legend(loc = 'best')
ax.set_title('The loss curves')
ax.set_xlabel('batches')
fig.savefig(result_path)
#fig.savefig('loss')
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54

在这里插入图片描述

IoU 曲线可视化

#!/usr/bin/python
#coding=utf-8

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

#根据log_iou修改行数
lines = 952812
step = 5000
start_ite = 0
end_ite = 50200
igore = 1000
data_path =  'train_log_iou.txt' #train_log_iou的路径。
result_path = 'avg_iou' #保存结果的路径。

names = ['Region Avg IOU', 'Class', 'Obj', 'No Obj', '.5_Recall', '.7_Recall', 'count']
#result = pd.read_csv('log_iou.txt', skiprows=[x for x in range(lines) if (x%10==0 or x%10==9)]\
result = pd.read_csv(data_path, skiprows=[x for x in range(lines) if (x<lines*1.0/((end_ite - start_ite)*1.0)*igore or x%step!=0)]\
, error_bad_lines=False, names=names)
result.head()

for name in names:
    result[name] = result[name].str.split(': ').str.get(1)
result.head()
result.tail()
for name in names:
    result[name] = pd.to_numeric(result[name])
result.dtypes

x_num = len(result['Region Avg IOU'].values)
tmp = (end_ite-start_ite - igore)/(x_num*1.0)
x = []
for i in range(x_num):
	x.append(i*tmp + start_ite + igore)
#print(x)
print('total = %d\n' %x_num)
print('start = %d, end = %d\n' %(x[0], x[-1]))

fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.plot(x, result['Region Avg IOU'].values, label='Region Avg IOU')
#ax.plot(result['Avg Recall'].values, label='Avg Recall')
plt.grid()
ax.legend(loc='best')
ax.set_title('The Region Avg IOU curves')
ax.set_xlabel('batches')
fig.savefig(result_path)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48

在这里插入图片描述

yolov3 源码分析

darknet文件目录

backup：用于存放模型，在训练过程中会自动生成备份
cfg：配置文件
data：数据存放
examples：工程文件，包括 darknet.c等
include：网络的头文件
obj：目标代码
python：python 接口
results：结果文件
scripts：一些辅助脚本
src：网络源码
weights：自己创建的，用于存放权重文件
Makefile：训练的一些设定，通常是 GPU，CUDNN 等

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/花生_TL007/article/detail/728016

【YOLOv3】在 VOC 上训练 yolov3_yolov3 voc数据集训练

文章目录

训练前的准备工作

运行 demo

用 YOLO 训练 VOC 数据集

准备工作

为 VOC 数据集生成标签

为 VOC 修改配置文件

下载预训练权重文件

训练模型

测试

遇到的错误

CUDA Error：unknown error

Couldn’t open file:backup/yolov3-voc.backup

！Couldn’t open file：train.txt

YOLO 训练过程中参数的含义

训练参数

网络参数

其他问题

1. 多块 GPU 选择训练

2. 判断发散和训练不充分

3. 训练过程被中断

4. 修改训练时权重保存间隔

可视化参数

在训练时生成训练日志文件

解析日志文件

loss 曲线可视化

IoU 曲线可视化

yolov3 源码分析