len(dataset)、len(dataloader)、len(label)的区别

作者：程序自动化专家 | 2024-02-03 18:22:14

踩

len(dataloader)


from torchvision import datasets
from torch.utils.data import DataLoader
from torchvision import transforms
import os
 
#数据集的位置，我的已经是下好的
dir = 'D:/Research_Time/一些通用的东西/torch日积月累/some_copy_model/data/mnist'
 
#自动创建数据集文件，代码意思是，如果上面的文件不存在，就创建这个文件夹
if not os.path.exists(dir):
    os.makedirs(dir)
 
test_dataset = datasets.MNIST(root=dir,
                              train=False,
                              transform=transforms.ToTensor(),
                              download=True)
 
 
test_data = DataLoader(dataset=test_dataset,
                       batch_size=16,
                       shuffle=False)
 
print(len(test_dataset))
print(len(test_data))
for data in (test_data):
    input, label = data
    print(label.shape)

上面代码执行的结果是：


10000
625
torch.Size([16])
torch.Size([16])
torch.Size([16])
…………
torch.Size([16])
 
 
#最后是torch.size([16])乘625次，因为我写了一个循环取出test_data，
#我不知道怎么只取出一个batch，所以把所有batch_size都取出来了

文字讲述：


以mnist为例子
 
len(test_dataset)是整个数据集测试集的大小，也就是10000
len(test_data)是整个测试集/batch_size的大小，batch_size是16，
dataloader每次从测试集中取出16张图，就将测试集分为了10000/16个小组，于是它的长度是625
len(label)是一个批次的数据大小，batch_size=16，所以label=16

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/article/detail/57545?site