如何用PyTorch自定义并加载重写后的数据集Dataset到Dataloader?
- 内容介绍
- 文章标签
- 相关推荐
本文共计812个文字,预计阅读时间需要4分钟。
前言:众所周知,Dataset和Dataloader是PyTorch中用于数据加载的重要组件。在进行深度学习模型训练之前,必须将数据加载进来,然后才能进行模型的训练。在PyTorch的一些案例教程中,常用torchvision.datasets自带的MNIST、CIFAR等数据集。
前言
众所周知,Dataset和Dataloder是pytorch中进行数据载入的部件。必须将数据载入后,再进行深度学习模型的训练。在pytorch的一些案例教学中,常使用torchvision.datasets自带的MNIST、CIFAR-10数据集,一般流程为:
# 下载并存放数据集 train_dataset = torchvision.datasets.CIFAR10(root="数据集存放位置",download=True) # load数据 train_loader = torch.utils.data.DataLoader(dataset=train_dataset)
但是,在我们自己的模型训练中,需要使用非官方自制的数据集。这时应该怎么办呢?
我们可以通过改写torch.utils.data.Dataset中的__getitem__和__len__来载入我们自己的数据集。
__getitem__获取数据集中的数据,__len__获取整个数据集的长度(即个数)。
本文共计812个文字,预计阅读时间需要4分钟。
前言:众所周知,Dataset和Dataloader是PyTorch中用于数据加载的重要组件。在进行深度学习模型训练之前,必须将数据加载进来,然后才能进行模型的训练。在PyTorch的一些案例教程中,常用torchvision.datasets自带的MNIST、CIFAR等数据集。
前言
众所周知,Dataset和Dataloder是pytorch中进行数据载入的部件。必须将数据载入后,再进行深度学习模型的训练。在pytorch的一些案例教学中,常使用torchvision.datasets自带的MNIST、CIFAR-10数据集,一般流程为:
# 下载并存放数据集 train_dataset = torchvision.datasets.CIFAR10(root="数据集存放位置",download=True) # load数据 train_loader = torch.utils.data.DataLoader(dataset=train_dataset)
但是,在我们自己的模型训练中,需要使用非官方自制的数据集。这时应该怎么办呢?
我们可以通过改写torch.utils.data.Dataset中的__getitem__和__len__来载入我们自己的数据集。
__getitem__获取数据集中的数据,__len__获取整个数据集的长度(即个数)。

