如何用PyTorch自定义并加载重写后的数据集Dataset到Dataloader?

2026-05-22 04:330阅读0评论SEO基础
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计812个文字,预计阅读时间需要4分钟。

如何用PyTorch自定义并加载重写后的数据集Dataset到Dataloader?

前言:众所周知,Dataset和Dataloader是PyTorch中用于数据加载的重要组件。在进行深度学习模型训练之前,必须将数据加载进来,然后才能进行模型的训练。在PyTorch的一些案例教程中,常用torchvision.datasets自带的MNIST、CIFAR等数据集。

前言

众所周知,Dataset和Dataloder是pytorch中进行数据载入的部件。必须将数据载入后,再进行深度学习模型的训练。在pytorch的一些案例教学中,常使用torchvision.datasets自带的MNIST、CIFAR-10数据集,一般流程为:

# 下载并存放数据集 train_dataset = torchvision.datasets.CIFAR10(root="数据集存放位置",download=True) # load数据 train_loader = torch.utils.data.DataLoader(dataset=train_dataset)

但是,在我们自己的模型训练中,需要使用非官方自制的数据集。这时应该怎么办呢?

我们可以通过改写torch.utils.data.Dataset中的__getitem____len__来载入我们自己的数据集。
__getitem__获取数据集中的数据,__len__获取整个数据集的长度(即个数)。

阅读全文

本文共计812个文字,预计阅读时间需要4分钟。

如何用PyTorch自定义并加载重写后的数据集Dataset到Dataloader?

前言:众所周知,Dataset和Dataloader是PyTorch中用于数据加载的重要组件。在进行深度学习模型训练之前,必须将数据加载进来,然后才能进行模型的训练。在PyTorch的一些案例教程中,常用torchvision.datasets自带的MNIST、CIFAR等数据集。

前言

众所周知,Dataset和Dataloder是pytorch中进行数据载入的部件。必须将数据载入后,再进行深度学习模型的训练。在pytorch的一些案例教学中,常使用torchvision.datasets自带的MNIST、CIFAR-10数据集,一般流程为:

# 下载并存放数据集 train_dataset = torchvision.datasets.CIFAR10(root="数据集存放位置",download=True) # load数据 train_loader = torch.utils.data.DataLoader(dataset=train_dataset)

但是,在我们自己的模型训练中,需要使用非官方自制的数据集。这时应该怎么办呢?

我们可以通过改写torch.utils.data.Dataset中的__getitem____len__来载入我们自己的数据集。
__getitem__获取数据集中的数据,__len__获取整个数据集的长度(即个数)。

阅读全文