Pytorch DataLoader 如何处理变长数据输入?
- 内容介绍
- 文章标签
- 相关推荐
本文共计387个文字,预计阅读时间需要2分钟。
关于PyTorch中如何自定义Dataset数据集类以及如何使用DataLoader加载数据,官方文档已经讲解得非常清晰了。这里就不再赘述。
当前的问题主要集中在:+ 有时,特别对于NLP任务来说,输入的数特别多。
关于Pytorch中怎么自定义Dataset数据集类、怎样使用DataLoader迭代加载数据,这篇官方文档已经说得很清楚了,这里就不在赘述。
现在的问题:有的时候,特别对于NLP任务来说,输入的数据可能不是定长的,比如多个句子的长度一般不会一致,这时候使用DataLoader加载数据时,不定长的句子会被胡乱切分,这肯定是不行的。
本文共计387个文字,预计阅读时间需要2分钟。
关于PyTorch中如何自定义Dataset数据集类以及如何使用DataLoader加载数据,官方文档已经讲解得非常清晰了。这里就不再赘述。
当前的问题主要集中在:+ 有时,特别对于NLP任务来说,输入的数特别多。
关于Pytorch中怎么自定义Dataset数据集类、怎样使用DataLoader迭代加载数据,这篇官方文档已经说得很清楚了,这里就不在赘述。
现在的问题:有的时候,特别对于NLP任务来说,输入的数据可能不是定长的,比如多个句子的长度一般不会一致,这时候使用DataLoader加载数据时,不定长的句子会被胡乱切分,这肯定是不行的。

