2021新文:ReLabel如何将ImageNet高效转化为多标签数据集,提升监督学习精度?

2026-05-25 16:161阅读0评论SEO基础
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计1394个文字,预计阅读时间需要6分钟。

2021新文:ReLabel如何将ImageNet高效转化为多标签数据集,提升监督学习精度?

人工标注数据集中普遍存在噪声,ReLabel能自动且低成本地将原始单标签数据集转化为多标签数据集,并提出配合random crop使用的有效LabelPooling方法,可更精确地指导分类网络。

人工标注数据集中普遍存在噪声,ReLabel能够自动且低成本地将原本的单标签数据集转化为多标签数据集,并且提出配合random crop使用的高效LabelPooling方法,能够更准确地指导分类网络的训练

来源:晓飞的算法工程笔记 公众号

论文: Re-labeling ImageNet:from Single to Multi-Labels, from Global to Localized Labels

  • 论文地址:arxiv.org/abs/2101.05022
  • 论文代码:github.com/naver-ai/relabel_imagenet
Introduction

  ImageNet数据集是图像识别领域很重要的数据集,数据集本身假设图片中只有一个目标,但是目前发现其中包含了很多噪声数据,很多图片实际上可能存在多个类别目标,这种情况就会误导网络的学习。此外,论文发现常用的Random crop数据增强方法会加剧这一现象,对验证集的每张图片进行100次Random crop,统计裁剪图片与原目标之间的IoU,结果如上面的图所示,IoU低于0.5的占比为76.5%,IoU为0的占比甚至高达8%,这显然会给训练带来极大的干扰。

阅读全文

本文共计1394个文字,预计阅读时间需要6分钟。

2021新文:ReLabel如何将ImageNet高效转化为多标签数据集,提升监督学习精度?

人工标注数据集中普遍存在噪声,ReLabel能自动且低成本地将原始单标签数据集转化为多标签数据集,并提出配合random crop使用的有效LabelPooling方法,可更精确地指导分类网络。

人工标注数据集中普遍存在噪声,ReLabel能够自动且低成本地将原本的单标签数据集转化为多标签数据集,并且提出配合random crop使用的高效LabelPooling方法,能够更准确地指导分类网络的训练

来源:晓飞的算法工程笔记 公众号

论文: Re-labeling ImageNet:from Single to Multi-Labels, from Global to Localized Labels

  • 论文地址:arxiv.org/abs/2101.05022
  • 论文代码:github.com/naver-ai/relabel_imagenet
Introduction

  ImageNet数据集是图像识别领域很重要的数据集,数据集本身假设图片中只有一个目标,但是目前发现其中包含了很多噪声数据,很多图片实际上可能存在多个类别目标,这种情况就会误导网络的学习。此外,论文发现常用的Random crop数据增强方法会加剧这一现象,对验证集的每张图片进行100次Random crop,统计裁剪图片与原目标之间的IoU,结果如上面的图所示,IoU低于0.5的占比为76.5%,IoU为0的占比甚至高达8%,这显然会给训练带来极大的干扰。

阅读全文