如何搜集海量数据集以供cmu统计机器学习课程使用?
- 内容介绍
- 文章标签
- 相关推荐
本文共计797个文字,预计阅读时间需要4分钟。
这个回答将持续更新,包含尽可能多的数据集来源。首先强烈推荐一个GitHub项目:awesome-public-datasets。这个项目将不断更新,包含尽可能多的数据集来源。另外,强烈推荐一个Git资源。
这个回答将持续更新尽量包含尽可能多的数据集来源。首先我要强推一个Github项目名字是awesome-public-datasets这个回答将持续更新尽量包含尽可能多的数据集来源。
首先我要强推一个Github项目名字是awesome-public-datasets项目地址如下。awesomedata/awesome-public-datasetsgithub.com
已经有40.3k的☆并且还是不断的更新中。
awesome-public-datasets是一个高质量的以主题为中心的公共数据源列表从博客一些回答和用户回复中获取整理而成。绝大多数的数据集是免费的当然不排除极个别是付费的。其中包含了32个主题例如农业生物学气候数据挑战赛教育能源经济图像处理博物馆医学信息时间序列等。
拿我的研究方向时间序列来说包含了一下7个子数据集基本可以满足学习的要求。
因为介绍的这个库是全英文的所以还是需要一定的英语水平这里我建议大家可以尝试下下面的免费课程对于英语整体能力提升很有效。
除此之外还有一些常用的数据集公开网站
1 UCI机器学习数据库
大名鼎鼎的数据集网站现在包含了557个数据集其中绝大多数可以直接下载并且很多的论文中benchmark也来源于此。
2 多类别分类数据集
这是我常用的一个里面包含了很多了多分类的数据集有时序的和非时序的。
本文共计797个文字,预计阅读时间需要4分钟。
这个回答将持续更新,包含尽可能多的数据集来源。首先强烈推荐一个GitHub项目:awesome-public-datasets。这个项目将不断更新,包含尽可能多的数据集来源。另外,强烈推荐一个Git资源。
这个回答将持续更新尽量包含尽可能多的数据集来源。首先我要强推一个Github项目名字是awesome-public-datasets这个回答将持续更新尽量包含尽可能多的数据集来源。
首先我要强推一个Github项目名字是awesome-public-datasets项目地址如下。awesomedata/awesome-public-datasetsgithub.com
已经有40.3k的☆并且还是不断的更新中。
awesome-public-datasets是一个高质量的以主题为中心的公共数据源列表从博客一些回答和用户回复中获取整理而成。绝大多数的数据集是免费的当然不排除极个别是付费的。其中包含了32个主题例如农业生物学气候数据挑战赛教育能源经济图像处理博物馆医学信息时间序列等。
拿我的研究方向时间序列来说包含了一下7个子数据集基本可以满足学习的要求。
因为介绍的这个库是全英文的所以还是需要一定的英语水平这里我建议大家可以尝试下下面的免费课程对于英语整体能力提升很有效。
除此之外还有一些常用的数据集公开网站
1 UCI机器学习数据库
大名鼎鼎的数据集网站现在包含了557个数据集其中绝大多数可以直接下载并且很多的论文中benchmark也来源于此。
2 多类别分类数据集
这是我常用的一个里面包含了很多了多分类的数据集有时序的和非时序的。

