这个机器学习实战案例,堪称经典,特别适合初学者入门吗?
- 内容介绍
- 文章标签
- 相关推荐
本文共计2957个文字,预计阅读时间需要12分钟。
大家好,今天我给大家介绍一个非常适合新手学习机器学习的实战案例。这是一个房价预测的案例,来源于Kaggle网站,是很多算法初学者的第一道竞赛题目。该案例包含了解决机器学习问题的全过程。
大家好,今天我给大家介绍一个非常适合新手的机器学习实战案例。
这是一个房价预测的案例,来源于 Kaggle 网站,是很多算法初学者的第一道竞赛题目。
该案例有着解机器学习问题的完整流程,包含EDA、特征工程、模型训练、模型融合等。
房价预测流程
下面跟着我,来学习一下该案例。
没有啰嗦的文字,没有多余的代码,只有通俗的讲解。
1. EDA
探索性数据分析(Exploratory Data Analysis,简称EDA) 的目的是让我们对数据集有充分的了解。在这一步,我们探索的内容如下:
EDA内容
1.1 输入数据集
train = pd.read_csv('./data/train.csv')test = pd.read_csv('./data/test.csv')
训练样本
train和test分别是训练集和测试集,分别有 1460 个样本,80 个特征。
SalePrice列代表房价,是我们要预测的。
1.2 房价分布
因为我们任务是预测房价,所以在数据集中核心要关注的就是房价(SalePrice) 一列的取值分布。
本文共计2957个文字,预计阅读时间需要12分钟。
大家好,今天我给大家介绍一个非常适合新手学习机器学习的实战案例。这是一个房价预测的案例,来源于Kaggle网站,是很多算法初学者的第一道竞赛题目。该案例包含了解决机器学习问题的全过程。
大家好,今天我给大家介绍一个非常适合新手的机器学习实战案例。
这是一个房价预测的案例,来源于 Kaggle 网站,是很多算法初学者的第一道竞赛题目。
该案例有着解机器学习问题的完整流程,包含EDA、特征工程、模型训练、模型融合等。
房价预测流程
下面跟着我,来学习一下该案例。
没有啰嗦的文字,没有多余的代码,只有通俗的讲解。
1. EDA
探索性数据分析(Exploratory Data Analysis,简称EDA) 的目的是让我们对数据集有充分的了解。在这一步,我们探索的内容如下:
EDA内容
1.1 输入数据集
train = pd.read_csv('./data/train.csv')test = pd.read_csv('./data/test.csv')
训练样本
train和test分别是训练集和测试集,分别有 1460 个样本,80 个特征。
SalePrice列代表房价,是我们要预测的。
1.2 房价分布
因为我们任务是预测房价,所以在数据集中核心要关注的就是房价(SalePrice) 一列的取值分布。

