Python如何实现多元线性回归分析?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1121个文字,预计阅读时间需要5分钟。
原始数据在此+1. 观察数据,首先使用Pandas打开数据,并进行初步观察。pythonimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inlinedata=pd.read_csv('Folds5x2_pp.csv')data.head()
原始数据在这里
1.观察数据
首先,用Pandas打开数据,并进行观察。
import numpy import pandas as pd import matplotlib.pyplot as plt %matplotlib inline data = pd.read_csv('Folds5x2_pp.csv') data.head()
会看到数据如下所示:
这份数据代表了一个循环发电厂,每个数据有5列,分别是:AT(温度), V(压力), AP(湿度), RH(压强), PE(输出电力)。我们不用纠结于每项具体的意思。
我们的问题是得到一个线性的关系,对应PE是样本输出,而AT/V/AP/RH这4个是样本特征, 机器学习的目的就是得到一个线性回归模型,即: PE=θ0+θ1∗AT+θ2∗V+θ3∗AP+θ4∗RH 而需要学习的,就是θ0,θ1,θ2,θ3,θ4这5个参数。
本文共计1121个文字,预计阅读时间需要5分钟。
原始数据在此+1. 观察数据,首先使用Pandas打开数据,并进行初步观察。pythonimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inlinedata=pd.read_csv('Folds5x2_pp.csv')data.head()
原始数据在这里
1.观察数据
首先,用Pandas打开数据,并进行观察。
import numpy import pandas as pd import matplotlib.pyplot as plt %matplotlib inline data = pd.read_csv('Folds5x2_pp.csv') data.head()
会看到数据如下所示:
这份数据代表了一个循环发电厂,每个数据有5列,分别是:AT(温度), V(压力), AP(湿度), RH(压强), PE(输出电力)。我们不用纠结于每项具体的意思。
我们的问题是得到一个线性的关系,对应PE是样本输出,而AT/V/AP/RH这4个是样本特征, 机器学习的目的就是得到一个线性回归模型,即: PE=θ0+θ1∗AT+θ2∗V+θ3∗AP+θ4∗RH 而需要学习的,就是θ0,θ1,θ2,θ3,θ4这5个参数。

