sklearn模块中的线性回归模型如何应用？

2026-04-28 10:151阅读0评论SEO资源

内容介绍
文章标签
相关推荐

本文共计610个文字，预计阅读时间需要3分钟。

以线性回归为例，介绍sklearn包进行机器学习的流程。使用sklearn进行机器学习的一般过程如下：

1. 生成模拟数据pythonimport numpy as np

def get_data(theta_true, N): X=np.random.randn(N, 1) * 10 y=2 * X + theta_true + np.random.randn(N) * 3 return X, y

2. 导入必要的库pythonfrom sklearn.linear_model import LinearRegressionfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import mean_squared_error

3. 划分训练集和测试集pythonX, y=get_data(theta_true=2, N=100)X_train, X_test, y_train, y_test=train_test_split(X, y, test_size=0.2, random_state=42)

4. 创建模型并进行训练pythonmodel=LinearRegression()model.fit(X_train, y_train)

5. 预测和评估模型pythony_pred=model.predict(X_test)mse=mean_squared_error(y_test, y_pred)print(MSE:, mse)

6. 可视化结果pythonimport matplotlib.pyplot as plt

plt.scatter(X_test, y_test, label='Actual')plt.scatter(X_test, y_pred, label='Predicted', color='red')plt.xlabel('X')plt.ylabel('y')plt.legend()plt.show()

以线性回归为例，介绍sklearn包进行机器学习的流程

本文以线性回归为例，介绍使用sklearn进行机器学习的一般过程。

首先生成模拟数据

import numpy as np def get_data(theta_true,N): X=np.random.normal(size=(N,len(theta_true))) Y=X@theta_true+np.random.normal(size=(N)) return (X,Y) theta_true=np.array([2,3,4]) X,Y=get_data(theta_true,100)

实例化一个估计器，进行一些可选参数配置。sklearn里的回归和线性回归是位于

sklearn.linear_model包中的``LinearRegression`类，在实例化对象时有两个参数：
- fit_intercept：bool，默认为True，是否计算此模型的截距，False 表示不计算截距
- normalize：bool，默认为False如果为True，则在回归之前将对回归变量X进行归一化
- copy_X : 布尔型参数，若为True，则X将被复制；否则将被覆盖。可选参数。默认值为True。
- n_jobs : 整型参数，表示用于计算的作业数量；若为-1，则用所有的CPU。可选参数。默认值为1

from sklearn.linear_model import LinearRegression lm_model = LinearRegression()

调用估计器的fit方法，传入数据和标签，进行学习

lm_model.fit(X,Y)

查看估计出来的参数

lm_model.intercept_#查看截距 lm_model.coef_#查看系数

进行预测

lm_model.predict(X_test)

模型评估

lm.model.score(X_test,Y_test)#用R方进行评估

标签：线性回归以为例