如何运用机器学习中的线性回归进行数据整理分析？

2026-05-23 01:400阅读0评论SEO教程

内容介绍
文章标签
相关推荐

本文共计954个文字，预计阅读时间需要4分钟。

单线性回归+1、定义假设函数+（h(x)=θ1x+θ0）+2、尝试用样本模拟假设函数，所有样本点到假设函数的距离，其中（m）为样本数量：[sum=1/(2m) * sum(1 to m) * (h(x_i)-y_i)^2]

单元线性回归

1、定义假设函数 \(h(x) = \theta_1x + \theta_0\)

2、尝试用样本拟合假设函数，所有样本点到假设函数的距离，其中\(m\)为样本数量:

\[sum = \dfrac{1}{2m} \sum_{1}^{m} (h(x_i) - y_i)^2 \]

3、当 sum 的值越小，假设函数的偏差就预测样本更加精确。这个表达式就是代价函数 \(j(\theta)\) ，目标就是最小化代价函数的值。

4、假设 \(h(x)\) 没有常数项 \(\theta_0\) ， \(h(x)\) 将会会是一个从原点出发的直线，不断变动 \(\theta_1\) 的值（斜率），带入样本 \((1, 1), (2, 2) , (3, 3)\) 可以发现代价函数 \(j(\theta)\)是一个二次函数，并且在值为 1 的时候，代价函数 \(h(x)\) 的值最小。

梯度下降

问题：为了将代价函数最小化，但是代价函数\(J(\theta)\)在多维后不能可视化，所以需要一种方法来求得最小值。

梯度下降算法描述：

对于每一个 \(\theta_i\) 参数，不断减去代价函数\(j(\theta_0 \cdots \theta_n)\) 对 \(\theta_i\) 的偏导和学习率 \(a\) ，直到收敛，收敛的意思是导数项为0，\(\theta_i\) 的值不再发生变化。

线性回归的梯度下降的代价函数总是一个凸函数，没有局部最优解，只有全局最优解。

学习率的取值

1、学习率太大收敛不了，梯度下降的过程中，不断跳过最低点，需要适当调小学习率；

2、太小的话学习速度太慢

3、学习率总能到达局部最低点，即使学习率是固定的，因为接近最低解的时候，导数会自动变化。

阅读全文

标签：机器学习整理线性回归