如何运用机器学习中的线性回归进行数据整理分析?

2026-05-23 01:400阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计954个文字,预计阅读时间需要4分钟。

单线性回归+1、定义假设函数+(h(x)=θ1x+θ0)+2、尝试用样本模拟假设函数,所有样本点到假设函数的距离,其中(m)为样本数量:[sum=1/(2m) * sum(1 to m) * (h(x_i)-y_i)^2]

单元线性回归

1、定义假设函数 \(h(x) = \theta_1x + \theta_0\)

2、尝试用样本拟合假设函数,所有样本点到假设函数的距离,其中\(m\)为样本数量:

\[sum = \dfrac{1}{2m} \sum_{1}^{m} (h(x_i) - y_i)^2 \]

3、当 sum 的值越小,假设函数的偏差就预测样本更加精确。这个表达式就是代价函数 \(j(\theta)\) ,目标就是最小化代价函数的值。

4、假设 \(h(x)\) 没有常数项 \(\theta_0\) , \(h(x)\) 将会会是一个从原点出发的直线,不断变动 \(\theta_1\) 的值(斜率),带入样本 \((1, 1), (2, 2) , (3, 3)\) 可以发现代价函数 \(j(\theta)\)是一个二次函数,并且在值为 1 的时候,代价函数 \(h(x)\) 的值最小。

梯度下降

问题:为了将代价函数最小化,但是代价函数\(J(\theta)\)在多维后不能可视化,所以需要一种方法来求得最小值。

梯度下降算法描述:

对于每一个 \(\theta_i\) 参数,不断减去代价函数\(j(\theta_0 \cdots \theta_n)\) 对 \(\theta_i\) 的偏导和学习率 \(a\) ,直到收敛,收敛的意思是导数项为0,\(\theta_i\) 的值不再发生变化。

线性回归的梯度下降的代价函数总是一个凸函数,没有局部最优解,只有全局最优解。

学习率的取值

1、学习率太大收敛不了,梯度下降的过程中,不断跳过最低点,需要适当调小学习率;

2、太小的话学习速度太慢

3、学习率总能到达局部最低点,即使学习率是固定的,因为接近最低解的时候,导数会自动变化。

阅读全文

本文共计954个文字,预计阅读时间需要4分钟。

单线性回归+1、定义假设函数+(h(x)=θ1x+θ0)+2、尝试用样本模拟假设函数,所有样本点到假设函数的距离,其中(m)为样本数量:[sum=1/(2m) * sum(1 to m) * (h(x_i)-y_i)^2]

单元线性回归

1、定义假设函数 \(h(x) = \theta_1x + \theta_0\)

2、尝试用样本拟合假设函数,所有样本点到假设函数的距离,其中\(m\)为样本数量:

\[sum = \dfrac{1}{2m} \sum_{1}^{m} (h(x_i) - y_i)^2 \]

3、当 sum 的值越小,假设函数的偏差就预测样本更加精确。这个表达式就是代价函数 \(j(\theta)\) ,目标就是最小化代价函数的值。

4、假设 \(h(x)\) 没有常数项 \(\theta_0\) , \(h(x)\) 将会会是一个从原点出发的直线,不断变动 \(\theta_1\) 的值(斜率),带入样本 \((1, 1), (2, 2) , (3, 3)\) 可以发现代价函数 \(j(\theta)\)是一个二次函数,并且在值为 1 的时候,代价函数 \(h(x)\) 的值最小。

梯度下降

问题:为了将代价函数最小化,但是代价函数\(J(\theta)\)在多维后不能可视化,所以需要一种方法来求得最小值。

梯度下降算法描述:

对于每一个 \(\theta_i\) 参数,不断减去代价函数\(j(\theta_0 \cdots \theta_n)\) 对 \(\theta_i\) 的偏导和学习率 \(a\) ,直到收敛,收敛的意思是导数项为0,\(\theta_i\) 的值不再发生变化。

线性回归的梯度下降的代价函数总是一个凸函数,没有局部最优解,只有全局最优解。

学习率的取值

1、学习率太大收敛不了,梯度下降的过程中,不断跳过最低点,需要适当调小学习率;

2、太小的话学习速度太慢

3、学习率总能到达局部最低点,即使学习率是固定的,因为接近最低解的时候,导数会自动变化。

阅读全文