在统计学中,我们常常会用到一种分析方法——回归直线方程拟合样本。这种方法无论是在电力系统分析还是在金融数据分析方面都非常有用,但是在使用过程中,我一直不明白回归直线的公式是怎样得来的,于是我通过查阅资料,自己也进行了一系列的推导,终于是弄明白了这一过程。今天我通过这篇文章和大家分享一下,希望能帮助到大家。
首先我们看一下回归直线方程的公式:
一般来说,再进行回归分析时,我们可以直接套用这个公式,但是这个公式并不好记忆,常常会混淆,所以这里还还是了解一下他的推导过程。
首先,这个公式的推导要从它的原理出发,既然是拟合直线,就是要将坐标系上的样本点拟合到一条直线上,如下图所示:
通过将样本点拟合为一条直线,进而进行一定的分析和预测,这即是它的目的,而如何得到这条直线呢?就是要找到一条最能符合这些样本点的一条直线,方法并不困难,我们可以这样理解,要想使这些点能够完美地拟合,就是要保证这些点和拟合后的直线挨得非常近,从这个角度出发,我们可以大胆断定,当这些样本点到直线距离最近时,我们即可得到该拟合直线。
从上图中,我们假设这些样本点坐标为(xi,yi),而红线的长度就是点到直线的距离di,因为从坐标系角度来看,点在直线两边都有分布,所以距离有正有负,因此我们可以把计算对象变为距离的平方di^2(平方和最小即距离和最小),我们假设直线方程为y=bx+a,利用偏导数求极值,可以得到下面的推导过程:
以上即为回归直线方程公式的推导过程,希望能够帮助到大家。