天天看点

线性回归之最小二乘法

线性回归是很常见的一种回归,线性回归可以用来预测或者分类,主要解决线性问题。

线性回归过程主要解决的就是如何通过样本来获取最佳的拟合线。最常用的方法便是最小二乘法,它是一种数学优化技术,它通过最小化误差的平方和寻找数据的最佳函数匹配。

假设拟合直线为y=ax+b

对任意样本点(xi,yi)

误差为e=yi−(axi+b)

当S=∑ni=1ei2为最小时拟合度最高,即∑ni=1(yi−axi−b)2最小。

分别求一阶偏导

∂S∂b=−2(∑i=1nyi−nb−a∑i=1nxi)

∂S∂a=−2(∑i=1nxiyi−b∑i=1nxi−a∑i=1nxi2)

6.分别让上面两式等于0,并且有nx¯=∑ni=1xi,ny¯=∑ni=1yi

7.得到最终解

a=∑ni=1(xi−x¯)(yi−y¯)∑ni=1(xi−x¯)2

b=y¯−ax¯

结果也可以如下

a=n∑xiyi−∑xi∑yin∑xi2−(∑xi)2

b=∑xi2∑yi−∑xi∑xiyin∑xi2−(∑xi)2

线性回归之最小二乘法

对于y=ax+b转为向量形式

W=[w0w1]$‘,‘$X=[1x1]

于是y=w1x1+w0=WTX

损失函数为

L=1n∑i=1n(yn−(WTX)2)=1n(y−XW)T(y−XW)

最后可化为

1nXTWTXW−2nXTWTy+1nyTy

令偏导为0

∂L∂W=2nXTXW−2nXTy=0

另外,(XTX)−1XTX=E,EW=W

则,

(XTX)−1XTXW=(XTX)−1XTy

W=(XTX)−1XTy

运行结果

线性回归之最小二乘法

========广告时间========

<a href="http://blog.csdn.net/wangyangzhizhou/article/details/74080321">为什么写《Tomcat内核设计剖析》</a>

=========================