线性回归是很常见的一种回归,线性回归可以用来预测或者分类,主要解决线性问题。
线性回归过程主要解决的就是如何通过样本来获取最佳的拟合线。最常用的方法便是最小二乘法,它是一种数学优化技术,它通过最小化误差的平方和寻找数据的最佳函数匹配。
假设拟合直线为y=ax+b
对任意样本点(xi,yi)
误差为e=yi−(axi+b)
当S=∑ni=1ei2为最小时拟合度最高,即∑ni=1(yi−axi−b)2最小。
分别求一阶偏导
∂S∂b=−2(∑i=1nyi−nb−a∑i=1nxi)
∂S∂a=−2(∑i=1nxiyi−b∑i=1nxi−a∑i=1nxi2)
6.分别让上面两式等于0,并且有nx¯=∑ni=1xi,ny¯=∑ni=1yi
7.得到最终解
a=∑ni=1(xi−x¯)(yi−y¯)∑ni=1(xi−x¯)2
b=y¯−ax¯
结果也可以如下
a=n∑xiyi−∑xi∑yin∑xi2−(∑xi)2
b=∑xi2∑yi−∑xi∑xiyin∑xi2−(∑xi)2

对于y=ax+b转为向量形式
W=[w0w1]$‘,‘$X=[1x1]
于是y=w1x1+w0=WTX
损失函数为
L=1n∑i=1n(yn−(WTX)2)=1n(y−XW)T(y−XW)
最后可化为
1nXTWTXW−2nXTWTy+1nyTy
令偏导为0
∂L∂W=2nXTXW−2nXTy=0
另外,(XTX)−1XTX=E,EW=W
则,
(XTX)−1XTXW=(XTX)−1XTy
W=(XTX)−1XTy
运行结果

========广告时间========
<a href="http://blog.csdn.net/wangyangzhizhou/article/details/74080321">为什么写《Tomcat内核设计剖析》</a>
=========================