【机器学习笔记】线性回归之最小二乘法

2023-05-23 05:11:20

线性回归

线性回归（Linear Regreesion）就是对一些点组成的样本进行线性拟合，得到一个最佳的拟合直线。

最小二乘法

线性回归的一种常用方法是最小二乘法，它通过最小化误差的平方和寻找数据的最佳函数匹配。

代数推导

假设拟合函数为 y = a x + b y=ax+b y=ax+b，对于任意样本点 ( x i , y i ) (x_{i},y_{i}) (xi,yi)，误差为 e = y i − ( a x i + b ) e=y_{i}-(ax_{i}+b) e=yi−(axi+b)。当损失函数 L = ∑ i = 1 n e i 2 L=\sum_{i=1}^{n}{e_{i}}^2 L=∑i=1nei2为最小时拟合度最好，即 ∑ i = 1 n ( y i − a x i − b ) 2 \sum_{i=1}^{n}(y_{i}-ax_{i}-b)^2 ∑i=1n(yi−axi−b)2最小。

函数 L = ∑ i = 1 n ( y i − a x i − b ) 2 L=\sum_{i=1}^{n}(y_{i}-ax_{i}-b)^2 L=∑i=1n(yi−axi−b)2分别是关于 a a a和 b b b的二次抛物线，没有最大值，所以当 L L L分别关于 a a a和 b b b的偏导等于 0 0 0时有最小值。

分别求出一阶偏导

∂ S ∂ a = − 2 ( ∑ i = 1 n x i y i − b ∑ i = 1 n x i − a ∑ i = 1 n x i 2 ) ∂ S ∂ b = − 2 ( ∑ i = 1 n y i − n b − a ∑ i = 1 n x i ) \frac{\partial{S}}{\partial{a}}=-2(\sum_{i=1}^{n}x_{i}y_{i}-b\sum_{i=1}^{n}x_{i}-a\sum_{i=1}^{n}{x_{i}}^2)\\ \frac{\partial{S}}{\partial{b}}=-2(\sum_{i=1}^{n}y_{i}-nb-a\sum_{i=1}^{n}x_{i})\\ ∂a∂S=−2(i=1∑nxiyi−bi=1∑nxi−ai=1∑nxi2)∂b∂S=−2(i=1∑nyi−nb−ai=1∑nxi)

让上式都等于 0 0 0，并且有 n x ‾ = ∑ i = 1 n x i n\overline{x}=\sum_{i=1}^{n}x_{i} nx=∑i=1nxi， n y ‾ = ∑ i = 1 n y i n\overline{y}=\sum_{i=1}^{n}y_{i} ny=∑i=1nyi。得到解为

a = ∑ i = 1 n ( x i − x ‾ ) ( y i − y ‾ ) ∑ i = 1 n ( x i − x ‾ ) 2 ， b = y ‾ − a x ‾ a=\frac{\sum_{i=1}^n(x_{i}-\overline{x})(y_{i}-\overline{y})}{\sum_{i=1}^n(x_{i}-\overline{x})^2}， b=\overline{y}-a\overline{x} a=∑i=1n(xi−x)2∑i=1n(xi−x)(yi−y)，b=y−ax

【机器学习笔记】线性回归之最小二乘法

线性回归

最小二乘法

继续阅读

weka之NB算法

使用weka的select attribute

weka中分类器算法

在weka中集成自己的算法

【多变量线性回归】学习记录序思路实现终

现国内基金定投最好的入门书《指数基金投资指南》

申请评分模型拒绝推断（RI）方法申请评分模型拒绝推断（RI）方法

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

线程同步，可重入锁，synchronized

【趋高机器视觉】机器视觉技术原理解析及解决方案

吴恩达 coursera ML 第七课总结+作业答案前言目录正文模型表示作业答案

XGBoost Plotting API以及GBDT组合特征实践 XGBoost Plotting API以及GBDT组合特征实践

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告

对象锁和全局锁

iview后台管理模版