天天看点

task1

1机器学习的一些概念

模型Y(预测)=F(X|θ)

机器学习是调整参数θ的过程

Y(实际)已标定为监督学习

Y(实际)自我生成为无监督学习

泛化能力为模型用于新样例的能力

过拟合:学习过好,学习了样本的独有的属性

防止过拟合,对过拟合的回归函数进行正则化的函数j(f),使经验风险和结构风险达到平衡的函数

欠拟合:学习不够好,有些属性没有学习到

2线性回归原理

利用数理统计中的回归分析,来确定两种或两种以上变量间,相互依赖的定量关系的一种统计分析方法

3线性回归损失函数、代价函数、目标函数

L=21​i=1∑n​(yi​−wTxi​−b)2

4优化方法(梯度下降法、牛顿法、拟牛顿法等)

task1
task1
task1
task1

5线性回归的评估指标

①皮尔逊相关系数:衡量线性相关强弱的指标

当相关系数越接近1或者-1时,表示其相关性越高。

缺点:受样本量影响较大

②均方根误差RMSE:

③平均绝对误差MAE

6sklearn参数详解

调用sklearn.linear_model.LinearRegression()所需参数:

fit_intercept : 布尔型参数,表示是否计算该模型截距。可选参数。

normalize : 布尔型参数,若为True,则X在回归前进行归一化。可选参数。默认值为False。

copy_X : 布尔型参数,若为True,则X将被复制;否则将被覆盖。 可选参数。默认值为True。