1机器学习的一些概念
模型Y(预测)=F(X|θ)
机器学习是调整参数θ的过程
Y(实际)已标定为监督学习
Y(实际)自我生成为无监督学习
泛化能力为模型用于新样例的能力
过拟合:学习过好,学习了样本的独有的属性
防止过拟合,对过拟合的回归函数进行正则化的函数j(f),使经验风险和结构风险达到平衡的函数
欠拟合:学习不够好,有些属性没有学习到
2线性回归原理
利用数理统计中的回归分析,来确定两种或两种以上变量间,相互依赖的定量关系的一种统计分析方法
3线性回归损失函数、代价函数、目标函数
L=21i=1∑n(yi−wTxi−b)2
4优化方法(梯度下降法、牛顿法、拟牛顿法等)

5线性回归的评估指标
①皮尔逊相关系数:衡量线性相关强弱的指标
当相关系数越接近1或者-1时,表示其相关性越高。
缺点:受样本量影响较大
②均方根误差RMSE:
③平均绝对误差MAE
6sklearn参数详解
调用sklearn.linear_model.LinearRegression()所需参数:
fit_intercept : 布尔型参数,表示是否计算该模型截距。可选参数。
normalize : 布尔型参数,若为True,则X在回归前进行归一化。可选参数。默认值为False。
copy_X : 布尔型参数,若为True,则X将被复制;否则将被覆盖。 可选参数。默认值为True。