深度学习学习记录一

2021-11-12 16:01:37

深度学习学习记录一

我这里的规划是，李宏毅的深度学习课程，然后林轩田的机器学习基石，机器学习技法，最后我们苏老师的计算机视觉。后面就读论文，复现程序了。

竞赛，作业平台

让机器自己学习来生产复杂的程序。如语音识别，图像分类等。

Regression：输出一个数值的程序

Classification ：从设定好的信息中，选择一个输出，例子alaf go，从19*19的棋盘中选择一个最好的位置。

Structured Learning：让机器学会创作。（黑暗大陆）

1.Function with unknown Parameters

b: bias

w: weight

2.Define Loss from Training Data

3.Optimization

Gradient Descent ：have local minima 局部最优解

η:learning rate

李宏毅老师，这里使用自己的2017-2020的youtube数据来预测第二天的观看人数。用一个w来预测，等于用前一天预测，效果不好。发现曲线是七天一个循环，所以使用7个w预测。然后效果优化到极限，还是有误差。所以线性函数（linear models）不够用来预测。piecewise linear curves（分段线性函数），曲线也可以用piecewise linear curves来逼近。

y = c * (1 / 1 + e ^ -(b + wx1))

w：改变斜率

b：左右移动

c：改变高度

神经网络原理

y = b + ∑c * (1 / 1 + e ^ -(b + wx1)) ci,bi,wi (通过多个sigmoid函数来相加生成piecewise linear curves )

y = b + ∑c * (1 / 1 + e ^ -(b + ∑wx)) ci,bi,wij,xj (通过多个sigmoid函数来相加生成piecewise linear curves ) 这个式子可以推出神经网络

根据式子推到神经网络

将式子矩阵化1

将式子矩阵化2

上图的矩阵式子

L（θ） θ 是所有的 Unknown parameters

g ：gradient ：梯度

batch 把资料分为多个batch，用小batch 来更新参数。一个epoch是把所有的batch过一遍的结果。

这个是hard sigmoid。

y = b + ∑c * max(0,b + ∑wx) ci,bi,wij,xj

效果比两层多神经元好很多。所以叫深度学习。括弧笑

论文收集 alexnet vgg googlenet residualnet

深度学习学习记录一

继续阅读

2021年银行从业考试考情介绍,果断收藏!

证券从业合格证书什么时候打印？有哪些注意事项？

【干货满满】初级银行从业考试《个人理财》重点梳理

2020年经济师考试，难吗？

初级银行从业资格证有什么用？

MBA提前面试纯干货分享

MBA值得学么

通俗理解查准率(precision)和查全率(recall)

吴恩达logistic回归实现

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

深度学习模型分析人类复杂疾病的准确性

人工智能如何有效地运用于自然语言处理

【趋高机器视觉】机器视觉技术原理解析及解决方案

吴恩达 coursera ML 第七课总结+作业答案前言目录正文模型表示作业答案

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

cs231n斯坦福基于卷积神经网络的CV学习笔记（一）KNN和线性分类器/分类器损失/反向传播一，KNN图像分类算法二，线性分类器三，线性分类器损失四，反向传播五，神经网络