天天看点

视觉方面一些基础知识

1.CNN为什么可以在CV/NLP/Speech等领域都可以使用?

  1. 卷积是因为输入数据的局部相关性;

  2. 权值共享是因为输入数据的局部特征具有平移不变性,即在不同位置具有共性的局部特征。这样,经过多层次堆叠,低层局部特征可以抽取成高层全局特征。

  3. 权值共享能够降低参数量,而且降低了网络的训练难度。

    note: 如果权值不共享,那就是局部连接层了。在某些应用,如人脸在不同的区域存在不同的特征(眼睛/鼻子/嘴的分布位置相对固定),当不存在全局的局   部特征分布时,局部连接层更适合特征的提取。

2.采用pooling原因:

  1. 提取特征,保证invariance(translation(平移),rotation(旋转),scale(尺度))      

  2. 减少参数减少计算量和防止过拟合