OpenMMLab學習筆記(一)
day01 計算機視覺與OpenMMLab開源算法體系
1. 基本知識
計算機視覺的基礎任務:分類、分類和定位、物體檢測、分割(語義分割、執行個體分割),其中執行個體分割統一種類索引不同
注意語義分割和執行個體分割的差別
計算機視覺的應用:
- 無人駕駛中的感覺
- 動漫特效
- 航拍
- 虛拟主播(小冰等)
- 視訊了解與視訊剪輯(找出跳水運動員的精彩瞬間)
計算機視覺的發展
- 早期萌芽(物體檢測算法、三維視覺理論)
- 統計機器學習與模式識别(人臉識别,利用小波特征結合級聯分類器)
- 傳統的視覺特征:局部二值模式(Local Binary Pattern)、尺度不變特征轉換(Scale Invariant Feature Transform)
、梯度方向直方圖(Histogram of Oriented Gradients)
- 深度學習時代
- 李飛飛創立的ImageNet資料庫具有重要意義
- 湧現出AlexNet、Fast R-CNN和深度對抗網絡等模型
- 現有流行方向
- 文字生成圖檔
- 神經渲染三維重建CityNeRF
2. OpenMMLab總體架構概覽
OpenMMLab包含目标檢測、執行個體分割和全景分割等子產品,擁有衆多的模型庫:
3. OpenMMLab2.0
2.0在之前的基礎上增加了很多算法架構和優化了相應的基礎庫:
4. 機器學習基礎
機器學習主要包括:監督學習、無監督學習和強化學習
機器學習中的分類問題:垃圾分類
機器學習的基本流程:
神經網絡:
訓練結果的評價名額:
過拟合的解決方案:早停
5. 卷積神經網絡
卷積的過程:
激活層和激活函數
池化層和全連接配接層:
輸出層:
6. pytorch相關
自動求導demo:
torch重要的函數都在nn.functional中:
7. 小結
第一課算是通識課程,對各方面都做了概述,從計算機視覺的定義等基本概念到OpenMMLab再到Pytorch相關内容都認真的進行了講解。這一課,我們對計算機視覺有了初步的認識,然後對OpenMMLab架構進行了講解,OpenMMLab包含的衆多算法架構和易于使用的接口能夠極大縮短開發時間。對于OpenMMLab2.0,算法架構又進一步獲得了完善和架構的整體性能也大幅提升,最後我們學習了機器學習和卷積神經網絡的基本知識,了解了卷積、池化和全連接配接等基本概念,最後結合pytorch講述了算法的訓練和推理過程中的相關知識。