深度學習語義分割理論與實戰指南 V1.0 版本已經完成,主要包括語義分割概述、關鍵技術元件、資料子產品、經典分割網絡與架構、PyTorch基本實戰方法等五個部分。
擷取方式:
掃描關注下方公衆号回複 語義分割 即可。

圖像分類、目标檢測和圖像分割是基于深度學習的計算機視覺三大核心任務。三大任務之間明顯存在着一種遞進的層級關系,圖像分類聚焦于整張圖像,目标檢測定位于圖像具體區域,而圖像分割則是細化到每一個像素。
圖像分割主要包括語義分割(Semantic Segmentation)和執行個體分割(Instance Segmentation)。那語義分割和執行個體分割具體都是什麼含義?二者又有什麼差別和聯系?
語義分割是對圖像中的每個像素都劃分出對應的類别,即實作像素級别的分類;而類的具體對象,即為執行個體,那麼執行個體分割不但要進行像素級别的分類,還需在具體的類别基礎上差別開不同的個體。
例如,圖像有多個人甲、乙、丙,那邊他們的語義分割結果都是人,而執行個體分割結果卻是不同的對象。另外,為了同時實作執行個體分割與不可數類别的語義分割,相關研究又提出了全景分割(Panoptic Segmentation)的概念。
本文作為基于PyTorch的語義分割技術手冊,對語義分割的基本技術架構、主要網絡模型和技術方法提供一個入門和實戰性的參考。
由于個人經驗、能力有限,本手冊作為1.0版本,有諸多不完善和有失偏頗之處。是以該手冊同時也是一個意見征求稿。後續會不斷進行版本疊代。
手冊項目GitHub項目位址:
https://github.com/luwill/Semantic-Segmentation-Guide/
掃描關注下方公衆号回複 語義分割 即可。
