6、天池競賽—鋁型材表面瑕疵資料集
資料集下載下傳:
https://tianchi.aliyun.com/competition/entrance/231682/information
鋁型材是佛山南海的支柱性産業。在鋁型材的實際生産過程中,由于各方面因素的影響,鋁型材表面會産生裂紋、起皮、劃傷等瑕疵,這些瑕疵會嚴重影響鋁型材的品質。為保證産品品質,需要人工進行肉眼目測。然而,鋁型材的表面自身會含有紋路,與瑕疵的區分度不高。傳統人工肉眼檢查十分費力,不能及時準确的判斷出表面瑕疵,質檢的效率難以把控。近年來,深度學習在圖像識别等領域取得了突飛猛進的成果。鋁型材制造商迫切希望采用最新的AI技術來革新現有質檢流程,自動完成質檢任務,減少漏檢發生率,提高産品的品質,使鋁型材産品的生産管理者徹底擺脫了無法全面掌握産品表面品質的狀态。本次大賽選擇南海鋁型材标杆企業的真實痛點作為賽題場景,尋求解決方案,助力企業實作轉型更新,提升行業競争力。
大賽資料集裡有1萬份來自實際生産中有瑕疵的鋁型材監測影像資料,每個影像包含一個或多種瑕疵。供機器學習的樣圖會明确辨別影像中所包含的瑕疵類型。
使用某企業某一産線某一時間段擷取的鋁型材圖檔,訓練算法來定位瑕疵所在位置以及判斷瑕疵的類型。
7、弱監督學習下的工業光學檢測
《Weakly Supervised Learning for Industrial Optical Inspection》
https://hci.iwr.uni-heidelberg.de/content/weakly-supervised-learning-industrial-optical-inspection提出了一個用于統計紋理表面檢測的綜合基準語料庫。我們希望它有助于進一步發展和基準分類算法的應用于工業光學檢測。所有資料都是公開的,可以從這個頁面下載下傳。2007年DAGM研讨會的比賽,DAGM(德意志Arbeitsgemeinschaft毛皮Mustererkennung汽車集團,德國的章IAPR國際協會(模式識别)和GNSS(德國的歐洲神經網絡社會章)提供了一個開放的競争弱監督學習工業光學檢驗作為DAGM研讨會的一部分,在2007年舉行。該競賽的靈感來自于自動化光學檢測可以顯著降低工業品質控制的成本。參賽者必須設計一種分類算法:
檢測各種統計紋理背景上的各種缺陷。
學習從弱标記的訓練資料自動識别缺陷。
處理在開發時不知道其确切特征的資料。
自動調整所有參數,不需要任何人工幹預。
跑步時間适中(本比賽訓練時間為24小時,測試階段為12小時)。
考慮了假陽性和假陰性決策的不對稱成本(競賽使用1:20)。
這些資料是人工生成的,但類似于現實世界中的問題。10個資料集中的前6個,記為開發資料集,應該用于算法開發。剩下的四個資料集,被稱為比賽資料集,可以用來評估表現。研究人員應考慮在開發完成前不使用或分析競賽資料集作為榮譽準則。在下面我們提供一些關于資料集的細節:
每個開發(競賽)資料集包含1000 (2000)“無缺陷”及150 (300)“有缺陷的”圖像儲存在灰階8位PNG格式。
每個資料集由不同的紋理模型和缺陷模型生成。
“無缺陷”的圖像顯示的是沒有缺陷的背景紋理,“有缺陷”的圖像恰好在背景紋理上标注了一個缺陷。
所有資料集被随機分割成大小相等的訓練和測試子資料集。
弱标簽以橢圓的形式提供,粗略地指出缺陷區域。從技術上講,有缺陷的圖像是通過位于檔案夾“Label”中的PNG格式的單獨的8位灰階圖像來增強的。值0和255分别表示背景和缺陷區域。
8、城市路面裂縫圖像資料集
https://github.com/cuilimeng/CrackForest-datasetCrackForest資料集是一個能夠反映城市路面狀況的标注路面裂縫圖像資料庫。
9、橋梁裂縫圖像資料集
https://github.com/Charmve/Surface-Defect-Detection/tree/master/Bridge_Crack_Image該資料集主要用于訓練DBCC模型和橋梁裂縫檢測。
10、磁瓦表面缺陷資料集
《Saliency of magnetic tile surface defects》
https://github.com/Charmve/Surface-Defect-Detection/tree/master/Magnetic-Tile-Defect這是論文《Saliency of magnetic tile surface defects》的資料集。采集了6種常見磁瓦表面缺陷的圖像,并對其像素級地面真值進行标記。表面缺陷顯著性檢測工具箱可以在
https://github.com/abin24/Saliency-detection-toolbox找到。其中,我們的MCue和其他14個顯著性檢測模型是可用的。
11、鐵軌表面缺陷資料集
http://icn.bjtu.edu.cn/Visint/resources/RSDDs.aspxRSDDs資料集包含兩種類型的資料集:第一種是從快車道捕獲的I型RSDDs資料集,其中包含67個具有挑戰性的圖像。第二個是從普通/重型運輸軌道捕獲的II型RSDDs資料集,其中包含128個具有挑戰性的圖像。 兩個資料集的每幅圖像至少包含一個缺陷,并且背景複雜且噪聲很大。 RSDDs資料集中的這些缺陷已由一些專業的人類觀察員在軌道表面檢查領域進行了标記。
12、Kylberg紋理資料集
http://www.cb.uu.se/~gustaf/texture/資料集描述
28個紋理類
每個職業有160個獨特的紋理更新檔。(Alternative dataset with 12 rotation per original patch, 160*12=1920紋理patch per class)
紋理更新檔大小:576x576像素。
檔案格式:無損壓縮8位PNG格式。
對所有patch進行歸一化,均值127,标準差40。
每個紋理類一個目錄。
檔案命名如下:blanket1-d-p011-r180。png,其中blanket1為類名,d為原始圖像樣本号(可能值為a、b、c或d), p011為patch号11,r180 patch旋轉180度。