天天看點

天池資料集|精品資料集推薦(工業篇)

資料是人工智能時代重要的生産要素,高品質訓練資料對深度學習模型的建立和優化有關鍵性的作用,建立大規模、高水準的标注資料集,是推動AI科研和技術前進的驅動力。

制造業是我國國民經濟的主體,推動數字化轉型,降本增質提速是當今制造業的發展方向。天池通過舉辦大資料競賽,希望通過技術創新的方式來推動了産業的創新發展。AI模型的落地離不開高品質資料集的支撐,天池平台開放出一批高标準嚴要求下真實業務場景的資料,涵蓋紡織、食品飲料、非金屬制品等行業,小萌喵今天就帶大家一起來看看天池上開放的工業資料集。

布匹瑕疵檢測資料集

研究方向:工業質檢/目标檢測

2016年我國布匹産量超過700億米且産量一直處于上升趨勢。布料與人們日常生活接觸密切,紡織行業在我國國民經濟中所占的地位不言而喻。工廠生産時,對大量布匹的質檢通常都是勞工肉眼完成的,這種形式檢測速度慢、勞動強度大,而且受到勞工主觀因素影響,将人工智能和計算機視覺技術應用于紡織行業,可以進一步助力紡織行業的自動化,降低對人工的依賴,提升布匹疵點檢驗的準确度,提升布樣疵點質檢的效果和效率。

 天池開放布匹疵點資料集,包含瑕疵各異的布匹照片,每張照片含素色布的一個或多種瑕疵。

了解更多詳情/下載下傳使用資料集請戳:

https://tianchi.aliyun.com/dataset/dataDetail?dataId=79336
天池資料集|精品資料集推薦(工業篇)

圖1:瑕疵圖示(黃色框為瑕疵部分)

瓶裝白酒疵品檢測資料集

與布匹生産流程類似,在瓶裝酒的生産過程中,受到原材料品質(酒瓶)以及加工工藝(灌裝)等因素的影響,産品中可能存在各類瑕疵影響産品品質。但跟布匹不同的是,酒瓶上的瑕疵面積較小不容易被發現,并且瑕疵種類多,通常一條産線一般需要有三到五個質檢環節分别檢測不同類型的瑕疵。目前瓶裝酒廠家隻能選擇投入大量人力用于産品質檢。如果可以引進高效、可靠的自動化質檢可以降低大量人工成本同時提高質檢效,是非常有意義的工作。

天池提供白酒疵品資料集,資料集中白酒瓶身存在的各種瑕疵,包括:瓶蓋瑕疵、标貼瑕疵、噴碼瑕疵。

如需檢視資料集更多詳細内容請戳:

https://tianchi.aliyun.com/dataset/dataDetail?dataId=110147
天池資料集|精品資料集推薦(工業篇)

圖2:瓶蓋變形、瓶蓋壞邊示意圖

瓷磚表面暇疵檢測資料集

以抛釉磚為例的瓷磚生産環節一般經過原材料混合研磨、脫水、壓胚、噴墨印花、淋釉、燒制、抛光,最後進行品質檢測和包裝。得益于産業自動化的發展,目前生産環節已基本實作無人化。而品質檢測環節仍大量依賴人工完成。一般來說,一條産線需要配2~6名質檢工,這樣的質檢方式效率低下、質檢品質層次不齊、成本又居高不下。瓷磚的表面是使用者衡量瓷磚品質的最直覺标準,是瓷磚行業生産和品質管理的重要環節,也是困擾行業多年的技術瓶頸,同時長時間肉眼在強光下觀察瓷磚表面尋找瑕疵也對勞工的視力也會産生影響。如果能在技術上解決上述問題,無疑是有很大的經濟價值和社會意義。

為了推動AI技術應用到傳統的行業,天池推出瓷磚資料集,該資料集内含的資料覆寫到了瓷磚産線所有常見瑕疵,包括粉團、角裂、滴釉、斷墨、滴墨、B孔、落髒、邊裂、缺角、 磚渣、白邊等。還有一些缺陷隻能在特定視角才可以觀察,包括低角度光照黑白圖、高角度光照黑白圖、彩色圖,保證覆寫到生産環境中産生的所有瑕疵能被識别,是國内首個聚焦在瓷磚瑕疵質檢的資料集。資料集下載下傳請戳:

https://tianchi.aliyun.com/dataset/dataDetail?dataId=110088
天池資料集|精品資料集推薦(工業篇)

圖3:瓷磚瑕疵質檢過程

以上所有資料都是在專業人員指導下,通過産線上架設專業拍攝裝置、實地采集生産過程真實的資料,保證了資料來源的可靠性和科學性。

在資料标注過程中,達摩院的算法專家們對資料品質進行了全程把關,保證了天池資料集的品質。

關于天池資料集

天池資料集是阿裡集團的科研資料集開放平台,資料集覆寫了新零售、文娛、醫療健康、交通、安全、能源、自然科學等十多個行業,涵蓋了資料挖掘、機器學習、自然語言處理、計算機視覺、決策優化等前沿的技術領域。小夥伴們可以點選下方閱讀原文進入官網

https://tianchi.aliyun.com/dataset

進行檢視,還有更多寶藏資料等你發現。

天池資料集|精品資料集推薦(工業篇)

繼續閱讀