天天看點

圖像分類相關優質開源資料集彙總(附下載下傳連結)

導    讀

為了幫助大家更好的學習,極市平台彙總整理了優質的開源資料集資源,本文為圖像分類相關的開源資料集,均附有下載下傳連結。

其他相關資料集精選:​

​​醫學圖像開源資料集彙總​​

​​醫學圖像開源資料集彙總(二)​​

​​自動駕駛方向開源資料集資源彙總​​

​​自動駕駛方向開源資料集資源彙總(二)​​

​​15個目标檢測開源資料集彙總​​

​​人體姿态估計相關開源資料集介紹及彙總​​

​​小目标檢測相關開源資料集介紹及彙總​​

​​90+深度學習開源資料集整理|包括目标檢測、工業缺陷、圖像分割等多個方向​​

花卉資料集

資料集下載下傳位址:http://m6z.cn/6rTT7n

該資料集包含 4242 張花卉圖像。資料收集基于資料flicr、google images、yandex images。此資料集可用于從照片中識别植物。資料圖檔會分為五類:洋甘菊、郁金香、玫瑰、向日葵、蒲公英。每個種類大約有800張照片。照片分辨率不高,約為 320x240 像素。照片不會縮小到單一尺寸,它們有不同的比例。

圖像分類相關優質開源資料集彙總(附下載下傳連結)

綜合汽車資料集

資料集下載下傳位址:http://m6z.cn/6rTTar

該資料集是被CVPR 2015 論文“用于細粒度分類和驗證的大規模汽車資料集”所使用的。綜合汽車 (CompCars) 資料集包含來自兩個場景的資料,包括來自網絡自然和監視自然的圖像。web-nature 資料包含 163 個汽車制造商和 1,716 個汽車型号。總共有 136,726 張拍攝整車的圖像和 27,618 張拍攝汽車零件的圖像。完整的汽車圖像标有邊界框和視點。每個車型都标有五個屬性,包括最大速度、排量、門數、座位數和汽車類型。監控性質的資料包含在前視圖中捕獲的 50,000 張汽車圖像。

圖像分類相關優質開源資料集彙總(附下載下傳連結)

室内場景識别

資料集下載下傳位址:http://m6z.cn/5PCpJ5

該資料集是麻省理工學院提供的原始資料。室内場景識别是高層次視覺中一個具有挑戰性的開放性問題。大多數适用于室外場景的場景識别模型在室内領域表現不佳。主要困難在于,雖然一些室内場景(例如走廊)可以通過全局空間屬性很好地表征,但其他的(例如書店)可以通過它們包含的對象更好地表征。更一般地說,為了解決室内場景識别問題,我們需要一個可以利用局部和全局判别資訊的模型。該資料庫包含 67 個室内類别,共 15620 張圖像。圖檔的數量因類别而異,但每個類别至少有 100 張圖檔。所有圖檔均為jpg格式。

圖像分類相關優質開源資料集彙總(附下載下傳連結)

90種動物圖像資料集

資料集下載下傳位址:http://m6z.cn/6rTTbJ

在這個資料集中有 90 個不同類别的 5400 張動物圖像。此資料集是從 Google 圖檔建立的:https://images.google.com/。所有照片将按照其所屬類别存放于各自的檔案夾下。動物類别包括:羚羊,獾,蝙蝠,熊,蜜蜂,甲蟲,野牛,公豬,蝴蝶,貓 毛蟲,黑猩猩等。該資料集中的圖像大小不固定,可能需要後續的處理。

圖像分類相關優質開源資料集彙總(附下載下傳連結)

飛機資料集

資料集下載下傳位址:http://m6z.cn/5X8CPy

資料集包含 10,000 張飛機圖像,資料分為 3334 個訓練圖像、3333 個驗證圖像和 3333 個測試圖像。

圖像分類相關優質開源資料集彙總(附下載下傳連結)

衣服資料集

資料集下載下傳位址:http://m6z.cn/64EPUp

衣服資料集總共收集了 20 種衣服的 5,000 張圖像。該資料集是根據公共領域許可 (CC0) 釋出的。我們使用了三種不同的方式來收集資料集:Toloka——衆包平台;社交媒體上的網絡衆包計劃;Tagias——一家專門從事資料收集的公司。标簽是使用 IPython 小部件手動完成的,同時我們使用簡單的神經網絡糾正了标簽錯誤。

資料集包含 20 個類,包括T 恤(1011 件),長袖(699 件),褲子(692 件),鞋子(431 件)襯衫(378 件),連衣裙(357 件),外套(312 件),短褲(308 件),帽子(171 件),裙子(155 件),西裝外套(109 件)等。

圖像分類相關優質開源資料集彙總(附下載下傳連結)

商标資料集

資料集下載下傳位址:http://m6z.cn/6cb2HG

在這項工作中,我們建構了一個大規模的 logo 資料集 Logo-2K+,它涵蓋了來自真實世界 logo 圖像的各種 logo 類别。我們生成的徽标資料集包含 167,140 張圖像,具有 10 個根類别和 2,341 個類别。

圖像分類相關優質開源資料集彙總(附下載下傳連結)

Office-Home資料集

資料集下載下傳位址:http://m6z.cn/5I6cFG

Office-Home 是一個用于域适應的基準資料集,它包含 4 個域,每個域由 65 個類别組成。這四個領域是:藝術——素描、繪畫、裝飾等形式的藝術形象;剪貼畫——剪貼畫圖像的集合;産品——沒有背景的物體圖像;和真實世界——用普通相機拍攝的物體圖像。它包含 15,500 張圖像,平均每個類大約 70 張圖像,一個類最多 99 張圖像。

圖像分類相關優質開源資料集彙總(附下載下傳連結)

食物圖像資料集

資料集下載下傳位址:http://m6z.cn/6rdsSw

該資料集包含完整 food-101 資料的許多不同子集。為了給圖像分析制作一個比 CIFAR10 或 MNIST 更簡單的訓練集,該資料包括圖像的大規模縮小版本,以實作快速測試。資料已被重新格式化為 HDF5,特别是 Keras HDF5Matrix,這樣可以輕松讀取它們。檔案名表示檔案的内容。例如

foodc101n1000_r384x384x3.h5 表示有 101 個類别,n=1000 圖像,分辨率為 384x384x3(RGB,uint8) foodtestc101n1000r32x32x1.h5 表示資料是驗證集的一部分,代表 101 個類别,n=1000 圖像,分辨率為 32x32x1(float32 從 -1 到 1)

使用該資料集的第一個目标是對未知圖像進行分類,但除此之外,還可以檢視哪些區域/圖像元件對進行分類很重要,将新類型的食物識别為現有标簽的組合,建構對象檢測器,可以在整個場景中找到相似的對象。

圖像分類相關優質開源資料集彙總(附下載下傳連結)

本文僅做學術分享,如有侵權,請聯系删文。​

下一篇: 開博說明