天天看點

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

編輯丨極市平台

FruitNet水果分類/識别資料集

下載下傳連結:http://suo.nz/2Cfo4y

需要高品質的水果圖像來解決水果分類和識别問題。要建構機器學習模型,整潔幹淨的資料集是基本要求。為了這個目标,我們建立了名為“FruitNet”的六種流行印度水果的資料集。該資料集包含 6 種不同類别水果的 14700 多張經過處理的格式的高品質圖像。圖像分為 3 個子檔案夾 1) 優質水果 2) 劣質水果和 3) 混合品質水果。每個子檔案夾包含 6 個水果圖像,即蘋果、香蕉、芭樂、酸橙、橙子和石榴。使用具有高端分辨率相機的手機來捕捉圖像。這些圖像是在不同的背景和不同的光照條件下拍攝的。建議的資料集可用于訓練,水果分類或重組模型的測試和驗證。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

衛星圖像分類

下載下傳連結:http://suo.nz/2D00yp

衛星圖像分類資料集-RSI-CB256,該資料集有 4 個不同的類别,混合了傳感器和谷歌地圖快照

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

intel 自然風光圖像分類資料集

下載下傳連結:http://suo.nz/2KwdmY

這是世界各地自然風光的圖像資料。

内容:此資料包含分布在 6 個類别下的大約 25,000 張大小為 150x150 的圖像。{'建築物'-> 0, '森林'-> 1, '冰川'-> 2, '山'-> 3, '海'-> 4, '街道'-> 5}

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

建築遺産元素圖像資料集

下載下傳連結:http://suo.nz/2RmsZl

Architectural Heritage Elements Dataset (AHE) 是一個圖像資料集,用于開發深度學習算法和建築遺産圖像分類中的特定技術。該資料集包含 10235 張圖像,分為 10 個類别:祭壇:829 張圖像;後殿:514 張圖檔;鐘樓:1059張圖檔;欄目:1919張圖檔;圓頂(内部):616 張圖像;圓頂(外部):1177 張圖像;飛扶壁:407張圖檔;Gargoyle(和 Chimera):1571 張圖像;彩色玻璃:1033 幅圖像;保險庫:1110 張圖像。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

貝殼或鵝卵石:圖像分類資料集

下載下傳連結:http://suo.nz/2YSG42

資料集包含兩個類:貝殼或卵石。該資料集可用于二進制分類任務,以确定某個圖像是貝殼還是鵝卵石。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

DeepWeeds 雜草類型分類資料集

下載下傳連結:http://suo.nz/2OmaTQ

資料集包含 17,509 張圖像,這些圖像捕捉了八種原産于澳洲的不同雜草以及鄰近的植物群。標明的雜草品種是昆士蘭州牧草地的本地品種。它們包括:“中國蘋果”、“蛇草”、“馬纓丹”、“刺金合歡”、“暹羅草”、“白花菊”、“橡膠藤”和“帕金森屬植物”。這些圖像是從昆士蘭以下地點的雜草侵擾中收集的:“Black River”、“Charters Towers”、“Cluden”、“Douglas”、“Hervey Range”、“Kelso”、“McKinlay”和“Paluma”。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

仙人掌航拍圖檔資料集

下載下傳連結:http://suo.nz/2VSnYx

在此資料集中,展示了 16,000 多個用于植物識别或分類的柱狀仙人掌 (Neobuxbaumia tetetzo) 示例。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

農作物圖像分類(小麥、睡到、甘蔗、玉米等)

下載下傳連結:http://suo.nz/33oB1C

資料集(作物圖像)包含每種農業作物(玉米、小麥、黃麻、水稻和甘蔗)的 40 多張圖像 資料集(kag2)包含每類作物圖像的 159 多張增強圖像。增強包括水準翻轉、旋轉、水準平移、垂直平移。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

5種不同的水稻圖像資料集

下載下傳連結:http://suo.nz/349aVN

使用了 Arborio、Basmati、Ipsala、Jasmine 和 Karacadag 水稻品種。• 資料集(1) 有75K 幅圖像,包括每個水稻品種的15K 幅圖像。資料集(2)有 12 個形态特征、4 個形狀特征和 90 個顔色特征。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

闆球-足球-棒球分類

資料集下載下傳連結:http://suo.nz/33juP6

該資料集包含 252 張打闆球、踢足球和打棒球的圖像。主檔案夾中有 3 個子檔案夾 (1) cricket (2) football (3) baseball (cricket-football-baseball)。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

垃圾分類資料集

資料集下載下傳連結:http://suo.nz/3gb5Jj

該資料集包含來自 12 個不同類别的生活垃圾的 15,150 張圖像;紙、紙闆、生物、金屬、塑膠、綠色玻璃、棕色玻璃、白色玻璃、衣服、鞋子、電池和垃圾。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

花卉資料集

資料集下載下傳位址:http://suo.nz/2fGKVt

該資料集包含 4242 張花卉圖像。資料收集基于資料flicr、google images、yandex images。此資料集可用于從照片中識别植物。資料圖檔會分為五類:洋甘菊、郁金香、玫瑰、向日葵、蒲公英。每個種類大約有800張照片。照片分辨率不高,約為 320x240 像素。照片不會縮小到單一尺寸,它們有不同的比例。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

90種動物圖像資料集

資料集下載下傳位址:http://suo.nz/2ncY0a

在這個資料集中有 90 個不同類别的 5400 張動物圖像。此資料集是從 Google 圖檔建立的:https://images.google.com/。所有照片将按照其所屬類别存放于各自的檔案夾下。動物類别包括:羚羊,獾,蝙蝠,熊,蜜蜂,甲蟲,野牛,公豬,蝴蝶,貓 毛蟲,黑猩猩等。該資料集中的圖像大小不固定,可能需要後續的處理。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

衣服資料集

資料集下載下傳位址:http://suo.nz/2uJaOJ

衣服資料集總共收集了 20 種衣服的 5,000 張圖像。該資料集是根據公共領域許可 (CC0) 釋出的。我們使用了三種不同的方式來收集資料集:Toloka——衆包平台;社交媒體上的網絡衆包計劃;Tagias——一家專門從事資料收集的公司。标簽是使用 IPython 小部件手動完成的,同時我們使用簡單的神經網絡糾正了标簽錯誤。

資料集包含 20 個類,包括T 恤(1011 件),長袖(699 件),褲子(692 件),鞋子(431 件)襯衫(378 件),連衣裙(357 件),外套(312 件),短褲(308 件),帽子(171 件),裙子(155 件),西裝外套(109 件)等。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

商标資料集

資料集下載下傳位址:http://suo.nz/2CfnTq

在這項工作中,我們建構了一個大規模的 logo 資料集 Logo-2K+,它涵蓋了來自真實世界 logo 圖像的各種 logo 類别。我們生成的徽标資料集包含 167,140 張圖像,具有 10 個根類别和 2,341 個類别。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

食物圖像資料集

資料集下載下傳位址:http://suo.nz/2D00oT

該資料集包含完整 food-101 資料的許多不同子集。為了給圖像分析制作一個比 CIFAR10 或 MNIST 更簡單的訓練集,該資料包括圖像的大規模縮小版本,以實作快速測試。資料已被重新格式化為 HDF5,特别是 Keras HDF5Matrix,這樣可以輕松讀取它們。檔案名表示檔案的内容。例如

foodc101n1000_r384x384x3.h5 表示有 101 個類别,n=1000 圖像,分辨率為 384x384x3(RGB,uint8) foodtestc101n1000r32x32x1.h5 表示資料是驗證集的一部分,代表 101 個類别,n=1000 圖像,分辨率為 32x32x1(float32 從 -1 到 1)

使用該資料集的第一個目标是對未知圖像進行分類,但除此之外,還可以檢視哪些區域/圖像元件對進行分類很重要,将新類型的食物識别為現有标簽的組合,建構對象檢測器,可以在整個場景中找到相似的對象。

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

更多資料集分類資源下載下傳:https://www.cvmart.net/dataSets

16個圖像分類方向開源資料集資源彙總(附下載下傳連結)

繼續閱讀