“自動駕駛技術的進步需要大量優質資料對模型進行不斷地訓練與調優。想要自動駕駛技術更好地發展,需要大量高品質的真實自動駕駛系統相關的資料做支撐。資料作為AI技術的底層基礎,高品質的資料集更受到廣大自動駕駛車企的重視”
資料是自動駕駛發展過程中必不可少的一部分,優質的資料集往往能更好地對自動駕駛算法模型進行訓練和調優。景聯文科技整理了五個自動駕駛相關開源資料集,供大家參考使用。
1.CityScapes資料集
CityScapes是由奔馳自動駕駛實驗室、馬克思·普朗克研究所、達姆施塔特工業大學聯合釋出的一個城市街景資料集,該資料集主要是對城市街景的語義了解,包含德國及附近國家的50個不同的城市,在不同的季節和天氣條件下的街景中記錄的各種立體視訊序列。
2.H3D-HRI-US資料集
該資料集是由本田研究所于2019年3月釋出的資料集,使用3D LiDAR掃描器收集的大型全環繞3D多目标檢測和跟蹤資料集。資料集包含160個擁擠且高度互動的交通場景,有27721幀,共100萬個标記執行個體,擁有豐富的注釋和複雜的場景,可用于對全環繞3D多目标檢測和跟蹤的研究。
3.Mapillary Vistas資料集
Mapillary Vistas是世界上最大、最多樣化的街道級圖像公開資料集,包括25000張高分辨率的彩色圖像,分成66個類,其中有37個類别是特定的附加于執行個體的标簽。
該資料集具體涵蓋了66類共25000個高分辨率街景場景圖像資料集,帶有大于200萬個手動繪制多邊形的像素标注;100個目标類别,其中60個特定于執行個體;覆寫北美和南美,歐洲,非洲,亞洲和大洋洲等地區;包含太陽,雨,雪,霧,陰霾等天氣條件;包含黎明,白天,黃昏,夜晚等拍照時間;擁有大範圍的相機傳感器,不同的焦距,圖像寬高比和不同類型的相機噪聲;來自道路,人行道等不同的拍照地點。
4.COCO資料集
COCO資料集是微軟團隊提供的用來進行目辨別别、圖像分割等任務的資料集,分為訓練、驗證和測試集。COCO資料集有如下幾個特點:目标分割、上下文識别、超像素分割、330000張圖像、150萬個對象執行個體、80個對象類别、91個物品類别、每個圖像5個字幕、250,000包含關鍵點的人。
COCO資料集支援目标檢測、執行個體分割、全景分割、關鍵點檢測等任務類型。圖檔格式均為JPG格式,其中目标檢測執行個體分割任務對應的圖像類别為80類,全景分割任務新增圖像類别53類。
5.Level 5
Level 5資料集是一個全面的、大規模的資料集,内含55000個3D标注架構,是一個高清空間語義地圖。資料集具有原始傳感器攝像頭和雷射雷達輸入,由多個高端自動駕駛車輛組成的車隊在一個受限制的地理區域采集環境資料。資料集還包括人類标記的交通标志的三維邊界框,一個底層的高清空間語義地圖。
想了解更多資料集資訊及擷取方式,關注景聯文科技。
景聯文科技|AI基礎資料服務|資料采集|資料标注|假指紋制作|指紋防僞算法
助力人工智能技術加速數字經濟相關産業品質變革,賦能傳統産業智能化轉型更新