天天看點

曠視聯合智源釋出全球最大物體檢測資料集Objects365,舉辦CVPR DIW2019挑戰賽

北京智源人工智能研究院(簡稱「智源研究院」)是在科技部和北京市委市政府的指導和支援下,由北京市科委和海澱區政府推動成立,依托北京大學、清華大學、中國科學院、百度、小米、位元組跳動、美團點評、曠視 MEGVII 等北京人工智能領域優勢機關共建的新型研發機構。

引進培育高端人才、共建聯合實驗室、建設人工智能社群、加強産學研合作,是智源研究院的主要四項任務。

智源研究院聯合曠視,

成立智能模型設計與圖像感覺聯合實驗室

智源聯合實驗室分為兩類,分别是與高校院所共建、與優勢企業共建。在聯合實驗室的建設上,智源研究院遵循「成熟一個、啟動一個」的原則,擇優支援共建,最多可連續支援三年。

「北京智源-曠視智能模型設計與圖像感覺聯合實驗室」已認證立項論證,成為北京智源聯合實驗室首個成功落地的項目,拟由曠視首席科學家、曠視研究院院長孫劍任實驗室主任,資深研究員周舒暢任實驗室副主任。

曠視聯合智源釋出全球最大物體檢測資料集Objects365,舉辦CVPR DIW2019挑戰賽

曠視首席科學家、曠視研究院院長孫劍

孫劍表示,成立這個實驗室,既有國家戰略層面的考慮,也是為了解決行業痛點。

2017 年 7 月,國務院釋出《新一代人工智能發展規劃》,人工智能上升為國家戰略。建立開源開放的人工智能開放創新平台,服務企業應用技術開發成為目前該領域的難點。

國家也希望龍頭企業,通過打造人工智能開源開放創新平台,調動産學研,社會各類創新創業主體參與共同打造我國自主知識産權的産業生态,提升國際影響力,促進行業整體發展。

而北京市是第一個國家新一代人工智能創新發展試驗區,是以希望充分調動北京技術、人才方面優勢,通過組織機制創新,通過創新舉措,依托龍頭行業牽引進行多主體協同創新,打造我國乃至全球技術高地。

現在确實有大量的高校、研究院所、創新創業人員和行業客戶,想參與到人工智能創新中,但苦于沒有資料,算力或算法等資源,無法施展。

是以,曠視與智源研究院通過聯手打造資料集和建設聯合實驗室,推動整個行業協同創新發展,建設共性技術開放創新平台,建構自主可控産業生态,突破人工智能重大核心共性關鍵技術,推動行業全面演進。

全球最大的物體檢測資料集 Objects365 釋出

會上,曠視研究院聯合北京智源人工智能研究院釋出了全球最大的物體監測資料集 Objects365。

曠視聯合智源釋出全球最大物體檢測資料集Objects365,舉辦CVPR DIW2019挑戰賽

Objects365 樣例

「我們的目的是打造世界上最大規模的通用物體資料檢測集,做到規模大、品質高、泛化能力強。」

孫劍介紹,「我們第一批定義在生活中最常見的 365 個類别,比如,室内常見的椅子、桌子、茶杯、瓶子都包含在這個類别中。第一階段,我們已經标注了超過 60 萬張這樣的圖檔,其中這些标注框已經超過了 1000 萬。」

這個資料集有多大?孫劍将微軟 2014 年建立的大規模圖像物體檢測資料集 COCO 作為參照物,将二者進行了對比,「COCO 是目前最大的、全标注資料集,訓練資料大概 12 萬,總共資料大概不超過 20 萬,其中還有很多資料沒有标。我們(Objects365)第一期開放(的)圖檔數是 COCO 的 5 倍,标注框超過 COCO 的 11 倍。」

曠視聯合智源釋出全球最大物體檢測資料集Objects365,舉辦CVPR DIW2019挑戰賽

「我們的目标是,三年内,這個資料集達到 200 萬張圖檔,2400 萬個标注框。」孫劍說。

算法優化的上限嚴重依賴于基準資料集術的品質。為保證标注品質,在打造 Objects365 時,曠視設計出一套科學而嚴格的标注流程,每一張圖檔的背後至少會經過 9 名标注勞工之手。

此外,作為一個優秀的預訓練資料集,Objects365 預訓練模型在使用過程中,可以輕松超越現有算法的精度,顯著加速收斂過程,表現出極強的泛化能力。在執行 COCO、VOO Det、CityPersons 等檢測任務時,在 VOC Seg 和 ADE 等分割任務上均有顯著提升。

如何共建聯合實驗室?

「一個平台、四個突破點」

「北京智源-曠視智能模型設計與圖像感覺聯合實驗室 将圍繞『一個平台、四個突破點』進行建設。」孫劍介紹道。

「一個平台」是指,建設一體化的資料共享、模型設計和場景測試的開放創新平台。

「四個突破點」是指,在資料方向、模型方向、真實資料測試方向和模型部署方向做技術突破,推進大資料背景下模型架構設計、優化和部署等方面的研究。

「深度學習成不成功,很大程度上取決于資料,很多靠算法帶來的提升遠低于一個高品質的資料(集)所能帶來的提升。」孫劍說。

除了最新釋出的 Objects365,曠視此前還釋出了大規模擁擠場景人體檢測資料集 CrowdHuman 及一些資料标注工具。

實驗室将立足曠視算法落地場景豐富、資料積累深厚的優勢,以開源資料集、預抽取特征等形式,持續開放通用物體分類、物體檢測追蹤、人像人形識别屬性等視覺問題資料,助力相關領域研究。

針對高搜尋效率、高準确率、高靈活性等關鍵名額,該實驗室還将開展支援大計算量模型的新神經網絡架構搜尋算法(NAS)研究,建構一站式深度模型自動化設計平台等工作。

該平台包括面向特定問題的自動化深度模型設計工具、自動化資料篩選/資料增強工具、自動化深度學習模型優化工具,進而在 Object365 上實作自動訓練比純人工調優精度超過至少一個百分點,消耗卡時不超過三倍的目标。

實驗室還将開放衆多預訓練模型,包括 ResNet、ShuffleNet 這樣的基礎模型以及 Faster RCNN、Mask RCNN、SSD 檢測模型。

近年來,模型架構搜尋(NAS)成為了 AI 領域的熱門研究方向。

不久前,曠視首次披露了 NAS 新成果:單路徑 One-Shot 模型。這是一個簡單靈活的通用模型搜尋架構,支援建構塊(building block)、通道(channel)和混合精度(mixed-precision)多搜尋空間聯合搜尋;支援任意直接度量方法做硬限制(hard constraint),進而滿足實際業務要求。據介紹,同等情況下,單路徑 One-Shot NAS 的搜尋精度和速度均超過目前公開的 FBNet、ProxylessNAS 等 SOTA 架構。

「很多時候,我們把一個技術(算法)落地,真的是不是能在實際資料中做得很好,其實不知道的。實際資料中有一些是非公開資料,不能到真正的場景中去測;另外一些資料涉及到隐私,需要脫敏。」孫劍說,聯合實驗室的計劃是,提供一個實戰場景開發和測試環境,大家上交模型,在這個環境中進行測試。

聯合實驗室将建設人臉抓拍識别、結構化檢測、大規模人像比對等驗證場景,提供自動分析報告服務,為研究算法調優提供環境。他們還将積極探索低位寬等網絡壓縮技術,研發高效硬體部署方案,推動模型研究成果迅速投入實用。

針對計算機視覺算法與真實場景适配的問題,實驗室還将建設可重制的實景測試環境,并提供自動化的量化錯誤分析報告,幫助算法疊代。

「通過以上措施,實驗室将被打造成為一個開放、貼近實際場景的計算機視覺算法研究實驗平台,形成涵蓋資料、平台、場景的完整閉環,有利于打造我國自主可控的技術和産業生态,共同助力我國圖像感覺和計算領域的技術及應用達到國際先進水準。」孫劍表示,實驗室平台建成後,将面向高校院所、創業企業等創新創業主體開放,緻力推動圖像感覺與計算領域的協同創新。

DIW2019 挑戰賽啟動,

3 個賽道冠軍将各獲 1 萬美金獎勵

「我們的目标是建設開源社群、打造産業生态。」孫劍說。

除了開放預訓練模型,開源資料标注、模型分析、模型自動調優等全套相關工具,他們還将提供實驗例程、開源完整的訓練代碼庫,支援高校大學及研究所學生教學,每年教育訓練學生人數不少于 500 人;每年還會組織圍繞平台的國際比賽。

今年,曠視聯合智源研究院舉辦 Detection In the Wild 2019(DIW 2019)挑戰賽。

孫劍介紹,DIW 2019 挑戰賽是基于 2019 年 CVPR 的 workshop(研讨會),為了推動目标檢測技術的發展而設計的,可以改善現有目标檢測資料集的類别覆寫不全,标注精度不高,密集場景缺少等問題。

DIW 2019 挑戰賽共有三個賽道:

  1. Objects365 賽道:選手利用公開的 365 種類别,60 萬張圖檔超過 1000 萬個框的完整訓練集對檢測模型進行訓練;在 3 萬張圖檔構成的驗證集上調試算法,并在 10 萬張圖檔構成的測試集上進行最終挑戰。
  2. Objects365 小賽道:從 Objects365 資料集中挑選出 65 個類别,選手可以用 1 萬張圖檔進行模型訓練。
  3. CrowdHuman 賽道:為了解決現實生活中的遮擋問題,其算法的提升将會推動人體檢測算法落地。屆時,選手将基于專門為了密集場景人體檢測設計的 CrowdHuman 資料集進行訓練,資料集包含有豐富标注資訊和多種場景。

挑戰賽已于釋出會當天啟動;5 月 10 日,将開放測試集;6 月 12 日,結果送出截止;最終結果将在 6 月 17 日(美國當地時間)公布。每個賽道的冠軍将獲得 1 萬美金獎勵,優勝隊伍将被邀請至 CVPR 的研讨會上做經驗分享。

「智源學者計劃」啟動,

每人每年至少可獲 50 萬支援

釋出會當天,智源研究院還啟動了「智源學者計劃」。

「『智源學者計劃』的目标,就是要找到最好的人,給他自由支配的經費,提供他需要的資源,支援開展人工智能領域特定方向上的重大基礎問題研究,或者開展前沿問題的自由探索。」黃鐵軍院長說。

「智源學者計劃」将依托北京大學、清華大學、中科院等優勢高校院所,以及曠視等骨幹企業研究院,對智源科學家首席(CS)、智源研究項目經理(PM)、智源研究員(PI)和智源青年科學家(38 歲以下)四類人才進行重點支援。

經過提名、初評、審議等流程,已經遴選出首批智源學者候選人,共 21 人,并即将啟動公示程式。

據悉,首批青年科學家推選工作開展以來,清華、北京各機關專家共計推選了 54 名候選人,參加答辯 42 人,經專家評審,最終選出了 9 名。年級最輕的一位僅 28 歲,是曠視研究院模型研究組負責人張祥雨博士。

在官網上進行一個月公示後,若無意外,智源研究院将與他們簽訂聘任協定。

屆時,智源研究院将直接向他們支付費用,不用走機關的人事體制。黃院長說,「我們看重他是一個有潛力的人,我們就直接給他,大概就是不低于 50 萬的每年的支援力度(每個人)。」

這些智源學者不需要在智源研究院辦公,還在原機關繼續從事學術研究, 成果也全部屬于其所在機關,「研究院不擁有也不期望去獲得任何知識産權」,「因為他做的是人工智能,是符合國家的戰略方向,是符合北京市的方向,是以我們給他支援。」黃院長說。

此外,這些智源學者在科研工作中所需要的經費,也會獲得研究院支援。黃院長表示,隻要不用到違規,怎麼用,完全由自己決定。

黃院長還表示,智源學者的申報不是每年隻有一次,而是不分批次,隻要是符合要求的人才,通過申報程式,可以随時進入研究院支援的範圍。

曠視聯合智源釋出全球最大物體檢測資料集Objects365,舉辦CVPR DIW2019挑戰賽

今年,智源研究院将計劃遴選智源學者 100 人,大概覆寫 5 到 7 個重大方向,其中,青年科學家 30-50 人。2020 年和 2021 年再分别增加 100 人,智源學者總體規模保持在 300 人左右。

本文為機器之心報道,轉載請聯系本公衆号獲得授權。

繼續閱讀