近日,計算機視覺A類頂級會議CVPR 2020 開幕在即, 由Kaggle承辦的FGVC(Fine-Grained Visual Categorization,細粒度圖像分類)全球挑戰賽結果揭曉,支付寶天筭安全實驗室奪冠,超越全球1316支頂尖計算機視覺團隊。Kaggle是全球最大機器學習平台。

Kaggle 2020-FGVC挑戰賽官方排名
作為人工智能核心能力,計算機視覺對細粒度圖像分類技術要求越來越高。隻有讓機器「看得」更細更準,機器的判斷才能有所突破。細粒度圖像分類針對的是更微觀的物體類别,比如,不僅要識别出它是一隻鳥,還要判斷具體屬于哪一類鳥,識别出車要判斷它的款式等。
細粒度圖像分類是計算機視覺領域極具挑戰的方向。今年,圍繞該方向Kaggle共發起六項任務,支付寶參加其中的患病植物圖像分類。比賽考察AI視覺識别技術對蘋果樹葉子圖檔進行不同種類的疾病區分能力,在訓練集1821張圖像和測試集1821張圖像中,完成高精确度的判别。
模型不僅可以準确分類,還能通過熱力圖的方式較為準确地定位到患病區域
世界上有約37萬種植物,不同植物的病因完全不同,但多數植物的病态外觀和特征卻非常相似。另一方面,采集拍攝中存在姿态、視角、光照、遮擋、背景幹擾等影響因素,使分類更加具有難度。
支付寶天筭安全實驗室使用的原創模型,是基于資料增強、知識蒸餾方法,實作在大量資訊幹擾下進行物體具像化特征識别,使細粒度識别精度大幅提升。支付寶是比賽中唯一使用知識蒸餾這種深度學習方法的團隊,在最終測試中,支付寶分數達 0.98445,排名第一。
例如,生了病的兩片樹葉,同樣出現了破損孔洞,在傳統模型訓練下,AI最多可以識别出它們都是蘋果樹的樹葉,很難确定兩個孔洞之間的差別,進而給出推斷樹葉究竟得的是哪兩種疾病。而支付寶的AI模型通過明确識别關鍵是孔洞大小、數量、位置,以及周邊是否有斑點,最終快速給出樹葉由于化學藥品濫用造成損傷的判斷。
缺乏标準資訊資料導緻難以判别的核心痛點,在醫療、金融、客服等領域大量存在,意味着這項技術擁有廣闊的應用空間。在支付寶交易糾紛、資金盜用、醫療保險報帳等場景中,AI團隊已經開始使用該技術方法,快速識别并進行更準确的風險預測,保障使用者需求在安全環境中被滿足。
人工智能是螞蟻集團核心技術引擎之一,研究領域涵蓋NLP、計算機視覺、智能風控、智能營銷、智能資金管理等,并在大規模分布式機器學習、深度圖學習、多方安全與隐私計算、博弈與對抗智能、多智能體、強化學習等方向取得突破。螞蟻集團首席AI科學家 、達摩院金融智能負責人漆遠帶領的全球化團隊,在深度賦能螞蟻各條業務的同時,相繼在國際人工智能頂級會議NeurIPS、ICML 、AAAI等,發表近60篇高品質論文成果,申報了超200個專利。
作為一家創新型科技公司,螞蟻集團(支付寶母公司)科技戰略程序不斷加速。除AI之外,在區塊鍊、資料庫等領域近期也頻現突破性進展。日前,螞蟻集團将資料庫業務OceanBase升格為獨立公司,未來三年計劃服務全球客戶超萬家;螞蟻區塊鍊的跨鍊技術在獲得專利授權的同時,還被全球最大專業技術組織IEEE認定為國際标準。目前,螞蟻集團員工中,技術人員占比已經超過63%。