華為雲到底用AI做了什麼？從少坐一趟機場擺渡車談起

你坐飛機的時候有沒有想過一個問題：「為什麼我坐的飛機總是不靠廊橋，還要拿着行李去擠擺渡車？」

通常，相關人員會告訴你：廊橋資源比較珍貴，是以飛機靠橋的幾率要低于停在遠機位的幾率。

其實，這個答案隻說出了一部分原因。随着機場航班數量的不斷增加，「靠橋率」成為了衡量機場運作管理水準的重要名額。要在這個名額上有所提高，除了改善硬體之外，「排程」也是一個突破口。在國内，深圳機場率先找準了這個「突破口」。深圳機場的廊橋機位與遠機位的比例為 1:3。按照這個比例，很大一部分乘客都需要乘坐擺渡車。那麼，如何讓更多的航班停靠在廊橋呢？深圳機場給出的解決方案是：AI 智能排程。在 2018 年之前，深圳機場使用的排程方案主要是人工和系統配合的，每天 1000 多個航班的機位配置設定需要花掉 4 個小時。從 2018 年 11 月開始，深圳機場開始建設機位資源智能配置設定系統，2019 年正式上線。該系統将靠橋率提升了 10 個百分點，每個廊橋每天能多保障一個航班，一年之内為 400 萬旅客省去了坐擺渡車的麻煩。同時，它還将機位配置設定的時間縮短為 1 分鐘。

在剛剛結束的華為雲 TechWave 人工智能專題日上，華為雲人工智能領域首席科學家、IEEE Fellow 田奇向我們講述了華為雲 EI 運用 AI 技術帶來的諸多智能化變革，深圳機場智能機位配置設定隻是其中的一個例子。類似的例子還有很多，比如通過智能調配路上的信号燈縮短停車等待時間、利用智能防暴力卸貨方案防止從業人員對快遞進行暴力分揀等。

華為雲人工智能領域首席科學家、IEEE Fellow 田奇

AI 是一個需要長期積累的行業，事實上華為早就開始了 AI 相關研究，但一直比較低調，諾亞方舟等實驗室也很少出現在「台前」。與之形成鮮明反差的是，華為手機的 AI 技術卻屢次成為大衆熱議的話題。近幾年，華為雲全棧全場景 AI 強大的行業落地能力，在華為雲 EI 企業智能展現得淋漓盡緻。雖然成立還不到三年，華為雲 EI 已經在 10 多個行業的 600 多個項目探索和落地。

而這一切，都離不開 AI 基礎研究的支撐。

作為一個橫跨學界和業界的研究者，田奇博士的加入為華為雲 EI 的基礎研究制定了新的規劃。在他的帶領下，華為雲 EI 将專注于計算機視覺、決策優化和語音語義三大方向，并于近期在這三個方向上取得了多項世界第一的成績。

計算機視覺：頂會論文近百篇，登頂 ImageNet、COCO 等權威資料集

計算機視覺是 AI 領域應用最廣泛的技術之一，很多行業痛點都可以通過計算機視覺算法來解決，如道路擁堵診斷分析等。為了解決這些痛點，田奇博士帶領的視覺研究團隊從圖像分類、檢測、分割、多模态資料處理等多個方向入手，在基礎研究領域取得了多項突破，有近百篇論文被 ICCV、ECCV、CVPR 等頂會收錄。

圖像分類：登頂 ImageNet、WebVision 資料集

作為人類最基本的能力，大腦可以對眼睛看到的常見目标進行精準的識别，比如貓、狗、車等。但是，由于每個人知識的局限性，常人很難完成成千上萬類的物體識别。

為了解決這個問題，華為視覺團隊從 2019 年年底開始發力，自研出了基于知識蒸餾與資料增強的分類算法，大幅提升了圖像分類的性能。今年 3 月份，在 ImageNet-1000 大規模圖像分類資料集上，該團隊的 EffNet+CAKD 算法 top-1 精度達到了 85.8%，超越了長期以來霸榜的谷歌。

其實，圖像分類并沒有看起來那麼簡單，标注資料中會存在很多噪聲。在這些噪聲的「誤導」下，模型很容易出錯。

為了讓 AI 像人類一樣更魯棒地去處理有噪聲資料的任務，華為視覺團隊提出了新的 AI 模型學習範式，旨在提升 AI 模型對資料中錯誤樣本的容忍度。

在由蘇黎世聯邦理工、Google Research、卡内基梅隆大學等共同組織的人工智能「世界杯」——WebVision 大規模網絡圖像資料識别競賽中，華為以 82.97% 的精度擊敗了來自世界各地的 94 支參賽隊伍，達到業界第一。

在無監督學習方面，華為視覺團隊自研的無監督學習算法在無标簽的 ImageNet 資料集上達到了 72.4% 的精度，比 Facebook 何恺明組的 MOCO v2（71.1%）還要高出 1.3 個百分點。

圖像檢測與分割：登頂 COCO 資料集

不同于圖像分類技術，圖像檢測和分割旨在讓計算機可以像人一樣識别到圖檔中更高層次的語義資訊，比如檢測目标的位置、了解目标的互相關系等。

為了解決這一類問題，華為視覺團隊自研了自适應資料增強技術，在包含 16 萬張圖像的 COCO 資料集上實作了單模型 56.8%、多模型 58.8% 的檢測精度，兩項名額均達到了世界第一，打破了谷歌等公司在該領域多年的壟斷。

在這次疫情的大考中，原來隻能依靠人類專家完成的新冠肺炎檢測任務，華為雲依靠領先的圖像分割技術實作了肺炎更精準、更快速的檢測，可以達到 CT 量化結果秒級輸出，大大提升了輔助診療的品質和效率。

多模态資料處理：登頂 NuScenes 資料集

前面提到的圖像分類、檢測、分割等都是相對獨立的任務，但在現實生活中，人們處理的往往是多個次元、多個模态的資料（如聊天時同時面對人臉和聲音），計算機也不例外。

為了挖掘和整合不同模态資料之間的知識，華為視覺團隊提出了圖像底層資訊融合技術，來處理語義分割資訊和雷射點雲等多模态資料。在全世界最大規模的 3D 目标檢測資料集 NuScenes 上，該團隊擊敗了來自世界各地的 92 支隊伍，達到了 64.2% 的檢測精度，取得業界第一，領先第二名 3.1%。

在該項多模态技術的推動下，華為雲 EI 提出了交通智能體，來解決「你今天堵車了嗎」這個靈魂質問。

這些成果的取得和田奇博士的加入不無關系。田奇博士畢業于伊利諾伊大學香槟分校，師從計算視覺之父 Thomas S．Huang 教授。在加入華為之前，他在德州大學聖安東尼奧分校任教 17 年。目前，他已累計發表文章超過 550 篇，其中 250 多篇入圍 IEEE TPAMI、IJCV、CVPR/ICCV/ECCV、NeurIPS 等國際頂級期刊和會議。

在 2018 年加入華為之後，田奇博士迅速适應了學界和業界的巨大差異，認識到「工業界更注重于商業價值以及方法的實用性，針對某一個特定的問題，提升使用者體驗，帶來實際的價值」。在這種信念的指引下，他帶領華為的視覺團隊取得了多項基礎研究突破，并将其落地到華為雲 EI 的多個項目中。

針對視覺領域存在的諸多問題，田奇博士在今年 3 月份的華為開發者大會 2020（Cloud）上釋出了《華為視覺研究計劃》，旨在為小樣本訓練、多模态學習、端側模型瘦身等提供解決方案。

決策優化：在 ESICUP 上達到世界最優

将一塊大玻璃切成不同的形狀，怎麼切才能最大程度上減少浪費？将裝有貨物的箱子裝進集裝箱，如何實作空間利用的最大化？這些都是現實生活中普遍存在的決策優化問題，也是華為雲 EI 重點發力的一大方向。

為了在工業生産過程中盡可能減少材料浪費、降低生産成本，華為雲 EI 提出了業界頂尖的決策優化方案，在業内公開資料集 ESICUP 上達到世界最優，用最少的投入獲得了最大程度的收益。

除了文章開頭提到的飛機靠橋率，這類問題在其他行業也非常常見。以物流行業為例，在路線優化問題上，華為雲的智能系統改變了人工查詢距離、比對車型等操作，改為系統自動測算。相比于模拟人工編排路徑得到的初始解，優化後的結果的整體運費下降了 20-30%。

語音語義：DiggScience 全球第一

華為雲 EI 語音語義團隊着力于發展私人定制化的語義服務，不斷訓練機器并自動學習，賦予機器認知、意識和推理的能力。同時，團隊還開發出了世界頂尖的知識圖譜平台，完成了從感覺智能到認知智能的躍變。

這些成果也得到了海内外機構的高度認可。在 2019 年 10 月的 DiggScience 科學資料挖掘大賽（學術論文搜尋比對大賽）上，華為雲以 58.7% 的準确率奪冠，超過第二名 5 個百分點。在今年 2 月的第 13 屆網絡搜尋與資料挖掘國際會議（WSDM 2020）上，華為雲帶領的聯合團隊摘得 WSDM Cup 2020 大賽「論文引用意圖識别任務」金牌。

落地的背後

從以上研究成果和應用案例我們可以看出，華為雲在 AI 基礎研究的落地上是非常成功的。但有一點不可忽視：前沿研究和業務落地之間總是存在巨大的差異，田奇博士稱之為「AI 使能鴻溝」。

從華為雲 EI 落地的領域中我們不難發現，華為的團隊挑的都是一些「硬骨頭」。以工業視覺場景為例，在學術界，研究者面臨的往往是标注準确、畫質清晰的圖像，但在工業界，标注錯誤、圖像模糊是非常常見的，而且資料量也要大幾個量級。同樣嚴重的問題還有醫療領域的小樣本訓練以及端側的模型瘦身等，而這些都是華為雲 EI 發力的領域。

橫跨學界和業界的雙重身份使得田奇博士能夠更加敏銳地感受到這些差異。在加入華為之後，他帶領團隊不斷克服這些挑戰，探索出了一系列解決方案。

除了技術層面的攻關之外，田奇博士在接受機器之心采訪時還提到了華為雲的團隊合作機制及人才的選拔标準。

在團隊合作方面，他表示，華為有着一套完整的促進研究組和産品線合作的機制，二者可以通過公司内部各種各樣的活動進行交流，比如羅馬廣場、松鼠會等。研究組分享前沿的科研成果，産品線提出自身的業務痛點問題，一旦發現合作的機會，兩者就可以通過聯合項目組的形式進行攻關。同時，公司還建立了通路學者等機制，以期更好地促進研究組和産品線的溝通。

在人才方面，他指出，華為雲 EI 團隊需要的是既懂算法，又懂平台，而且還能了解行業的人。為什麼這麼講？首先從研究方向來看，越來越多的行業要求為 AI 模型融入知識，将從業人員的經驗系統化為行業知識圖譜，使模型具備推理的能力，從感覺智能過渡到認知智能。從行業需求來講，不懂行業的研究者很容易陷入僞需求的漩渦，做出的産品與真實場景不比對，無法解決行業痛點。

田奇博士還指出，在人才方面，除了鼓勵算法研究者去向行業人員學習背景知識外，還要說服行業專家去分享自己的行業知識，使其接受 AI，這就要在溝通上多下功夫。

在談到華為雲 EI 的下一個技術發力點時，田奇表示，華為雲 EI 将聚焦于兩個方向：華為雲體系架構和核心算法在行業中的落地。在體系架構方面，華為雲希望将來端、邊、雲能夠更好地協同，引入更多樣化的端，同時結合華為在 5G 和 IoT 的連接配接優勢，賦能更多的行業。在算法方面，華為希望能跟行業相結合，解決行業中的實際問題，使得核心算法落地行業。

面向分布式 AI 開發及計算場景，華為雲推出 ModelArts Edge 智能小站

在研究和産業部門的密切配合下，華為雲 EI 克服了落地的重重挑戰，不僅将上述業界頂級的 AI 技術用到了自己産品中，還将其帶到了各個行業。

而這一切，都是通過一個叫 ModelArts 的一站式 AI 開發管理平台實作的。該平台為機器學習與深度學習提供海量資料預處理及半自動化标注、大規模分布式 Training、自動化模型生成，及端 - 邊 - 雲模型按需部署能力，幫助使用者快速建立和部署模型，管理全周期 AI 工作流。

如今，這一平台又有了新的延伸——ModelArts Edge 智能小站。

ModelArts Edge 智能小站主要面向分布式 AI 開發以及計算場景的需求，解決使用者在自建 AI 平台過程中存在的一些痛點，如平台部署難度高；建設周期長，無法跟上快速變化的業務趨勢等。

ModelArts Edge 沉澱了華為雲 EI 在計算機視覺、決策優化、語音語義等領域的核心技術，以一體化全棧方式傳遞完整的 ModelArts 平台服務能力，是公有雲服務在邊緣側的延伸，也是業界首個 AI 訓練及推理邊緣小站方案。

華為雲人工智能領域首席科學家田奇在華為雲 TechWave 人工智能專題日釋出 ModelArts Edge 智能小站。

為了讓智能小站為客戶提供與華為雲上 ModelArts 一緻的服務，該小站與 ModelArts 平台保持了 3 個統一：統一硬體平台、統一軟體架構、統一平台服務。

在資料安全方面，智能小站部署在客戶資料中心，通過實體隔離以確定安全合規，實作了資料本地存儲、本地訓練、本地推理。

在運維方面，小站通過專線接入華為雲運維中心，實作統一運維。使用者可以通過雲上完成訓練作業下發，而資料存儲、訓練、推理均在客戶機房完成。

華為雲的技術專家在采訪中介紹了小站的一些具體應用案例。以某大型電網公司為例，該公司在各個省都有節點，但各省資料量不夠大，是以需要在中心訓練後再推到省節點進行疊代。這種情況下，更好的方案是在總的節點上建一個中心的「雲」，每個省節點部署 ModelArts Edge 智能小站。各個省之間可以通過聯邦共享資料。醫院的場景也是如此。

田奇表示，未來，華為雲 EI 還将持續把華為 AI 前沿算法産品化，并開放給各行業的 AI 開發者使用，通過技術創新驅動産業智能更新。

華為雲到底用AI做了什麼？從少坐一趟機場擺渡車談起

計算機視覺：頂會論文近百篇，登頂 ImageNet、COCO 等權威資料集

圖像分類：登頂 ImageNet、WebVision 資料集

圖像檢測與分割：登頂 COCO 資料集

多模态資料處理：登頂 NuScenes 資料集

決策優化：在 ESICUP 上達到世界最優

語音語義：DiggScience 全球第一

落地的背後

面向分布式 AI 開發及計算場景，華為雲推出 ModelArts Edge 智能小站

繼續閱讀

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

Shell程式設計——sort排序、uniq忽略重複、tr替換壓縮删除、cut指定删除字段、正規表達式元字元sort 指令uniq 指令tr 指令cut 指令正規表達式

筆試面試題目：滑動視窗(二)

Linxu常用指令技巧彙總

httpd服務的部署、啟動、配置和簡單優化一、部署二、啟動三、配置檔案

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

資料結構與算法（27）——排序（二）

nginx 安裝錯誤資訊解決

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

【python】【資料處理】畫多元資料分布圖

hdu7108哈希