天天看點

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

2020 年,人工智能商業化落地全面加速。作為國内 AI 領先者的百度,其長期高強度技術投入正在逐漸取得成果。

剛剛,在「WAVE SUMMIT 2020」深度學習開發者峰會上,百度飛槳又一次宣布了多項全新釋出和重要更新。

「從去年秋季深度學習開發者峰會至今的半年時間裡,飛槳有了迅速發展:累積開發者數量已超過 190 萬,服務企業數量達到 84000 家;釋出模型數量已超過 23 萬個,」百度 CTO 王海峰大會開場時表示。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

這些成績之上,是飛槳對于國内産業智能化更新做出的貢獻。在新冠疫情期間,百度也進入了抗疫一線,提供了口罩檢測和人臉識别、社群疫情防控系統、疫情問答機器人、基于 CT 影像的肺炎篩查等等 AI 能力。

它們也是飛槳與開發者們共同努力的結果。

在峰會上,王海峰放出了最新的飛槳版圖。飛槳開源深度學習平台,包含核心架構、基礎模型庫、端到端開發套件與工具元件。随着企業應用的需求越來越豐富和強烈,飛槳更新了産品架構,推出飛槳企業版,助力各個企業進行 AI 創新。

百度飛槳平台的最新全景圖:

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

現在,百度飛槳深度學習平台由飛槳開源深度學習平台和飛槳企業版兩大版塊構成,百度集團副總裁吳甜表示,飛槳開源深度學習平台将持續保持開源,緻力于為産業、學術、科研創新提供基礎支撐。

飛槳總架構師于佃海向我們介紹了飛槳架構的設計理念,以及推動飛槳疊代發展的兩個驅動輪:産業實踐的需求和使用者體驗的提升。産業實踐的需求和打磨是最原生的驅動輪,這展現的是飛槳對性能、大規模訓練和部署能力的極大關注。

使用者體驗提升是另一個重要驅動輪,飛槳關注使用者程式設計界面的優化和基礎功能建設的完善。這種理念,為飛槳提供了持久廣泛的發展動力。飛槳也是以将高效兼顧靈活易用作為架構設計和發展的重要原則。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

作為國内最早開源的深度學習架構,飛槳的流行程度一直在提升,而百度也在不斷發展飛槳,在其中加入人工智能領域最先進的技術。

7 項全新釋出,百度飛槳重磅更新

時隔半年,百度飛槳開源深度學習平台帶來 7 項開源全流程工具新産品釋出,百度深度學習技術平台部負責人馬豔軍在峰會中進行了詳細介紹。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

這 7 項新産品包括端到端圖像分類開發套件 PaddleClas、端到端語音合成開發套件 Parakeet、前端推理引擎 Paddle.js、開發訓練部署全流程開發工具 PaddleX 等。此次,飛槳平台官方模型庫新增了 39 個算法、3 個任務、3 種端到端開發套件,友善開發者進行低代碼二次開發。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

端到端圖像分類開發套件 PaddleClas

圖像分類是計算機視覺中的一類常見應用,從手機的智能相冊,到工業領域的自動分揀都離不開這項技術。

這一次,百度釋出了全新的端到端圖像分類開發套件 PaddleClas,可以提供工業級的分類模式,包括 23 種分類網絡及訓練配置、117 個預訓練模型和性能評估,以及 10 萬類圖像分類預訓練模型。

在深度算法優化方面,PaddleClas 可以實作 3% 的 SSLD 知識蒸餾效果提升以及 82.4% 的識别準确率(ResNet50_vd)。

此外,它還可以提供工業級的部署工具,包括伺服器高速推理內建、移動端推理部署 、模型服務化部署等。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

可以看出,不管是在伺服器端還是在移動端,PaddleClas 在分類精度和性能層面均實作了大幅度的提升。

端到端語音合成開發套件 Parakeet

Parakeet 是本次飛槳平台全新釋出的第二款開發套件。值得注意的是,在模型層,Parakeet 使用了一款百度自研聲碼器 WaveFlow。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

馬豔軍介紹,WaveFlow 的特點就是「快、輕、簡」。WaveFlow 可以 40 倍實時的速度合成 22.05 kHz 的高保真音頻,同時參數量更少,僅 5.9M 個參數,比 WaveGlow 小 15 倍,它還可利用最大似然直接訓練,友善二次開發。

前端推理引擎 Paddle.js

說到深度學習,我們腦海中首先浮現的語言大多是 Python,這也是多數深度學習架構支援的語言。但随着深度學習應用範圍的擴大,使用其他程式設計語言工作的開發者也需要用到飛槳等深度學習架構,這就對飛槳提出了新的要求。

為此,百度飛槳團隊開源了國内首個 JavaScript 深度學習庫——Paddle.js。它支援低延遲、資料安全的本地計算。在 JavaScript 環境中,使用者可免安裝、跨平台使用,可應用于商品識别、AR 遊戲以及虛拟穿衣試戴等場景。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

開發、訓練、部署全流程開發工具 PaddleX

PaddleX 是一款開發、訓練、部署全流程開發工具,具有打通全流程、可快速內建、融合産業實踐、支援多端部署等優點。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

PaddleX 可以支撐各類 AI 應⽤的快速開發,大幅提升巡檢效率、開發效率,減少人類資源的浪費。

除以上釋出外,飛槳開源深度學習平台還在核心架構層、基礎模型庫、端到端開發套件、工具元件四個層面進行了全面的更新更新。

核心架構層

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

在推理部署層面,PaddleSlim、Paddle Inference、Paddle Serving、Paddle Lite 均進行了更新,其中 Paddle Inference 新增了多語言 API 接口,便于開發者進行內建開發。

基礎模型庫

對應自然語言處理、計算機視覺、推薦、語音四大領域,此次飛槳平台的 4 個基礎模型庫也新增了多項算法和任務支援類型。

其中 PaddleNLP 優化了多種算法和任務類型,提供更完善的 NLP 方案;PaddleCV 新增 3D 視覺及相關算法;PaddleRec 新增了支援融合、内容了解 2 大任務,覆寫主流推薦場景所需功能;PaddleSpeech 新增了 5 種高精度語音合成算法。

端到端開發套件

ERNIE:持續學習領域知識,領域了解能力全面提升

在開發套件方面,作為基于飛槳開源的持續學習的語義了解架構,ERNIE 此次進行了多處更新。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

在領域模型方面,飛槳預釋出了 ERNIE Law 法律模型和 ERNIE Health 醫療模型兩款模型;在任務模型層面,釋出了 ERNIE Gen 生成模型。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

相比于 ERNIE 2.0 中文,ERNIE Gen 中文在知識庫問題生成、閱讀了解問題生成、文檔摘要生成、新聞标題生成的 4 個中文權威任務集合上,效果平均提升 2.47%。此外,在較小訓練資料規模(16G)下,ERNIE Gen 英文在摘要生成、問題生成、對話生成、生成式問答等英文權威任務集合中實作 SOTA 水準。

目标檢測開發套件 PaddleDetection 全新更新

目标檢測是機器視覺領域的核心問題之一。去年,百度開源了 PaddleDetection 目标檢測統一架構,使用者可以友善、快速地搭建出各種檢測架構,建構強大的應用。

今天,PaddleDetection 迎來了全新更新:

  • 在算法豐富度層面,PaddleDetection 新增了 101 個預訓練模型和 10 餘套算法,含 YOLOv3、SSD、RCNN 等,此外還結合了移動端場景深度優化;
  • 在模型精度層面,更新後,基于 COCO 資料集的高精度預訓練模型精度 mAP 可達到 53.3%,實時預訓練模型精度 mAP 可達到 43.6%;
  • 在模型速度層面,PaddleDetection 速度超越同類産品 2.6 倍(YOLOv3 訓練),可實作 3.5 倍移動端模型加速(YOLOv3 預測)、2 倍人臉檢測預測加速。
  • 在産業實踐層面,PaddleDetection 在智慧交通領域的 mAP 要比同類産品高出 4%,在工業質檢方面高出 3%。

一直以來,PaddleDetection 在産業實踐方面有着廣泛的應用。在使用 PaddleDetection 替代人工進行森林巡檢後,效率提高了 200%;疫情期間,PaddleSeg 應用于肺炎 CT 影像分析 AI 模型,病竈識别的精準度可達到 92%,召回率達 97%,研發工期縮短 30%。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

工具元件

工具元件層面也是本次飛槳平台更新内容數量最多的部分。

預訓練模型應用工具 PaddleHub 新增了超大規模圖像分類、目标檢測模型,支援飛槳 Master 模式更新;全面內建 Paddle Inference 原生推理庫,預測性能提升 50% 以上;同時開放了 PaddleHub 預訓練子產品制作流程,支援開發者貢獻子產品至 PaddleHub 平台;新增 NLP 文本稽核模型,支援高性能文本向量表示服務。

深度學習可視化平台 VisualDL 釋出了 2.0 版本,API 全面更新,性能大幅提升,并對界面及功能進行了整體優化;

自動化深度學習工具 AutoDL 新增了 AutoDL Transfer DELTA 算法,通過精準知識蒸餾算法,有效提升深度遷移學習的效果

AIStudio 學習與實訓平台更新了 Notebook 環境,新增了覆寫人工智能各領域的 140 多個精品項目以及多個優質公開課,保障開發者快速掌握人工智能核心開發技術。

此外,飛槳還在強化學習、聯邦學習、圖神經網絡等方面進行了更新。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

 量子機器學習開發工具量槳

近年來,國内外各大科技公司都在量子計算領域發力。在《Analytics Insight》雜志公布的 2020 全球十大量子計算公司名單中,國内隻有兩家公司入選,其中一家便是百度。

早在 2018 年 3 月,百度就成立了量子計算研究所,開展量子計算軟體和資訊技術應用業務研究,并邀請了悉尼科技大學量子軟體和資訊中心創辦主任段潤堯教授出任所長。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

百度量子計算的 QAAA 規劃:聚焦于量子算法、量子人工智能以及量子架構。其中量子算法是發揮量子計算優勢的理論基礎,量子人工智能則代表了量子計算實際落地最重要的一些軟體技術工具,而量子架構則實作量子軟硬體互連,最終這三者将融合在百度量子計算平台提供給合作夥伴和使用者。

在本次峰會上,段潤堯也帶來了他們的最新研究成果——量槳(Paddle Quantum)。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

量槳是基于百度飛槳研發的量子機器學習工具集,飛槳也成為國内首個支援量子機器學習的深度學習平台。量槳建立起了人工智能與量子計算之間的橋梁,可以快速實作量子神經網絡的搭建與訓練,同時還提供多項前沿量子應用。

有了量槳,量子計算領域的研究人員就可以用它進行量子人工智能的研發,深度學習愛好者也有了一條學習量子計算的捷徑。百度飛槳也是以成為國内首個也是目前唯一一個支援量子機器學習的深度學習平台。

量槳擁有以下特點:

  • 易用性:通過量槳,開發者可以輕松搭建簡潔的量子神經網絡,也可以根據豐富的量子機器學習案例一步步組建出自己喜歡的模型;
  • 通用性與拓展性:開發團隊在飛槳中系統地擴充了包括複數變量、複數矩陣乘法在内的多項底層功能,這使得量槳可以完美地支援量子電路模型,進而也支援通用量子計算相關的研究;
  • 特色工具集:針對組合優化問題的求解、量子化學系統模拟等關鍵方向提供了專門的強大工具集,還推出了一些原創性的量子機器學習模型。

量槳的量子機器學習開發工具包括:量子開發工具集,量子化學庫,以及一系列優化工具。與此同時,量槳還提供了量子機器學習、量子化學模拟以及量子組合優化這三大核心量子應用。

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

比起業内的其他實作方法,量槳提供的方法具有部署靈活的特點,同時可以将量子計算網絡的層數減少 50%,更具有可行性。

在釋出會上,百度飛槳還釋出了 PPDE(飛槳開發者技術專家)計劃,号召全球 AI 開發者與百度飛槳一起共建開放的深度學習開源社群。

PPDE 是飛槳開發者技術專家的榮譽認證體系,由飛槳開發者技術專家、飛槳進階開發者技術專家和飛槳資深開發者技術專家組成。無論是熱愛程式設計開發的資深程式員、技術社群的引領者,還是頂級開源軟體的 committer、新興科技公司創始人或 CTO,這些開發者技術專家都可以通過線上線下形式在此機制下展開交流。 

百度飛槳開發者已超190萬,國内首個量子機器學習開發工具「量槳」面世

百度飛槳與 Linux Foundation 開源大學合作推出了國内首個深度學習工程師聯合認證,這一認證将于 6 月份開放考試。

昨天,百度還剛釋出了 2020 年第一季度的财報。雖然因為新冠疫情的影響,今年百度的第一季度收入同比下降 7%,營收 225 億元,但淨利潤 (Non-GAAP) 升至 31 億元,同比增長 219%。從不同業務上看,百度的移動生态持續鞏固,小度助手、Apollo 和智能雲均實作了健康增長。

人工智能業務的增長已在為百度的發展貢獻越來越多的力量,而技術領先的飛槳,更将推動各行業人工智能基礎設施建設的程序。

繼續閱讀