天天看點

從開源架構到AI大生産平台 百度 飛槳 曬出三年成績單

作者:郝俊慧 來源:IT時報

“最近一個月,你見過盲人嗎?”12月12日,由深度學習技術及應用國家工程實驗室主辦的WAVE SUMMIT+2021深度學習開發者峰會上,東北大學大四學生高鴻志向在場觀衆抛出一個問題。

從開源架構到AI大生産平台 百度 飛槳 曬出三年成績單

中國14億人口中有1700萬視障人士,占總人口比例達1.2%,但在大街上卻很少看到他們的身影。“變色”和被阻礙的盲道,成了他們出行的障礙,而全國經過訓練的導盲犬隻有200多隻,每隻導盲犬訓練需3-5年,與需求相比,杯水車薪。

“我們用不到半個月的時間訓練出一隻機器導盲犬。”利用飛槳深度學習開源開放平台和社群,高鴻志和他的團隊讓一隻機器導盲犬實作了基于視覺的盲道導航、常見障礙物檢測、紅綠燈識别引導過馬路等功能,而未來,通過AI訓練,除了引導避障,機器導盲犬還可以為主人提供更溫暖、更安全的語音陪伴,很多現有導盲犬無法做到的事情,都将通過它變成現實。

年輕的高鴻志是一名飛槳開發者技術專家(PPDE),406萬飛槳開發者之一。作為我國首個自主研發的産業級深度學習平台,截至目前,飛槳已經建立了47.6萬個模型,服務于15.7萬企事業機關,在中國深度學習平台綜合市場佔有率第一。

從開源架構到AI大生産平台 百度 飛槳 曬出三年成績單

“人工智能呈現出‘融合創新’和‘降低門檻’的特點。”百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰認為,一方面,AI技術及産業的融合創新越來越多;另一方面,雖然AI技術越來越複雜,但AI開發與應用的門檻卻越來越低。

從開源架構到AI大生産平台 百度 飛槳 曬出三年成績單

這意味着,深度學習正推動人工智能進入工業大生産階段。

峰會上,飛槳釋出包括飛槳新版全景圖—産業級模型庫新增文心大模型、業界首個産業實踐範例庫、飛槳“大航海”2.0共創計劃等在内的十大最新技術和生态進展。

從開源架構到AI大生産平台 百度 飛槳 曬出三年成績單

一個人也可以完成的AI項目

25歲的李桑郁,是襄陽鐵路段的一名鐵路勞工,通過自學飛槳開發套件,他開發出一套“鐵路貨車車身字元及辨別自動檢測系統”,實作了鐵路貨運車号的自動識别。整個項目,

僅憑他一己之力。以前需要人工核對幾個小時的工作,如今隻需要3分鐘就能完成,為襄陽車輛段省了20多萬元成本。

在飛槳平台上,和高鴻志、李桑郁一樣的開發者,有406萬。飛槳是國内首個開源開放、功能完備的産業級深度學習平台,它将大量基礎的、需要重複的代碼固化為模型,利用預先建構和優化好的元件集合定義模型,深度學習研究者不需要深入了解底層算法,便可以自主快速實作從建設資料集、到模型訓練、再到模型部署的整套流程,進而大大降低人工智能的使用門檻。

峰會現場,百度AI産品研發部總監忻舟現場示範了一隻機器狗的5分鐘。飛槳全新釋出的智能邊緣控制台,僅僅需要5分鐘,便讓一隻機器狗學會了識别手勢的新技能。對于高鴻志而言,一款更人性化的機器導盲犬“出街”的時間,又可以縮短了。

值得一提的是,通過多層次、低成本的硬體适配方案,大大降低了架構與晶片的适配成本。以寒武紀MLU适配為例,飛槳方案相比原方案,代碼行數減少69.4%,修改的代碼檔案減少62.3%,人力投入成本降低60%。截至目前,飛槳和22家國内外硬體廠商完成了31款晶片的适配和聯合優化工作。

AI進入工業化大生産期

2019年4月第一屆WAVE SUMMIT+2021峰會上,王海峰曾将深度學習架構定義為“智能時代的作業系統”,它下接晶片,上承應用,尤其在大生産階段,能夠将AI技術以标準化、自動化和子產品化的方式輸出給各行各業,實作規模化應用;同時以平台為基礎促進融合創新、共同發展,凝聚各方,通過賦能廣大開發者,有力支撐AI工業大生産,促進技術創新和産業智能化更新。

飛槳源起于2018年7月,開源架構 v0.14釋出,百度官方首次開源CV/NLP/語音/強化學習等10個模型,提供了從資料預處理到模型部署在内的深度學習全流程的底層能力支援。

經過三年的發展,飛槳持續突破了核心架構的創新。全新釋出的開源架構v2.2,新增大量科學計算API,高效支援超大模型訓練的端到端自适應大規模分布式訓練技術;全流程加速文本任務,解決文本領域開發在性能和訓推一體方面的痛點問題,在飛槳産業級模型庫裡,新增的知識增強文心大模型,可以讓大模型真正進入産業應用。

峰會現場,國家電網上海電力公司排程中心副主任肖飛講述了國家電網對于“人工智能”的渴望。基于雙碳的目标,風能和太陽能等可再生能源在電網中的占比正在逐漸提升,但對整個電網的系統管理提出了非常大的挑戰,尤其是因自然條件變化産生的不确定性,可能會對整個電網産生災難性影響。這就需要利用深度學習、監督學習、非監督等模型,對可再生能源的消納、負荷等資源的配比精準預測。

肖飛介紹,通過百度飛槳平台,國家電網的新能源預測準确性提高了85%,智能安排從分鐘級提高到了秒級,為整個電網運作奠定了非常好的基礎。

百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜指出,近年來,全國各城市的AI開發者規模逐年增長,應用人工智能的企業數量,呈現出多地開花、多行業繁榮的景象。從推薦等通用場景,到客服系統智能派單等行業衍生場景,再到發電預測等行業關鍵場景……類似這樣技術與産業的融合創新案例在飛槳平台上越來越多,也越來越專業,截至目前,飛槳服務了15.7萬企事業機關,有力促進了産業智能化更新。

從開源架構到AI大生産平台 百度 飛槳 曬出三年成績單

培育複合型AI人才

對于人工智能産業而言,人才是永遠不過時的話題。随着AI與産業的深度融合,需要越來越多既懂AI,又具備産業經驗的複合型AI人才。

“大學不要用昨天的知識教今天的學生,讓他們去面對明天的需求。”上海大學計算機工程與科學學院院長謝少榮一直在思考,如何将産業界最新研發的産品及時納入到人才的專業培養中。在他看來,對于大學生,在低年級需要做的是系統知識的培養,但到了高年級,有了一定共性的專業基礎後,便可以和百度這樣的網際網路公司合作,将先進的算法模型和開源平台引入高校,提升人才培養的關聯效應。

類似的思考,存在于國内大多數院校中,對于新一代AI人才的培養,不同高校也都在探索。

西安交通大學是國内知名的工科高等院校,早在十年前,便開始探索“菁英班”模式,和科技與産業前沿的龍頭企業合作,由校企雙方共同制定培養方案,共建課程體系,企業的導師參與學校的理論課程教學,指導學生的項目設計、科創計劃,目前合作的企業包括百度、華為、中興、360等。

通過采用多學科交叉、本碩博貫通的選拔方式,西安交通大學選擇一些學有餘力的好學生,成立“菁英班”後進行小班制教學,并且将學生原學習的專業和“菁英班”的前沿方向有機地融合起來進行培養。截至目前,全校已經建立了23個“菁英班”。從結果來看,參加“菁英班”學習的應屆畢業生普遍認為自身的創新意識、工程設計與開發實踐能力都得到了極大地提升。

網際網路公司對于這樣的複合型AI人才,也是無比渴望。一直以來,飛槳緻力于複合型AI人才培養,與多家知名院校達成了多項人才培養計劃。自2018年開始舉辦“全國人工智能師資教育訓練班”以來,百度飛槳已累計培養了2900多位高校教師,覆寫690多所高校。2021年推出《AI人才産教融合培養方案》,從内容、專項合作、服務層面,為AI人才培養提供了可供參考的産學研實踐方案。

繼續閱讀