天天看點

百度釋出大腦語言與技術、語音和視覺等多項技術産品

百度釋出大腦語言與技術、語音和視覺等多項技術産品

作為百度AI多年技術積累和業務實踐的集大成,百度大腦已發展成為全球領先的人工智能平台。12月28日,百度Create AI開發者大會“百度大腦論壇”舉辦。論壇圍繞打造人工智能時代的驅動引擎展開探讨,帶來了百度大腦語言與技術、語音和視覺等多項技術産品的釋出,以及飛槳在開源算法模型、産業級模型庫和企業級AI應用開發等方面的全新更新。

百度大腦語言與知識技術全布局,三大技術産品重磅釋出

百度技術委員會主席吳華在論壇上表示,經過11年的發展,百度已形成了完整的語言與知識技術布局,包括知識圖譜、語言了解與生成技術和應用系統等。随後,吳華帶來了三大技術産品的釋出:全球首個知識增強超大模型鵬城-百度·文心,全球最大中文跨模态生成模型 ERNIE ViLG,以及首個百億參數中英對話預訓練生成模型 PLATO-XL,實作了知識增強大模型、跨模态文圖生成、人機對話等領域的領先。

特别是全球首個千億知識增強的大模型鵬城—百度·文心,得益于鵬城實驗室的算力系統“鵬城雲腦Ⅱ”和飛槳深度學習平台的強強聯手,解決了超大模型訓練的多個公認技術難題,使訓練效率大幅提升,模型效果更優。鵬城-百度·文心已經在機器閱讀了解、文本分類、語義相似度計算等60多項任務取得最好效果,并在30餘項小樣本和零樣本任務上重新整理基準。

基于百度的語言與知識技術,百度也面向各行業開放了語言與知識開放平台。不僅包含開源資料集“千言”和知識生産平台“解語”,還研發了面向應用的能力引擎平台和知識中台,以及智能文檔分析平台、智能對話定制平台、智能創作平台、翻譯開放平台和内容稽核平台等場景定制平台。

百度語音技術重要進展,SMLTA2全新釋出

語音和語言天生更接近,是以,把語音識别模型和語義模型進行一體化後的準确率和互動成功率會大幅提升。百度語音首席架構師賈磊介紹了百度多模态語音互動的最新進展。百度提出的基于曆史資訊抽象的流式截斷Confomer模組化技術——SMLTA2,解決了傳統的自相關技術在進行長句識别時的計算爆炸問題和存儲爆炸問題,也很好地解決了注意力模型的焦點丢失問題。

百度釋出大腦語言與技術、語音和視覺等多項技術産品

SMLTA2通過Decoder到Encoder各層的注意力特征選擇機制來引入回報,使得最外層識别結果資訊可以直接作用于編碼器内部的每一層的編碼過程,通過曆史資訊抽象充分提取有效特征資訊,顯著改善了Transformer模型從NLP領域應用到語音識别領域面臨的各種問題。SMLTA2的這種全新的端到端模組化方法,是對傳統Encoder-Decoder結構的端到端模組化的結構性創新。

最後,賈磊還介紹了SMLTA的實際商業落地情況。浦發銀行在全國多個營業廳上線了語音互動系統,其中位于上海外灘的銀行網點語音互動識别率測試達到93.51%,語音互動已經由完全不可用變成基本可用。

智能視訊創作,計算機視覺的最新實踐

百度視覺技術部總監丁二銳重點介紹了計算機視覺在智能視訊創作中的最新進展。現階段,視訊内容生産正在由UGC(使用者生成内容)向AIGC(AI 生産内容)轉變。

智能視訊創作是一個多技術交叉融合的領域,對于一個創作者而言,同時掌握視覺生成、多模态、3D圖形學并不現實,但百度智能視訊制作技術兼顧内容創意和視訊功能創作,不僅實作了對人臉、人體的精細處理和環境的再塑造,在創作方法上,改善存量視訊并擷取新增視訊,保障了視訊的充足展現和分發。

丁二銳表示,智能視訊創作領域目前呈現蓬勃發展的态勢,技術的發展帶來了生産工具的變革,一旦與其他生産要素結合,将帶來無盡的想象力。

百度釋出大腦語言與技術、語音和視覺等多項技術産品

飛槳産業級平台再更新,讓AI應用門檻更低

除了技術上的融合創新,在工具與平台方面,飛槳從開源算法模型、産業級模型庫和企業級AI應用開發等方面實作更新,持續降低AI應用的門檻。

百度傑出架構師畢然分享道,目前百度飛槳官方支援的産業級開源算法模型超過400個,覆寫計算機視覺、自然語言處理、語音和推薦等衆多深度學習應用領域。這樣全面覆寫,使開發者可以很快地找到所需要的模型。并且這些産業級模型庫實作了訓練部署的全流程支援,開發套件支援靈活配置化調優。

畢然還詳細介紹了飛槳最新推出的産業實踐範例庫。針對産業實際場景的AI應用,範例庫提供完整的代碼實作,覆寫任務解析、算法選擇、模型訓練及優化、推理部署及結果可視化等産業落地全流程,讓開發者快速上手,所學即所用。

百度釋出大腦語言與技術、語音和視覺等多項技術産品

百度智能雲AI産品研發部總監忻舟介紹了飛槳企業版AI開發雙平台EasyDL和BML在幫助開發者快速提升AI開發效率和資源使用效能的上的有效助力。

目前,飛槳企業版已經成為應用和落地最廣泛的AI開發平台。基于雙平台的開發模式,同時滿足AI應用開發者和AI算法開發者的需求。基于飛槳推理部署工具鍊,飛槳企業版已經為開發者測試并驗證了9345種模型晶片的組合,能夠覆寫95%的适配需求,能夠節省開發者97%的自行适配開發時間。PaddleSlim結合全自動的模型組合壓縮算法,能夠使精度損失控制在1%以内時,推理的性能提升3到5倍;智能邊緣控制台的推出,則大幅提升子產品和系統內建的效率,內建的周期可以從天縮短到五分鐘。

百度釋出大腦語言與技術、語音和視覺等多項技術産品

百度知識圖譜部、大資料部進階總監朱勇詳細介紹了在工業領域,百度打造的工業資料智能引擎如何降低AI的應用門檻。

朱勇表示,随着産業數字化程序不斷深入,大資料的應用趨勢也逐漸從業務資料化發展到資料智能化,工業資料智能前景廣闊,機遇和挑戰并存。百度基于領先的人工智能大資料技術,面向工業場景,打造了一套完整的工業資料智能引擎。它向下對接大資料平台,實作資料治理,向上支撐各種類型的業務場景需求,賦能電力能源、鋼鐵、化工、汽車制造等不同行業。百度工業資料智能引擎的核心是一系列可複用的工業模型以及支援定制化模型搭建的核心元件,包括資料分析、資料處理、AI算法和工業機理。

以鋼鐵行業為例,為了保證鍍鋅闆具有良好的力學性能,需要根據鋼闆的原料資訊對鍍鋅工藝參數進行必要的調整。基于百度工業資料智能引擎可以進行力學性能預測,達到90%以上的準确率, 通過工藝參數尋優,産品合格率達到99%。通過應用這套方案,企業客戶不僅能夠提升産品品質;相比傳統基于人工經驗的方式,還能大幅降低調試時間,進而提升生産效率。

最後,朱勇強調,在大資料和AI加速向工業滲透的背景下,工業資料智能前景可期。百度期待攜手更多開發者,共同助力工業智能化更新。

百度釋出大腦語言與技術、語音和視覺等多項技術産品

接下來,百度大腦将持續進化,不斷推動AI技術提升,通過融合創新,讓AI能力越來越強,與此同時,降低AI應用的門檻,讓技術的落地更加簡單,幫助越來越多行業和企業借助AI提升效率,創造價值。

繼續閱讀