天天看點

百度文心大模型:自主創新打造“AI底座”,多個模型世界領先

作者:智谷趨勢

由深度學習驅動的人工智能,正推動新一輪科技革命和産業變革。随着資料井噴、算法進步和算力突破,效果好、泛化能力強、通用性強的預訓練大模型(以下簡稱“大模型”),成為人工智能發展的關鍵方向與人工智能産業應用的基礎底座。

4月16日,2021百度認知AI創意賽“AI創意派”決賽正式舉行,這是業内首次将先進的AI大模型能力開放給公衆使用,實作了大模型在激發創意、落地應用上的突破。百度集團副總裁吳甜出席并圍繞大模型行業趨勢、産業價值、落地成果,分享了百度文心大模型的進展。

百度文心大模型:自主創新打造“AI底座”,多個模型世界領先

百度集團副總裁吳甜

吳甜指出,預訓練大模型已成為人工智能發展的新方向,百度文心大模型源于産業、服務于産業,是真正的産業級知識增強大模型。百度通過大模型與國産深度學習架構融合發展,打造了自主創新的AI底座,真正發揮大模型驅動AI規模化應用的産業價值。

攀登技術新高地,百度深耕産業級大模型

近年來,國内外科技巨頭如谷歌、微軟、英偉達、百度等,相繼在AI大模型領域展開探索。大模型的重要性在于——人工智能要真正發揮對産業更新轉型的驅動力,需要與各行各業的特異性場景深度融合,而大模型正是支援人工智能低門檻應用于不同場景的通用力量。

大模型的出現,大幅降低了人工智能的應用門檻。其通過集中提供通用算法模型,打造技術底座,讓大多數企業能夠“站在巨人的肩膀上”, 使标注資料更少、開發效率更高、應用成本更低。

百度自2019年開始深耕預訓練模型研發。2019年3月,百度率先釋出中國首個正式開放的預訓練模型ERNIE1.0,并持續投入于大模型的研發更新;2021年12月,ERNIE 3.0更新為全球首個知識增強千億大模型鵬程-百度文心。

目前,百度已成功打造文心大模型家族,多個大模型達到世界領先水準,例如全球首個百億參數中英文對話大模型PLATO-XL、首個聚焦中英文場景大規模 OCR 結構化預訓練模型 VIMER – StrucText、全球最大規模中文跨模态生成模型ERNIE-ViLG等。此外,鵬程-百度文心大模型在60多項經典的NLP任務中取得世界領先效果。

百度文心大模型:自主創新打造“AI底座”,多個模型世界領先

超大規模模型的訓練和推理,給深度學習架構帶來很大考驗。支撐文心大模型高效分布式訓練的關鍵技術力,是百度飛槳平台自主研發的端到端自适應分布式訓練架構與4D混合并行技術。依托飛槳,文心大模型解決了大模型訓練過程中多個世界性難題,使大模型訓練速度提升、模型效果更優。

基于百度飛槳平台與百舸叢集,文心大模型在算法、架構、算力層面實作完全自主創新,百度通過大模型與國産深度學習架構融合發展,為中國産業智能化轉型打造AI大底座。

大幅降低門檻,文心大模型助力産業規模化應用

随着大模型的價值凸顯,由國内外科技巨頭主導開發的大模型正在大量湧現。吳甜認為,大模型未來的發展趨勢,一方面會繼續出現技術創新,另一方面會在産業實用上有更多價值産生。

文心大模型作為産業級知識增強大模型,核心價值在于驅動AI的規模化應用。本次創意賽,百度在行業首次将先進的AI大模型能力開放給公衆使用,吸引全國各地近2000名不同年齡、不同技術基礎的選手參與其中,收集超過300份創意方案,作品覆寫教育、醫療、金融、娛樂、科技、心理健康等多個領域。

創意應用中,文心大模型用AI為創意插上騰飛羽翼。其基于大規模知識和海量無結構資料融合學習、深度學習,不斷吸收海量文本資料中詞彙、結構、語義等方面的知識,并通過持續學習不斷提升了解能力和生成能力,實作視訊、歌詞、藝術畫等創意作品的自動生成。尤其是在AIGC(AI generated content,人工智能創造内容)領域,借助大模型的跨模态綜合技術能力激發創意、提升内容多樣性。

百度文心大模型:自主創新打造“AI底座”,多個模型世界領先

基于文心大模型生成的歌詞和藝術畫

為了進一步降低AI應用難度,文心大模型還為開發者提供了工具平台,配套易上手的大模型開發、輕量化、部署工具,讓各行各業的開發者都能低門檻地實作AI的應用。

據吳甜介紹,“今年是文心大模型産業落地關鍵年”。目前,文心大模型已大規模應用于百度内部的各類産品,包含搜尋、資訊流、小度智能屏、百度地圖等,顯著提升了産品智能化體驗。基于文心的開放能力,對外的日調量也超過了五千萬次。

文心大模型已認證飛槳開源開放平台、百度智能雲等賦能到工業、能源、金融、通信、媒體、教育等各行各業,個人、企業開發者數量超6萬。在保險領域應用中,文心大模型的智能解析能力,能使文本處理效率提升30倍;在人力資源領域應用中,文心大模型能實作候選人資訊智能分類,模型識别準确率達到99%;在醫療領域應用中,文心大模型将每份病曆的檢查時間,從30分鐘縮短到了秒級别。

百度文心大模型:自主創新打造“AI底座”,多個模型世界領先

從AI核心技術到AI基礎平台,堅持技術創新及開放生态,百度正不斷降低AI技術開發和應用的門檻,并通過雲平台、AI架構、大模型的融合發展,為各行各業的數字化、智能化轉型打造厚實的基礎設施。

繼續閱讀