天天看點

百度副總裁吳甜:文心大模型已應用于搜尋等産品,開發者超6萬人

百度副總裁吳甜:文心大模型已應用于搜尋等産品,開發者超6萬人

百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜(來源:百度官方)

自從OpenAI釋出GPT-3之後,大模型成為幾乎所有全球頭部人工智能(AI)公司的逐鹿目标。

钛媒體App 4月19日消息,百度集團副總裁吳甜近日接受钛媒體App等采訪時表示,百度産業級知識增強大模型“文心”,目前已經大規模應用于百度内部的各類産品,包含搜尋、資訊流、小度智能屏、百度地圖等。而“文心大模型”的個人、企業開發者數量已超過6萬人。

吳甜強調,“今年是文心大模型産業落地關鍵年”。

據悉,“大模型”是目前世界AI研究領域最熱門的話題之一。AI 技術發展到今天,GPT和BERT等參數量巨大的模型被人們開發出來,他們在計算機視覺和自然語言處理等領域取得了前所未有的成就。

随着資料井噴、算法進步和算力突破,泛化能力和通用性強的預訓練大模型,正在成為 AI 技術發展的關鍵方向,并成為 AI 産業應用的重要推動力,有望讓 AI 技術與各行各業的差異化場景深度融合,讓大部分企業的标注資料更少、開發效率更高、應用成本更低,進而大幅降低 AI 的應用門檻。

2019年3月,百度釋出中國首個正式開放的預訓練模型ERNIE1.0;2021年12月,ERNIE 3.0更新為知識增強千億大模型“鵬城-百度·文心”,模型參數規模達到2600億,是目前全球最大中文單體模型。

同時,2021年12月釋出全新的文心大模型全景圖,文心大模型家族包含NLP(自然語言了解)大模型、CV(計算機視覺)大模型、跨模态大模型,以及工具與平台。

在吳甜看來,“文心大模型”作為産業級大模型,核心價值在于驅動 AI 技術的規模化應用。

是以,為了進一步降低應用難度,百度還為“文心大模型”開發易上手、輕量化的部署工具平台,包括提供各類開發套件,零門檻AI 開發平台EasyDL 、全功能AI 開發平台BML等,讓不同群體都能低門檻實作AI技術應用。

吳甜表示,通過百度AI開放平台,現在已經有近1400項能力是開放給企業開發者使用的。

吳甜對钛媒體App表示,基于百度飛槳平台與百舸叢集,“文心大模型”在算法、架構、算力層面實作了自主創新。通過大模型與國産深度學習架構融合發展。支撐“文心大模型”訓練的是百度飛槳平台自主研發的端到端、自适應、分布式訓練架構與4D混合并行技術。百度已經建構出自主創新的AI基底,能驅動 AI 規模化應用。

目前,“文心大模型”已認證飛槳平台、百度智能雲賦能工業、能源、金融、通信、媒體、教育等各行各業落地應用。其中在智能制造場景中,大模型可應用于質檢、巡檢這一類型以計算機視覺場景,以及資料裝置的運維等自然語言處理場景當中。

具體案例方面,百度與中國人壽合作,針對保險合同中條款文本進行關鍵字段的提取。基于文心大模型,實作了保險合同條款的智能解析,自動提取近40個次元的關鍵字段,業務處理效率大幅提升。

“基于企業自己積累的标注資訊,然後用‘文心大模型’與此前資料一起進行二次訓練,會幫助客戶做一些資料增強工作。再通過多次客戶回報構造資料,進行模型疊代,就達到實用狀态了。”吳甜對钛媒體App表示,真正使用時,把大模型的能力嵌到私有雲當中,在保險人員的工作流中嵌入一個功能,告訴他一些分析後的建議,然後基本上可以快速上手使用“文心大模型”能力了。

傳遞形态上,“文心大模型”主要有三種傳遞模式:通過調用API供開發者使用,百度EasyDL、BML全功能AI開發平台(Baidu Machine Learning)等平台上的嵌套工具,以及包含在一些面向場景的産品中傳遞,例如智能文檔分析TextMind,智能創作平台等。

收益來源方面,作為一項基礎性質的工作,“文心大模型”的收入來源,一方面百度自身的業務需求,另一方面是通過行業客戶的垂直場景結合,進入百度智能雲的營收當中。

不過,吳甜告訴钛媒體App,“文心大模型”在前期訓練的時候十分消耗算力,在百度搜尋場景中,利用昆侖芯在進行文心ERNIE的推理計算,每一天都是過億的流量在進行計算。而但并不是所有企業都擁有這麼大規模的算力平台,到企業場景真正使用大模型,很多隻要進行二次訓練就可以了,二次訓練并不會像訓練千億基礎模型那麼大的消耗。

對于大模型重複建設以及良性競争問題,吳甜表示,每一家企業和機構最後會産生的價值和作用,其實是各自側重的。現在還是有很大的創新空間。

(本文首發钛媒體App,作者|林志佳)

繼續閱讀