百度副總裁吳甜：文心大模型已應用于搜尋等産品，開發者超6萬人

百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜（來源：百度官方）

自從OpenAI釋出GPT-3之後，大模型成為幾乎所有全球頭部人工智能（AI）公司的逐鹿目标。

钛媒體App 4月19日消息，百度集團副總裁吳甜近日接受钛媒體App等采訪時表示，百度産業級知識增強大模型“文心”，目前已經大規模應用于百度内部的各類産品，包含搜尋、資訊流、小度智能屏、百度地圖等。而“文心大模型”的個人、企業開發者數量已超過6萬人。

吳甜強調，“今年是文心大模型産業落地關鍵年”。

據悉，“大模型”是目前世界AI研究領域最熱門的話題之一。AI 技術發展到今天，GPT和BERT等參數量巨大的模型被人們開發出來，他們在計算機視覺和自然語言處理等領域取得了前所未有的成就。

随着資料井噴、算法進步和算力突破，泛化能力和通用性強的預訓練大模型，正在成為 AI 技術發展的關鍵方向，并成為 AI 産業應用的重要推動力，有望讓 AI 技術與各行各業的差異化場景深度融合，讓大部分企業的标注資料更少、開發效率更高、應用成本更低，進而大幅降低 AI 的應用門檻。

2019年3月，百度釋出中國首個正式開放的預訓練模型ERNIE1.0；2021年12月，ERNIE 3.0更新為知識增強千億大模型“鵬城-百度·文心”，模型參數規模達到2600億，是目前全球最大中文單體模型。

同時，2021年12月釋出全新的文心大模型全景圖，文心大模型家族包含NLP（自然語言了解）大模型、CV（計算機視覺）大模型、跨模态大模型，以及工具與平台。

在吳甜看來，“文心大模型”作為産業級大模型，核心價值在于驅動 AI 技術的規模化應用。

是以，為了進一步降低應用難度，百度還為“文心大模型”開發易上手、輕量化的部署工具平台，包括提供各類開發套件，零門檻AI 開發平台EasyDL 、全功能AI 開發平台BML等，讓不同群體都能低門檻實作AI技術應用。

吳甜表示，通過百度AI開放平台，現在已經有近1400項能力是開放給企業開發者使用的。

吳甜對钛媒體App表示，基于百度飛槳平台與百舸叢集，“文心大模型”在算法、架構、算力層面實作了自主創新。通過大模型與國産深度學習架構融合發展。支撐“文心大模型”訓練的是百度飛槳平台自主研發的端到端、自适應、分布式訓練架構與4D混合并行技術。百度已經建構出自主創新的AI基底，能驅動 AI 規模化應用。

目前，“文心大模型”已認證飛槳平台、百度智能雲賦能工業、能源、金融、通信、媒體、教育等各行各業落地應用。其中在智能制造場景中，大模型可應用于質檢、巡檢這一類型以計算機視覺場景，以及資料裝置的運維等自然語言處理場景當中。

具體案例方面，百度與中國人壽合作，針對保險合同中條款文本進行關鍵字段的提取。基于文心大模型，實作了保險合同條款的智能解析，自動提取近40個次元的關鍵字段，業務處理效率大幅提升。

“基于企業自己積累的标注資訊，然後用‘文心大模型’與此前資料一起進行二次訓練，會幫助客戶做一些資料增強工作。再通過多次客戶回報構造資料，進行模型疊代，就達到實用狀态了。”吳甜對钛媒體App表示，真正使用時，把大模型的能力嵌到私有雲當中，在保險人員的工作流中嵌入一個功能，告訴他一些分析後的建議，然後基本上可以快速上手使用“文心大模型”能力了。

傳遞形态上，“文心大模型”主要有三種傳遞模式：通過調用API供開發者使用，百度EasyDL、BML全功能AI開發平台（Baidu Machine Learning）等平台上的嵌套工具，以及包含在一些面向場景的産品中傳遞，例如智能文檔分析TextMind，智能創作平台等。

收益來源方面，作為一項基礎性質的工作，“文心大模型”的收入來源，一方面百度自身的業務需求，另一方面是通過行業客戶的垂直場景結合，進入百度智能雲的營收當中。

不過，吳甜告訴钛媒體App，“文心大模型”在前期訓練的時候十分消耗算力，在百度搜尋場景中，利用昆侖芯在進行文心ERNIE的推理計算，每一天都是過億的流量在進行計算。而但并不是所有企業都擁有這麼大規模的算力平台，到企業場景真正使用大模型，很多隻要進行二次訓練就可以了，二次訓練并不會像訓練千億基礎模型那麼大的消耗。

對于大模型重複建設以及良性競争問題，吳甜表示，每一家企業和機構最後會産生的價值和作用，其實是各自側重的。現在還是有很大的創新空間。

（本文首發钛媒體App，作者｜林志佳）

百度副總裁吳甜：文心大模型已應用于搜尋等産品，開發者超6萬人

繼續閱讀

日媒觀察：中國雲服務提供商仍在等待人工智能的雨露滋潤

人工智能向新而行，行業大模型推動新質生産力，賦能千行百業

人工智能助手感悟親情：孫衛東博士的孤獨流浪與家庭紐帶之重要性

人工智能與外星文明，人類未來的兩個威脅，哪個會先到來？

以色列上校将中國做為假想敵，提醒防範中國的人工智能網絡攻擊

《我是領袖》AI人工智能探索未來

抓住人工智能這個“牛鼻子”，加快培育發展新質生産力

觀點｜人工智能時代博物館如何緻力于教育和研究

人工智能發展如何影響勞動力就業

2024 年十大人工智能晶片制造公司

人工智能的原理是什麼？

馬斯克：給我特斯拉25%股份，否則剝離人工智能和機器人技術

中科彙聯2024第五屆科創彙聯人工智能發展高峰論壇在京圓滿落幕

科技巨頭積極布局AI領域！微軟将召開年度開發者大會，或透露人工智能PC計劃

醫學人工智能向“新”而行

李開複：預測到2027年人工智能将取代50%的工作