天天看點

預見·科技 | 如何把數字生命變成“真人”?業内人士:大模型能讓數字人聰明還有“靈魂“

作者:封面新聞

封面新聞記者 歐陽宏宇

“赤壁之戰的時候,如果有手機你會怎麼使用?”“紅孩兒是你和鐵扇公主的孩子嗎?”這不是人們在異想天開,而可能是在不遠的将來,讀者正在閱讀《三國演義》和《西遊記》的場景。

随着中國的“百模大戰”開啟場景比拼,大模型應用正從辦公、教育等傳統的線下場景轉向元宇宙、數字人等虛拟世界,給予人類把電影《頭号玩家》《黑客帝國》所描繪内容變為現實的期待。大模型和數字人技術的結合情況怎樣?能否賦予數字人以人情味?普通人什麼時候又才能擁有專屬的虛拟助手?

“現在的大模型智商已經非常高,甚至具備了角色代入和情緒模拟的能力,”近日,360集團副總裁梁志輝在接受記者采訪時表示,大模型利用千億級别的湧現能力,就能夠僅通過特定知識庫補充資料後,不需要預訓練,便可以将專屬模型應用或數字人建構出來。“不過目前還遠遠沒到達情商的級别。”

預見·科技 | 如何把數字生命變成“真人”?業内人士:大模型能讓數字人聰明還有“靈魂“

360集團副總裁梁志輝

更具個性化

以人為本是發展趨勢

自今年3月百度推出文心一言以來,國内科技圈掀起大模型浪潮。随着阿裡通義千問、360智腦、科大訊飛星火、騰訊MaaS等大模型解決方案的出現,已有超過20家企業入局大模型賽道,并推動更多行業與場景與大模型技術持續結合。千問大模型接入釘釘,星火認知大模型上線高頻使用場景小助手,騰訊雲TI平台打造行業大模型精選商店等現象,無不意味着在這場狂奔中,大模型的發展階段正從通用邁入千行百業。

在梁志輝看來,在接下來的幾個月中,還會有越來越多的行業大模型應用出現,并把拟人化代入其中。“這是一個行業的趨勢,因為普通使用者是不習慣跟機器打交道的。”

以大模型互動界面為例,這是一種類似于指令行工具,相當于人給機器輸入指令,機器作出回應;這種互動模式主要是對程式員高度友好。而當AIGC和數字員工結合後,就可以通過公司的專屬資料,了解到産品、品牌特征,甚至員工特有的語言表達方式,會比過去的語言大模型更具個性化。

預見·科技 | 如何把數字生命變成“真人”?業内人士:大模型能讓數字人聰明還有“靈魂“

大模型的互動界面

而要實作這一目标,關鍵是讓“大模型+” 數字人的邊際成本足夠低,而訓練成本在其中占據大頭。以ChatGPT為例,僅模型訓練階段的總訓練成本就為1200萬美元,而且與訓練資料呈正相關關系。當更加海量的行業資料進入大模型訓練中後,是否意味着将能難實作規模經濟?

梁志輝表示,并非所有大模型都需要預訓練後才能使用。而是當資料規模達到千億級後,大模型就會具有智能湧現的能力,即便面對沒有學習訓練過的内容,也隻需要一段簡短指令就能夠在特定場景下,快速習得一種新的語言和能力來提供服務。

“這個理論叫做支撐架,即對大模型挂上私有資料庫,進而執行非常複雜的問題。”梁志輝認為,未來,大模型供應商提供的服務主要是比對産品,一方面通過知識庫降低預訓練的難度,另一方面通過資料庫對大模型進行雙向增強。“是以,将來的行業大模型會呈現‘一個大腦+N個本地大模型’的形态,如果面對城市就叫城市GPT,面對公司就叫公司GPT,總之就是讓使用者能夠以可以承擔的方式來用上自己需要的大模型。”

借助大模型

數字人有了人情味

降低使用門檻,隻是行業發展的一環。将大模型具象化為一個數字人之後,還會具備哪些新的能力?

“除了事實性的知識,更大的突破是讓數字人通過語音、表情交流能力的提升實作角色代入,進而讓體驗感大大提升。”梁志輝以“數字名人”為例談到,比如,通過大模型‘支撐架’的原理,用低成本的訓練方法把諸葛亮、林黛玉、孫悟空等古往今來的名人以數字化的形式建構出來,讓他們與讀者讨論原著圖書的劇情。“這将改變人閱讀的方式,讓我們一邊讀書,一邊跟數字人交流,讀到特定章節的時候甚至可以提問,數字人也會基于智能湧現,将書本資訊和事實性的資料融合貫通地回報給讀者。”

預見·科技 | 如何把數字生命變成“真人”?業内人士:大模型能讓數字人聰明還有“靈魂“

基于大模型打造的”數字人“林黛玉、諸葛亮、孫悟空

要提升體驗感,數字人絕對不能像傳統的智能客服一樣,隻是對特定的問題做“複讀機”式的回報,而應該是具備人情味的。但在梁志輝看來,以現階段的技術能力,已經可以讓大模型有高智商,而要讓數字人變得有情商還處于探索階段。

不過,目前仍有一些手段可以讓數字人變得有“性格”。據介紹,通過文本學習後該人物的性格特點後,便可以通過低成本的精調把人物的情緒能力釋放出來。如像林黛玉這樣性格陰郁的人,詢問她今天心情怎麼樣時,可以每次都生成一種表達心情不太好的描述;問性格急躁的孫悟空“紅孩兒是不是你和鐵扇公主生的時”,孫悟空會根據特定環境和上下文罵人。

在梁志輝看來,大模型的文本學習已經到了瓶頸期,從技術路線上看,文本學習到達千億級後就要陸續把代碼、論文,甚至音視訊、語音等内容加入其中,進行多模态的訓練,才能給大模型增加更多的能力。“其中,更加有效的則是通過網友打标簽這類人工回報來增強引擎,因為光靠靜态的資料訓練很難不斷突破,而通過真人動态回報給大模型的學習效果更好。”

【如果您有新聞線索,歡迎向我們報料,一經采納有費用酬謝。報料微信關注:ihxdsb,報料QQ:3386405712】

繼續閱讀