天天看點

“馴服”不受控的大模型,要搞定哪些事?

作者:InfoQ

作者 | 華衛

采訪嘉賓|王文廣,達觀資料副總裁

GPT 爆火一年多後,無論在國内、外,“幾乎所有領域都需要用大模型重構”的論調已深入人心。中國 200 多家廠商掀起的“百模大戰”、層出不窮的千億、萬億大參數模型、性能效果與應用方向的飛速疊代,無一不在表明大模型被各行各業擁抱的熱潮力度。但在更多行業對大模型躍躍欲試之際,也有許多現實的落地問題浮現出來,可控性問題就是其中之一。

在 5 月 17 日即将召開的 AICon 全球人工智能開發與應用大會 暨 大模型應用生态展上,InfoQ 邀請到了達觀資料副總裁王文廣做演講分享,他将從大模型相關技術和幻覺問題為切入點,探讨如何利用知識圖譜、RAG 和大模型融合的技術路線提高大模型的可解釋性、可操作性和可控性。會前,InfoQ 對王文廣老師進行了專訪,聽他先聊一聊大模型的不可控之處和對技術路徑的應用判斷。

以下為訪談實錄,經編輯。

大模型“不受控”在哪?

InfoQ:說到可控性問題,現在大模型在哪些方面的輸出是“不受控”的?

王文廣:大模型輸出的内容是根據使用者輸入的 prompt 去生成的,是由模型本身能力來決定的,如果要從細節上來控制模型的輸出是不可能的。也就是說,大模型本質上是不可控的。實際應用來講,大模型的不可控可以從兩方面來講:一是輸出的内容與使用者預期一緻就是是可信的,跟預期不一緻就是所謂的幻覺;二是可控性在使用時未必一定是需要的,比如說寫小說寫劇本等,即使天馬行空也沒什麼大問題。

另外對中國的使用者來講,還有些場景下,可控性是要求很高的。比如有時候會要求必須一字不差地按照給定的内容輸出時。但可控性與幻覺又是不同的概念,幻覺是跟事實不符,可控性則是跟預期是否一緻。

InfoQ:可控性問題是大模型目前落地的最大阻礙嗎?業内現有的大模型産品達到什麼樣的效果?

王文廣:不能完全說是障礙,要分場景的,隻是在部分可控性要求高的場景下是障礙,比如制造業、金融領域的應用等。也就是說,對輸出結果的精确度要求越高,可控性的影響越大。

我認為大模型追求的目标并非可控性,而是模型自身的能力。它的智能化水準與可控性并沒有很強的關聯,越強的大模型,未必可控性一定做得越好,但可控性可以用别的方法去做。

InfoQ:從安全和合規層面來說,整個行業如何能夠共同推動大模型的可控?

王文廣:這個主要還是要由大模型的提供商來解決這個問題,要保證輸出的内容适應各地的法規、習慣、隐私和道德要求。

主流的三種應對方式

InfoQ:要解決可控性問題,需要在大模型的哪些方面努力?

王文廣:這個有比較多的方法,大家用的最多的是 RAG(檢索增強生成)技術,把需要的東西檢索出來,然後通過提示詞的方法輸入到模型裡。還有的會采用分析神經網絡裡的激活鍊路的方式,這個比較難且成本非常高,是以可能真正用得不太多。

InfoQ:目前行業内在可控性問題的解決上,普遍采用哪些方式?

王文廣:普遍用的就是 RAG ,特别是在應用裡,但 RAG 本身也會有幾方面的細分内容。一是搜尋引擎,用這一方法去找到答案的大緻範圍,然後再通過提示詞輸入到大模型裡,讓它給出答案;二是向量資料庫,用向量的方法去檢索内容,但相比搜尋引擎來講,其可能也存在檢索效率和精度等問題。因為搜尋引擎起點蠻高的,要做好一個搜尋引擎并不容易。

另外就是在産業用得比較多的知識圖譜,它的好處對業務有很多預定義的結構,能夠更友善地找到精确答案,然後再利用大模型把答案生成一段合理文本來回答。

主流來講就是這三種方法:搜尋引擎檢索、向量檢索和知識圖譜增強。應用來說,偏通用的領域前兩者比較多,在專業領域知識圖譜更好一些。

InfoQ:知識圖譜能為大模型可控帶來多大的提升?在曹植大模型上的運用效果如何?

王文廣:知識圖譜和大模型是一個互補的關系。從原理上來講,大模型本質上我們稱之為歸納推理的結果,而知識圖譜更多是演繹推理;從實用角度來講的話,大模型是機率輸出,無法精确控制,同時即使出錯也無法進行編輯,知識圖譜恰好能做修改的事,可以在裡面寫确定性的邏輯。知識圖譜的劣勢是建構成本高、有很多結構化的成本、邏輯推理要求能夠了解業務,而這正是大模型所擅長的,比如說可以用大模型去做知識圖譜的建構、語言的了解。兩者的結合,剛好可以實作一個高度智能化且能夠落地應用的系統。知識圖譜和曹植大模型融合在效果上是非常好的,被金融、制造、能源等廣泛的行業客戶所接受。

InfoQ:RAG 能為大模型可控帶來多大的提升?在曹植大模型上的運用效果如何?

王文廣:最大的提升方向是,用這一方法去提升大模型,相當于把開放性的題目變成選擇題。在曹植大模型的落地中,大量才用了與知識圖譜融合的方法。

InfoQ:對于 RAG 本身的局限之處,在大模型可控的應用實踐中如何避免?

王文廣:要做大模型落地,RAG 技術是不可避免會遇到的,用别的技術方法隻會更難或者效果達不到預期。具體的局限之處要看方法,RAG 的三個方向各自都有其難點所在。搜尋引擎的局限在于複雜性,搜尋引擎是一個龐大的複雜系統;向量檢索乍一看非常簡單,但可控性非常差,遇到問題沒法去更改,在落地的時候往往會發現,細節是魔鬼,越到後面越沒法用;知識圖譜和搜尋引擎一樣是很複雜的知識體系,學習起來都很複雜,而且一個知識圖譜往往是針對不同的業務去做的,很難建構起全面的知識圖譜。

我們現在的做法,是在一個系統裡把這三種方法都用起來,每一種方法都有弱點,那就用别的方法去補充。如果隻會其中一種方法,頂多就 60 分吧,其實挺難做好的的。

單靠大模型,永遠達不到預期

InfoQ:大模型與知識圖譜之間有不少重疊的應用能力,二者會互相替代嗎?

王文廣:我覺得它們永遠不會互相替代。舉例來說,人類已經很聰明了,但需要精确的專業知識時還是需要去查百科全書。對大模型來講也是一樣的,它也不可能記住所有東西,特别是專業領域的知識,是以我經常說,知識圖譜是大模型的百科全書;并且,大模型也需要更新,越大的模型更新越慢,訓練也需要時間。是以大模型總需要某種方法來補充資訊,知識庫就是一個很好的選擇。是以,我經常說,書籍是人類進步的階梯,知識圖譜就是大模型(人工智能)進步的階梯,哈哈。

InfoQ:大模型是否能反哺知識圖譜的建構與發展?基于大模型的知識圖譜能統一嗎?

王文廣:最直接的影響是,現在有了大模型以後,知識圖譜的一些研究方向已經不再做了,比如問答。因為大模型在這些方面做得挺好,互相組合去做就可以了。随之帶來的影響就是,大家可以有更多精力做知識圖譜的其他方向,比如說推理,這可能也是未來知識圖譜會融合大模型去做的一個研究方向。

InfoQ:現階段以及将來有哪些技術可以助力提高大模型的可控性?

王文廣:目前來講我覺得主要就是剛剛提到的三個方法,還有就是大模型本身能力的增強,比如訓練一個針對特有領域的技術,可用但成本比較高,而且在語言模型裡面好像大家做得不太多,可能還是效果沒那麼好。

InfoQ:您認為大模型在可控性上達到業界和大衆的普遍認可,還需要多長時間?

王文廣:我覺得單靠大模型很難的,也許永遠都達不到大家的預期,必須結合前面說的這幾種方法。因為大模型再牛,如果語料裡沒有相關内容(比如剛剛發生的事情),肯定是答不好的。舉一個例子,現在(2024 年 5 月 8 日)問不帶檢索增強的大模型有關嫦娥六号的内容,肯定全是一本正經胡說八道。

InfoQ:在即将到來的 AI Con 上,您準備向聽衆分享哪些方面的内容?

王文廣:我主要會講兩部分,也是大家比較關心的方面。一是具體怎麼去解決可控性,我們會主要把搜尋引擎、知識圖譜和向量資料庫組合在一起;二是我們實際在做的案例,因為現在大模型最大的問題就是怎麼落地。

嘉賓介紹:

王文廣,現擔任達觀資料副總裁,進階工程師職稱,浦東新區“明珠計劃”菁英人才,曾獲得廣東省科技進步獎二等獎,上海市計算機學會科技進步獎二等獎和上海市浦東新區科技進步獎二等獎。人工智能标準編制專家,《知識圖譜:認知智能理論與實戰》作者,參與編撰《智能文本處理實戰》,《新程式員 * 人工智能新十年》顧問專家和文章作者,專注于知識圖譜、通用人工智能 AGI、大模型、AI 大工程、NLP、認知智能、強化學習、深度學習等人工智能方向。

原文連結:“馴服”不受控的大模型,要搞定哪些事?| 專訪達觀資料副總裁王文廣_機器學習/深度學習_華衛_InfoQ精選文章

繼續閱讀