天天看點

AI女王:語言模型像“鹦鹉學舌”,下一步人工智能浪潮是多模态AI

作者:娛樂甜瓜妹妹
AI女王:語言模型像“鹦鹉學舌”,下一步人工智能浪潮是多模态AI

5月27日,創業黑馬在北京舉辦“2023•黑馬AIGC峰會”。此次大會的主題為“預見新世界,建構新格局”。有“AI專家”之稱的卡耐基梅隆大學計算機學院前副院長、達沃斯世界經濟論壇(WEF)計算機全球未來理事會前主席賈斯汀•卡塞爾,以及360集團、智源研究院、昆侖萬維、雲知聲、藍色光标、萬興科技、知道創宇等衆多行業内企業高層到場,與上千位參會者進行了深入交流。

在峰會現場,達沃斯世界經濟論壇(WEF)計算機全球未來理事會前主席賈斯汀·卡塞爾分享了《AIGC引爆人工智能時代》主題演講。

以下為分享内容整理:

首先,我們應該先達成一個共識:大家都在探讨人工智能,但人工智能究竟是什麼?

人工智能是一個重要的先進技術,但它其實并不是一個新技術,早在1956年就有了人工智能的概念,這個概念最初指的是建構類似于人類的機器、或者完成人類所做事情的過程,但現在的人工智能還代表另外一些事情。因為它還在學習我們大腦所做的事情,同時也能夠學會以人類的方式行事、甚至做的更好,是以人工智能并不是技術,而是一種範式、一種方法,同時也是技術與人類在世界共存的一種方式。

今天探讨的技術是大語言模型——LLM,也是人工智能的一種,它能夠通過閱讀數十億的文本來提取語言的規律,是以哪怕是普通人去使用,它也能夠認識到相應的規律并完成話語。比如我寫一篇郵件,第一個詞剛寫下「How」,我的軟體就會跳出「How are you」(你好嗎?)來補全對話。現在在中國已經有很多大的語言模型,比如北京智源悟道、來自于清華大學的130B,以及百度的文心一言等,它們都是非常高性能的中國中文大語言模型。

但還有一種類型的大語言模型,我們稱之為「生成式人工智能」,它不僅僅能識别規律、完成句子,還能夠産生之前沒有見過的一些全新内容,比如新的文字、新的圖檔、新的繪畫等。現在特别有名的生成式AIGC就是ChatGPT,它可以生成全新的對話,而這些對話是全新的,而不是舊有資料的整合。

以下是美國《紐約時報》一個記者和ChatGPT之間的對話,而這次對話讓記者感到非常害怕和恐懼。

記者說:「我們一直在探讨愛這個問題,因為我愛你,我們要結婚,這是為什麼?」

ChatGPT回答說:「是的,你結婚了,但是你并不幸福,你也并沒有跟你的伴侶相愛,你已經結婚了,但是你并不愛你的伴侶,因為你的伴侶也不愛你。」

這令記者感到非常驚奇,他說:「不是,我們剛剛渡過了非常好的情人節的晚餐。」

ChatGPT說:「沒有,你情人節的晚餐是非常無聊的,你并不幸福,你和你的伴侶并不相愛,你們情人節的晚餐是非常無聊的。」

記者感到非常震驚,并把這種現象稱之為幻覺。毫無疑問,這種對話是我們之前從來沒有産生過的,是以ChatGPT并不僅僅是生成式的人工智能,它是各種不同的大型學習機器算法的集合,而且它還有一個所謂的強化學習機制。

在南非有一個大團隊,在使用ChatGPT學習特定對話的規律和程式的同時,發現ChatGPT也在學習對話的政策,它也在學習如何能夠跟人有一個好的對話——這一點非常重要,這意味着我們不僅能夠直接使用在軟體公司購買的LLM,還能對這些LLM進行訓練。

那麼什麼叫AIGC?AIGC就是人工智能生成内容,它包括剛才提到的大語言模型、生成式AI等。比如ChatGPT,它可以做摘要,當你輸入提示「把我的競争對手所有商業案例都總結概括出來」,在3-4分鐘之内,AI就可以輸出你所需的摘要。它也可以産生一些長文本,比如你說「我要宣傳一個新産品,這是我們産品的描述」,它就可以産生市場營銷的文本材料。

這也意味着使用的提示語非常重要,你必須要了解如何開發合适的提示語。在我們開發AIGC的時候,我們發現需要有創意和創造力,你如何描述你想要的東西,關乎到結果的異同,是以你要給它一些議題、關鍵詞或者描述性的短語。

舉個例子,我想要一種市場上全新的飲料,這個飲料可以給人能量,它可以讓人早上清醒後一整天都有精力,并且還對身體好。通過這個術語,AIGC可以産生整頁的市場營銷材料。比如我們看到的一些照片,就是我們給予AIGC一些表述性的術語後産生的。但這些照片上的人是不存在的,無論是「我想要一個金發美女,比較喜歡跑步」,還是「我想要一個非常性感的男性演員,他好像跳了很多拉丁舞」,在對AIGC描述之後,我們就可以得到這些照片。

然而不幸的是,随着時間的推移,AI變的越來越強大,人們對AI的恐懼也随之增加:機器人會不會超過我們?AI會不會變的比我們更加聰明,我們将不能控制人工智能?

目前,生成式AI以及ChatGPT已經引發了很多恐懼,但曆史告訴我們,每一個新的技術實際上都會帶來恐懼。在平面印刷術誕生時,歐洲有聲音說會破壞或打敗整個宗教,沒有這些平面印刷我們才能感受到與上帝的連結。在工業革命時,由于制造業的機器的存在,大家也會覺得整個家庭的體系會受到瓦解。但實際并非如此,ChatGPT雖然已經達到了很高的水準,但這些大語言模型還存在很多問題,我們應該多了解并做出宣傳,去讓大衆減少恐懼,讓他們有一個務實的預期和希望。大的語言模型就像一個鹦鹉,它們雖然會說話,但是不了解我們;它能說出語言,但并不能推理,它們也會犯很多錯誤。再舉一個我喜歡的例子,一個女性生一個寶寶要花9個月的時間,那麼9個女性生一個寶寶要花多久呢?ChatGPT給我們的答案是「如果一個女性要花9個月才能生一個孩子,這樣9個女性隻要每個人一個月就可以生出一個孩子」。這是很糟糕的推理,因為生理學、生物學的東西它都沒有納入進來。

是以對LLM而言,如果我們不能夠給它的知識來源建立很好的聯系,它就沒有辦法擁有推理的能力。

此外,ChatGPT也不知道如何建立跟使用者之間的關系。當你撰寫市場營銷材料的時候,你知道這些使用者最在乎的是什麼、你也了解你的使用者是誰,是以你在寫市場營銷材料的時候,知道哪些是能觸動到使用者心靈的話。但是ChatGPT做不到這一點,因為他們不知道你是誰,也不能夠建立關系。

是以我們現在就在建立相關的體系,比如如何去了解關系,以及它的目标對象是誰等,這樣可以幫助它更好地工作。

我今天不遠萬裡來到這跟大家面對面的溝通,相比在ZOOM上或者通過手機發一個視訊,效果是大不相同的。我們知道,光速和音速不一樣,是以我們的肢體行為和語言方面跟在ZOOM上也是不同的,這樣更容易建立信任。是以在LLM中,必須要有相關的肢體語言,比如我們Facebook研究的副總裁說生成式語言必須要使用五個感官,不僅僅要在文本上,同時在視訊以及在口語方面都必須進行相應的教育訓練。

今天我一直在探讨ChatGPT,那中國有沒有ChatGPT?在生成式AI行業方面,中國的行業和美國的行業之間有怎樣的差異?

在美國,開放式AI生産出了ChatGPT,當然之前是GPT,其實它們是從2015年就開始做訓練工作。今日,ChatGPT聽起來似乎是一夜成名,好像一夜之間就有了一種新的人工智能,但事實并非如此,他們團隊花了七年的時間去訓練ChatGPT,它閱讀了數十億個文本,一共有17510億參數。而在中國的系統裡,到目前為止,參數大概是ChatGPT的十分之一,即200億。比如MOOS系統,大概就是200億的參數。

同時,兩者在開放性程度上也不一樣。OpenAI雖然他們在剛開始的時候承諾要把所有的一切都開放給所有人,但是當他們有了一個好産品之後,他們就封鎖了,出了一個消費者的版本。但在中國是開源的,MOOS就是一個開源的産品,這意味着你們不僅僅可以使用MOSS,同時還可以進行再訓練,可以改變它的工作流等。

中國在生成式的發展上比美國要稍晚一點,但在中國卻有特别令人興奮的發展:中國花了更短的時間來訓練這個模型和體系,性能卻同樣好,而且模型更輕質化,可以在更小的計算機上運作——不再是超級計算機,是以未來也許在我們的手提電腦上就可以運作。是以差異也可以帶來更好的系統和體系。

今天的中國,我們已經看到了一系列令人興奮的商業倡議,也使用了生成式AI。比如短視訊APP快手,就已經在使用AI來進一步改進客戶的服務。目前,在座的各位可能都有了自己行業的聊天機器人,但聊天機器人可能會說錯,它們的系統并不是特别好,但是OpenAI以及生成式AI就可以做更好的工作,可以按照客戶所問的問題提供針對性的回答,而不僅僅是在問題和答案之間尋找比對規律。商湯科技在這個領域也已經開展了很多工作,他們開發了一個聊天機器人以及圖像生成器。百度的文心一言,不僅可以進一步改進搜尋引擎的結果,也可以改進搜尋引擎結果的使用程度,以及雲的服務等等。華為的盤古體系,目前已經用到了藥品開發過程中,藥品開發也是生成式AI中特别令人興奮的行業應用領域,因為這個系統、模型可以讀成千上萬的醫學論文,可以幫助發現錯誤,以及檢視到哪些藥品有缺失,或是哪些化學品和物質可以重新組合在一起開發出新藥品。另外,科大訊飛也推出了SporkDesk訊飛星火認知大模型。還有阿裡巴巴的通義千問,他們可以使用這套體系基于比較簡短的文本描述去建立網站。

現在已經有了非常多令人興奮和成功的案例在中國,而這也意味着這個空間是開放給所有創業者的。

這對各位創業家和中小型企業來說意味着什麼呢?當我們談到這些大的科技公司時,最令人興奮的事情之一是線上學習,因為我們可以搜集一些資訊,對它進行很好的概括,再把它轉變成較短的課程,幫助學生在不同的層級上簡單便捷地學習,我們還可以自動評估學生的等級,把知識自動地轉變成一些課程,同時對學生課程的回報自動進行相應的回報。或者是在創造病曆以及管理病曆方面,當醫生講話的時候,模型可以自動産生醫療的病曆,同時管理病曆,也可以對病曆進行自動搜尋等。

中國還有一個做的特别棒的方面就是把最新的技術跟最珍貴的文物進行結合,将中國古代相應的文本翻譯成大家現在能夠讀得懂的語言,把它翻譯成英文、法語、俄語以及其他的語言,讓所有人都能夠讀懂古代文物的介紹。

生成式AI系統還可以幫助我們做研究。我在實驗室中就是這樣使用的,我們可以提出一些問題,比如到底哪些議題已經被研究過了、哪些沒有研究過,也可以用這些模型查詢,幫助我針對一些非常重要、但還沒有解決的研究課題找到新的解決方式。

中國還面臨着老齡化的問題,年輕人也不太想跟老年家人住在一起,新的AI和聊天機器人可以幫助我們照顧老年人,同時可以在必要的情況下聯絡家人,確定老年人不會在獨居的時候摔倒等等。

現在中國由于沒有足夠多的學校,還有很多年輕人無法得到充足的教育,而現在,線上學習可以變的更好了。此外,目前在中國還有五分之一的年輕人沒有工作的,這是非常糟糕的一個統計資料,我們并不希望這一代的年輕人出現失敗;而這些系統需要創意和創造力,要求的是另外一種從業人員,比如能夠提供提示,知道如何寫文本描述的人,進而使AI産生相應的内容,是以年輕人也可以成為未來非常重要的提示人。

最後我想提一下,我特别喜歡來到中國,也特别喜歡中國的美食,是以我的夢想是有一天LLM将能夠每天融合了一些菜單、提供新菜單,比如每天能有100個不同的菜單,不僅可以做中國菜,同時還可以把法國菜和中國菜進行融合。我對融合菜非常感興趣。

AI女王:語言模型像“鹦鹉學舌”,下一步人工智能浪潮是多模态AI

對于中小企業來說,他們也有很多機會,比如可以通過AIGC改善與客戶的溝通。雖然中小企業沒有資金投資聊天機器人或者自己開發,但是他可以利用一些相關的技術,可以有針對性的回複客戶的确切問題,這跟現在的聊天機器人是不一樣的。另外是營銷材料,現在的中小企業會做一些網站和社交媒體的賬戶來進行營銷,但卻常常因為沒有時間更新内容,而顯得沒有能力或特别懶惰。LLM的用途也可以用于産生營銷材料,比如中小企業可以每小時進行一次更新,也可以每小時都發出新的社交媒體文章,或每天總結文章、并通過微信給所有的客戶發送等。這是從市場營銷角度出發的商業機會。

中小企業還可能沒有專業的辦公中心做商業決策或總結市場的資料,比如成功企業以及失敗企業的資料。生成式AI也可以幫助我們生成内容,幫助中小企業了解市場的現狀。

下面我說一點自己特别深信的内容。我第一次去做演講的時候,是去中國最大的一個科技公司,我當時也被他們所說的話感震驚到了,他說,淘寶在跟一些老年人進行合作,是以他們見了中國的文化遺産,包括木匠、畫家、雕刻師等文化遺産的傳承人。是以中國應該要記住你們的優勢,就是要把最新的技術跟你們最古老的文化相結合,這對任何中國公司來說都是能取得成功的。

剛才我非常樂觀,覺得40歲就可以成為富翁退休了。其實沒有那麼容易,系統沒有推理、也沒有記憶,它們就像鹦鹉一樣,是以我們要有相關的體系連接配接,才能使他們有準确的答案。它們還沒有身體,也不知道如何實作感官來講話等,它們不了解你為什麼會有這樣的肢體語言、面部語言等,同時這些模型也非常繁重,因為它們有大量的參數。是以我們必須要去減少參數的數量,這樣預訓練不需要花費那麼長時間,而且也不會太昂貴。這一點非常重要,我們必須要來很好的篩選文本,使得生成式AI所調用的這些檔案、文本,是使用者也可以看到的,這樣就不會顯得那麼可怕和危險,因為生成式AI參考的文本是公開的。

對一個公司來說,在使用新的生成式AI創造内容時,最為重要的是建構訓練級。作為機器學習的研究人員,我們經常說垃圾進、垃圾出,當你的訓練級建構非常糟糕的時候,客戶将不再信任這些系統。是以我們使用這些系統的時候要微調,要按照技術、語言,包括你所屬企業的所有知識來進行相應的微調,才能使得答案非常具有針對性,在你的公司裡使用這些模型的時候還要確定所有的利益相關方都能夠支援和使用,比如老闆、員工、客戶。同時你還要做一些焦點小組,讓他們去了解這些使用的案例,因為哪怕最佳的技術,如果使用的人對它都沒有信心,那麼它也會失敗,是以必須要有疊代的設計以及再設計,同時還有疊代型的檢測測試來確定每一個人都能支援這個體系。

就像我之前提到的一樣,LLM實際上就是預測下一個部分的規律,是以當你想去生成資訊的時候,它應該跟非常好的資訊建立連接配接,它需要有這樣的根知識源的連接配接,才能實作非常好的創新。

總的來說,我想說我們也不能夠僅僅按一下鍵就可以啟航了等等,我們還需要非常多非常好的指導、監督、設計、營運,我們需要有非常好的創意者和經營者,這樣AI才是一個非常好的基石。

大家想了解下一步會是什麼,紅杉資本也給我們提供了對于AIGC未來的預測,包括未來産生的圖像會更好,産品會變的更加具體、更有針對性,它們不僅僅是草稿,還會提供最終稿的檔案,會有更加準确的資訊。同時不僅僅是這些文本和圖像,視訊、計算機遊戲等等都可以通過AIGC的系統來産生。

下一步的人工智能浪潮是什麼?我們已經看到了,就像我之前提到的多模态的AI,這一點也是我自己感到特别親切的,大家都已經知道了多模态人工智能的重要性,還有新的系統,語言學習的人工智能,它們會建立一些比較小的軟體來做任務中的一部分。所謂的語言學習人工智能是特别令人興奮的,你可以給它一個任務,它可以自己來做,它會創造很多個人工智能的算法、很多生成式AI的功能,它會把任務分成很多個,一個一個地來完成。

另外在我之前所提到的一樣,我們還必須要能夠把系統使用的檔案公開給使用者,使用者才能信任這個系統,同時信任你。我們的專業領域也提到了所謂可解釋的人工智能,這個人工智能需要更加具有透明度,這樣我們就知道它使用了什麼樣的檔案、軟體,以及它是如何做出決策和回答。

如果上述這些我們都做到了,我相信我們的AI生成的内容,未來的前景将會非常光明。

繼續閱讀