天天看點

對話商湯董事長徐立:通用人工智能要麼很遠,要麼一下子就過去了

·就像站在高鐵站台上,高鐵朝人類快速開過來,人類定義這個站點就是AGI,結果高鐵沒停,一下子開過去了。是以AGI要麼離人類很遠,要麼一下子就過去了。

·大模型是一個表達器,今天,通過挖掘人的意圖,模型能力可以進一步提升,進而繼續做大模型。中國大模型的發展一定會用場景倒逼多模态大模型開發。

對話商湯董事長徐立:通用人工智能要麼很遠,要麼一下子就過去了

商湯科技董事長兼CEO徐立。

1964年,科幻作家亞瑟·克拉克預測未來,人類會成為進階生命的墊腳石。2019年,馬斯克在上海說過,碳基生物是矽基生物的引導程式。人類總是緻力于通往AGI(Artificial General Intelligence,通用人工智能),但哪一刻才是真正的AGI?未來的超級智能會對人類産生威脅嗎?

4月9日,在商湯科技釋出大模型“全家桶”前夕,商湯科技董事長兼CEO徐立對澎湃科技(www.thepaper.cn)表示,人類一直在朝着更強大的智能發展, 智能達到一定水準時确實需要坐下來一起探讨是否要限制智能。目前技術上仍然沒有實作超級智能的路徑,人工智能還沒有發展到令人恐慌的地步,當下要解決的是如何讓模型更通用。

AGI要麼離人類很遠,要麼一下子就過去了

在這一輪人工智能熱潮中,OpenAI帶着ChatGPT出圈,大模型、大算力的發展指向了AGI之路。人類總是緻力于通往AGI,但哪一刻才是真正的AGI?徐立打了個比方,“就像站在高鐵站台上,高鐵朝人類快速開過來,人類定義這個站點就是AGI,結果高鐵沒停,一下子開過去了。是以AGI要麼離人類很遠,要麼一下子就過去了,和人類相近的時刻根本測不出來。”

“有的人講AGI,但不講Artificial General Intelligence,而是講Digital Super Intelligence(數字超級智能),到了AGI這個時刻,它還是人工的嗎?這很難說。如果它真的到了人的智能水準,誰去按下按鈕,告訴它停在這裡,智能不能再高了?”徐立說,AGI本身的定義是模糊的,所謂的AGI在于人類如何定義它,如果拆分成行業裡的若幹任務,滿足行業的要求,就可以認為完成了行業的AGI。

徐立認為,自然語言模型的參數爆發帶來的“湧現能力”(Emergent Ability)在這一輪人工智能浪潮中勝出。在大型語言模型(LLM)中,湧現能力是指當模型規模跨過門檻值,對此類任務的效果就出現突然的性能增長。人們已經看到大模型湧現出了思維鍊的能力。

“谷歌發明了Transformer模型、RLHF(Reinforcement Learning from Human Feedback,帶有人類回報的強化學習)、CoT(Chain-of-Thought,思維鍊)。最後OpenAI不斷嘗試,ChatGPT突然臨界可用了,就好像所有機率都增長了0.1%,最後連乘起來的誤差就小。”

“對于湧現能力的解釋,是從量變到質變,它不是突變性的湧現。”徐立假設,将一個問題分解成多個子問題,如果每個子問題的準确率80%,連乘起來成功的機率很低。如果每個問題的準确率提升到85%,連乘後就出現了湧現能力。“目前看到的是大模型積累的準确率提升,形成了思維鍊的能力,這種湧現從數學角度上是可解釋的。”

盡管很難說未來的湧現到底會不會存在,但他表示,目前技術上仍然沒有實作超級智能的路徑,沒有看到真正的智能湧現是什麼表現。當被問及未來超級智能是否會威脅人類時,他認為,智能達到一定水準時,确實需要坐下來一起探讨是否要限制智能。新時代的人工智能三要素是算法(參數)乘以資料等于算力,算力規模決定了模型能力。隻要控制算力規模,就控制了智能。但人工智能還沒有發展到令人恐慌的地步,當下要解決的是如何讓模型更通用。而OpenAI帶給行業的一個革命性認知變化是帶來了大模型開發的新範式,就像當年的深度學習一樣。大模型是一個表達器,今天,通過挖掘人的意圖,模型能力可以進一步提升,進而繼續做大模型。

自然語言模型是橋梁,激活其他業态模型

國内科技企業搶灘大模型開發,目前仍處于追趕階段。“走好自己的路,就是要有一些差異化。所謂的差異化就是用好行業自身的禀賦。”徐立認為,中國大模型的發展一定會用場景倒逼多模态大模型開發,這種多模态大模型具有行業差異性。

而要真正達到大模型開發的“拐點”,就要設定一個預期的任務集或任務目标,完成真實場景中的系列任務,在這樣的垂直場景中能夠通過圖靈測試。“目前來看,大家都在往前走,至于走成什麼樣,其實還是要看大家所處的行業。不存在一個泛在式的大模型來解決所有問題。”

2019年起,商湯布局10億參數規模的視覺模型,2023年4月10日釋出“日日新”大模型體系,涵蓋1800億參數中文大語言模型應用平台“商量”、超10億參數自研文生圖生成模型“秒畫”、AI數字人視訊生成平台“如影”、3D内容生成平台“瓊宇”(場景生成)、“格物”(物體生成)等。

自然語言模型作為橋梁,可以激活其他業态的模型和應用。徐立表示,商湯用千億參數級的自然語言模型把其他模型串起來形成一個完整的任務集是第一步。“在這個過程當中,我們會看到有更多的多模态資料喂到網絡中,呈現完全新的能力,以此開發下一階段更加混合式的多模态模型。”

“日日新”大模型體系針對B端使用者,目的是和使用者的使用習慣完整連接配接,用更多B端場景挖掘模型的大能力,并提供新的多模态訓練架構,訓練下一階段的多模态大模型,通過細分場景端到端的疊代和應用,幫助多模态大模型的發展。“未來的模型趨勢是一個行業裡面可能有1-2個大模型,剩下的小模型、行業模型非常多。實際上自然語言模型也好,多模态模型也好,未來都是這個趨勢,大模型會開發出來,在每一層可以做很多模型疊加,對最後的推理來說也會有很大的性能提升。”

在人工智能領域,“模型即服務”不斷被提及,徐立也談到了大模型的商業化,模型的訓練和部署、模型下遊的應用及模型的增量訓練,整套服務疊加在人工智能基礎設施商湯AI大裝置上,“我們的收益來自于訓練模型、部署模型、推理模型,并且在模型上面還提供了一些增量的服務。”此外,收益還來自垂直細分領域,如金融、醫療、商業直播等。“在B端的應用當中,肯定會有很多的生産力工具先被發展出來,之後逐漸能夠有C端應用出來,就會百花齊放。”

繼續閱讀