天天看點

大模型一周年:造航空母艦、挖地找錢與正向回歸

大模型一周年:造航空母艦、挖地找錢與正向回歸

代碼輔助,大概占整個付費意願裡面50%以上的場景。

大模型一周年:造航空母艦、挖地找錢與正向回歸

文|《中國企業家》記者 闫俊文

編輯|李薇

圖檔來源|會議現場

2022年11月,基于GPT3.5的ChatGPT上線,引爆了全球的巨頭公司、投資人和創業者。一年的時間過去,在中國,它産生了100多個大模型公司和産品;在美國,它的母公司OpenAI經曆了管理層内亂;在歐洲,有關AI治理和安全的話題甚嚣塵上。

在AI時代,人們的共識就是不斷打破,然後重建。

12月9日~10日,由《中國企業家》雜志社主辦的“第二十一屆中國企業領袖年會”隆重舉行。在10日舉辦的“大模型一周年·挑戰與出路”論壇上,明勢資本合夥人夏令作為主理人,邀請網易執行副總裁、網易有道CEO周楓,小冰公司CEO李笛,智譜AI CEO張鵬,XSKY星辰天合CEO胥昕論道大模型一周年的挑戰與出路。

以下為核心要點:

1. AI的價值,慢慢會正向發展,回歸正常市場價值的方式去調整。

2. 現在企業自研投入,最主要的部分是在避坑上,而不是技術壁壘和方向上。

3. 堅持商業和技術兩條腿在走,公司成立的第一天就有客戶、有收益。

4.國外真正的AI落地過程當中最明确的一個需求、一個場景就是代碼輔助,大概占整個付費意願裡面50%以上的場景。

5.未來2~3年之内,我們希望能把通用計算模型能力實作到完全跟人的通用化能力對标的水準。

大模型一周年:造航空母艦、挖地找錢與正向回歸

以下為論壇實錄(有删減):

摸着OpenAI過河,也要有自己創新的路

夏令:AI給網易來帶來了哪些挑戰和哪些機會?

周楓:最近比爾·蓋茨發表了文章,他說,智能體或者大模型四大應用領域,這中間就包括教育、醫療、生活娛樂、生産效率。教育和生活娛樂都是網易的核心類業務,必須非常重視和應對。

大模型一周年:造航空母艦、挖地找錢與正向回歸

網易執行副總裁、網易有道CEO周楓

大模型是一個10年周期或者說5~10年周期的過程,如果大家去看移動網際網路,周期其實也是很長的,2011年出現微信這樣大的應用,2014年手機遊戲大幅起規模,一直到2017年才出現抖音、短視訊。

中國在大模型領域發展挺快的,但現在有一個很大的挑戰,我們非常缺少成功的C端應用,或者說大的應用。

從網易的角度來講,我們怎麼去抓這個機會,我們的看法是,核心就是要抓深度的應用。網易CEO丁磊講,大模型需要有人造航空母艦,也需要有人開航空母艦,我們先把航空母艦造好,這是我們的定位。對于有道來講,我們今年就做了子曰大模型以及更重要的是它深度的應用。

夏令:從技術上我們跟OpenAI肯定還是有差距的,但這個差距從這個技術上我們怎麼去追趕。有模型能力之後,自己怎麼去做商業,怎麼去做産品?

李笛:從今年2月開始,在混合模型的基礎之上,我們做40億級參數、130億級參數以及700億級參數,這是我們自己所認為應該布局的模型邊界。在這個基礎之上,我們跟OpenAI的對決更多的是像智譜AI跟OpenAI産生直接的對抗。另外一方面,我們也看到海外的公司也在嘗試去落地一些東西,讓這些東西能夠形成生态。

大模型一周年:造航空母艦、挖地找錢與正向回歸

小冰公司CEO李笛

以前,一個大模型公司或者在其他技術公司提供AI調用的時候,幫助企業創造了很大的價值,但是沒有收到相對應的回報。

比如小冰在日本有一個客戶羅森,2018年,我們給羅森做了一個銷售助理,可以給2000萬的羅森使用者提供資訊,每次我們給羅森drive(調用)幾千萬次,但羅森隻付我們10萬元人民币,按照調用次數去計算價值。今天在新的模型範式下,這些商業模式的問題仍然存在,還有賴于我們再去解決。

張鵬:我們開玩笑,OpenAI摸着石頭過河,我們摸着OpenAI過河,有人在你前面,你總歸還是要去朝着最頂尖的水準成功的目标去努力。這個過程當中不要忘記一件事情,還是要有自己的見解和自己的想法。

我堅信隻有自己在這個過程當中去堅持創新,也是一個長期主義,才能夠實作所謂的彎道超車,它比我們起步早,資源比我們豐厚,目前也領先我們比較長的時間。你想要趕上甚至超越它,一定要有自己創新的路。

從商業化角度來說,中國和國外确實差别比較大,一開始我們做大模型相關的技術和産品落地的時候就想得非常清楚,在這一點上,在中國,我們團隊更熟悉的方式是做to B,比較早在國内提出像MaaS(模型即服務)的方式,就是希望通過這樣一種平台化的方式,去賦能更多的企業、機構,讓大家在這個基礎上發揮AI能力,去創新形成更豐富的基于AI基礎設施的生态。

隻要大家認識到這件事情裡面的價值,慢慢會向正向,回歸正常市場價值的方式去調整。

平衡技術和商業化的關系

夏令:我們以前Infra(基礎設施)層,大家服務更多是偏雲計算、分布式計算這一塊,AI和之前的移動網際網路的Infra肯定有一些不同,您怎麼看這裡面的機會和挑戰?

胥昕:第一,大家對資料的生命周期看法不一樣了。以前大家積累很多資料,一個企業積累的資料不知道怎麼用,三五年前很多資料删掉了,沒有訓練的模式。現在有一個老師出現了,看完所有的資料随時回答你。

大模型一周年:造航空母艦、挖地找錢與正向回歸

XSKY星辰天合CEO胥昕

第二,資料一直積累。過去我們的資料有些在備份上,有些在CD光牒上,有些在錄音帶上,有些在硬碟上,隻有少部分資料在高性能存儲器上,但現在的資料需要高速地訓練和通路。

第二個變化,過去大規模的資料集存在硬碟上,現在存儲做得再好,對訓練來說還是很慢,需要記憶體,怎麼平衡記憶體到硬碟,甚至還有資料在CD光牒上的成本問題。大模型萬億級的托管司空見慣,你需要重新審視計算機的記憶體、網絡、硬碟的關系。

第三,過去誰讀資料?主要是人,百度一下,人是很慢的,現在,機器幫你去學習所有東西,機器告訴你,生成機器比人快數億倍,這時候對于你的檢索能力和資料讀取能力和寫入能力的要求數萬倍提升。

從這個角度來講,存儲不是第一個挑戰,而是網絡。今天老百姓或者從業者自己家裡面的WiFi快慢就有感受,從1000兆,現在都是40萬兆的技術,不到10年時間就演變了。

夏令:對于AI領域前沿技術的創業公司,你們怎麼去平衡技術的風險和商業化落地的短中期和長期不同的考量?

李笛:第一,看現在處于技術疊代的哪個時期,目前實際是處于技術疊代迅速噴發而出的時期,在這個時期堅持自研與否其實不是金錢成本的考量,而是時間成本的考量,就是說如果這個時候完全考慮必須要自研,自研之後才可以去嘗試某種産品或者商業模式的話,這個周期太長。

就算是投入,這部分在自研的時候最主要的問題是在避坑上,有很多基礎性的研究包括研發,能夠稱之為一個企業的技術壁壘的,通常都不是能夠一蹴而就的,如果方向錯了的話,花的錢和時間就太多了,隻能依靠過多的經驗判斷,有的時候你要做一些抉擇。

張鵬:這個問題确實是大家都很關心的問題,投資人都會問這個問題,怎麼來平衡技術和商業化中間的關系。我們一直是堅持兩條腿在走,因為我們公司成立的第一天就有客戶、有收益,可能和我們的投入相比,目前還不夠自己覆寫掉所有的成本。在技術突飛猛進的過程當中,每個點的突破或者每一個小小的突破都可能帶來一些新的機會,這個過程當中你就要敏銳地捕捉這些機會落地,想辦法轉變成你企業的商業化收益。

大模型一周年:造航空母艦、挖地找錢與正向回歸

智譜AI CEO張鵬

像預訓練模型這件事,最開始ChatGPT就是聊天,典型的簡單的收費方式就是我去做C端的使用者收費,比如像OpenAI,20美元一個賬号,但這個在國内環境裡可能不是那麼容易奏效。但是有另外一個類似的場景,幫助程式員寫代碼,這個付費意願其實比普通人聊天的付費意願要高很多的。

我最近也跟一些投資人在聊,國外真正的AI落地過程當中最明确的一個需求、一個場景就是代碼輔助,大概占整個付費意願裡面50%以上的場景。

是以我們也在做類似的落地,我們有自己的代碼生成模型,目前線上上也向全球超過每天10萬的使用者去提供數千萬行代碼的生成能力,也有很多企業說不滿足于免費的開放版本,它需要在自己的企業内部去部署面向自己内部的服務,他們是以願意付這個錢,因為它很清楚能算出這個ROI(投入産出比),我們在技術本身研發過程中找到的落地的點,逐漸把它轉換成C端的産品或者B端的産品這樣的方式把它轉換出來。

軟體開發的标準化産品和定制化開發之間的沖突為什麼會産生,有沒有可能靠技術的方法去彌補這兩者之間的差異,可能是智能體的這種方案,像OpenAI可能是一種路徑,我們怎麼用技術驅動的方式解決這個問題,進而産生更大的商業落地價值,這就是我們從技術角度看的問題。

當然過程中不可能全靠我們自己,還是要靠大家的生态,包括我們的合作夥伴。

胥昕:因為我們不是專做AI的,沒有趕上瘋狂疊代快速發展的難處,但我們的難處是研發周期很長,不管是資料庫、網絡、存儲,國産化意願很強的研發周期很長,研發周期可能長到6~7年,對我們來說最難的是,可能場景都變了,6年前可能沒有想到為大模型服務,但是現在可能再研發來不及了。對我們來說平衡短期和長期是另一種難,今天叫長期主義,怎麼平衡其實本質上長期是規劃、短期是壓力,平衡好規劃和壓力之間的問題。

規劃其實考的是你的視野和看到的東西,你看到Transformer2017年、2018年就有了,ChatGPT給大家的震撼是兩年的時間,預算、推理一系列的技術流5年前有端倪的。

我們2018年、2019年就立項了超高性能的面向訓練、預訓練這樣的資料流的超高性能存儲,但是問題在于賣不出去,因為那個時候沒有AI的生态。

第二點,我覺得技術的疊代不是大家想的,一下趕超英美,發射一個很牛的火箭就賺錢去了,可能中間要試出一些技術成果,商業化落地,平衡燒錢和養活自己的內插補點,不可能完全盈利。

以我們自己為例,可能2018年、2019年我們立項了超高性能,可能要去賣一些中間的過程給到客戶,可能有一部分超高性能,大部分是大規模,有一部分有點像訓練,核心其實是大資料,不是真正的AI,但這個過程中怎麼把中間的成果展現出來。難的在于,你在面向未來架構的中間态和當時大資料最佳的資料結構來拼競争,你不是最好的,但是你的架構是最可演進的,這個是很關鍵的。其實要說平衡商業化和平衡燒錢,我覺得可以翻譯成平衡長期和短期,再翻譯就是平衡規劃和平衡壓力之間的關系,我覺得一定是有方法論可以去遵守的。

我覺得對于企業來說,很多時候,首先你有沒有意願去平衡,第二才是你有沒有能力去平衡,如果有意願,能力是可以慢慢去積累的。

供應鍊完備化

夏令:大家期待的AI落地是什麼樣的,或者未來兩三年真正實作應用平衡點、關鍵是什麼樣的?

大模型一周年:造航空母艦、挖地找錢與正向回歸

明勢資本合夥人夏令

胥昕:我更關注生産領域、工業領域,我們看到,在太平洋彼岸,其實AI對各個行業沖擊是非常大的。

舉個例子,自動駕駛,其實談了好多年了,最近兩年才從基于規則到基于推理的,自動駕駛的變化是突飛猛進的。我們也看到先進制造行業、先進材料,哪怕做玻璃的、做薄膜的,都可以通過預訓練和推理方式來推測它的品質檢測。

張鵬:未來2~3年之内,我們希望能把通用計算模型能力實作到完全跟人的通用化能力對标的水準,現在已經看到一些跨模态的能力了,可能還有更複雜的規劃能力,完全可以對标提升到可用的水準。

第二,基于生成式AI的基礎設施能夠變成一種各行各業社會的共識,慢慢落地,形成現實中的基礎設施型應用形式。

第三,在這樣的基礎之上,我們能夠打造一個或者形成一個基于生成式AI的産業生态,讓大家都能夠在這件事情裡賺到錢,分享利潤。

李笛:10年前,小冰就是socail agent,過去兩三年,我比較期待的也是我們也在做的,不是一個狹義的社交網絡或者為了擷取内容,或者為了聯絡彼此,而是更多的人和更多的AI的instance能夠以各自的不同能力、不同性能、不同屬性混同在一起,聚集在一起做一些決策、聚集在一起做一些内容,互相之間有一種更長期的紐帶關系,我個人認為這是未來兩三年很值得期待的東西。

周楓:第一個,我非常希望整個模型以及到算力供應鍊的完備化,因為現在很多還存在國産化短闆的問題。我希望未來兩年能看到,不管外部環境如何變化,整個行業都能夠找到好的解決辦法,這也是國内大模型産業發展好的一個要點。

第二個,在教育領域,我希望大模型應用能夠幫到所有的學習者,能夠實作輕松學習或者終身學習的願景,使教育科技對教育發展起到非常好的推動作用。

繼續閱讀