天天看點

王小川:OpenAI正嘗試把1000萬顆GPU連在一起

王小川:OpenAI正嘗試把1000萬顆GPU連在一起

王小川:OpenAI正嘗試把1000萬顆GPU連在一起

作者 葉蓁

編輯 康曉

出品丨深網·騰訊新聞小滿工作室

AGI大模型,無疑是2023年最炙手可熱的風口。自2016年開啟人工智能元年,AI産業已經曆好幾輪洗牌,借着ChatGPT的東風,通用人工智能大模型創業再次被置于聚光燈下。 

“這個時代跟淘金時代很像。如果你那個時候去加州淘金,一大堆人會死掉,但是賣勺子、賣鏟子的人永遠可以賺錢。大模型是平台型機會;以模型為先的平台,将比以資訊為先的平台體量更大。”奇績創壇創始人陸奇表示。

工信部等機構釋出的報告顯示,中國AI大模型專利申請總數已突破4萬件。僅上半年,國内已有70多家大模型創業公司,而在技術、算力和融資能力等多方面比拼中,大模型創業公司的洗牌正在加速。 

AI大模型對中國創業者來說意味着什麼?中國大模型未來技術突破和核心競争力會在哪些方面?在2023年騰訊ConTech大會上,長江商學院教授、數字化轉型中心主任孫天澍,與百川智能創始人、CEO王小川,複旦大學計算機科學技術學院教授、Moss系統負責人邱錫鵬就此展開對話。

王小川給出了自己的答案,“理想上慢一步,落地上快三步。”王小川認為,與ChatGPT相比,從信仰層面、資源層面我們還有差距,但是到業務層面,大模型和應用的結合我們确實強很多,像淘寶、微信,包括抖音,中國網際網路的産品體驗是遠遠優于美國的。

私人助手和娛樂産業,是王小川所見的未來最大的商業應用機會。

邱錫鵬則表示,趕超ChatGPT要結合目前大陸具體的實際情況,比如靠産業的帶動,從中産生的需求,再把它轉化到技術研究上。“我們技術研究的問題,要由真實的需求凝練出來,是以産學研合作在下一步變得非常重要。”

以下是孫天澍與王小川、邱錫鵬對話實錄,經《深網》編輯整理:

“中國大模型的應用會跑得更快”

孫天澍:相比美國,我們大模型技術研究,還在學習還在突破。在産品應用領域,中國的公司基于自己上一代的網際網路經驗,産品經驗,以及基于中國大的消費市場,在産品應用能不能做到全球領先?

王小川:我今年提了一個概念,理想上慢半步,落地上快一步。就是覺得我們中國的機會,不是技術科研上跑得更快,但應用是我們能跑得更快的地方。 

我6月份去了一趟美國,跟OpenAI和其他做大模型的同行做了很多交流,回來之後這個話改了,從“理想上慢半步,落地上快一步”,變成了“理想上慢一步,落地上快三步”。

OpenAI在技術積累和投入、場景布局上與我們是有很大的差距,OpenAI到現在已經幹了7年了,我們才一年的時間,它還有百億美金投進去,持續發展它的核心技術。我跟他們聊的時候,我說你們現在還做什麼研究嗎?他說我們現在正在嘗試把1000萬顆GPU連在一起訓練一個大規模的模型。

什麼概念呢?英偉達一年大概生産100萬顆GPU,訓練GPT4要2.5萬顆,GPT3.5國内對标4000顆,我們現在做4000顆對标的事情,他們是在研究如何用1000萬顆GPU做這個工作,從資源層面我們是遠遠不夠的。

但是到業務層面我們确實強很多,像我們的淘寶、微信,包括抖音,中國網際網路的産品體驗是遠遠優于美國的。

我們培養了大量的産品經理,是以這種情況下,我認為我們是有巨大的經驗和優勢的。要把它發展起來,有兩個難點需要解決,一個是你要有模型,模型差一些可能就落後一些,是以我們得用更多的聰明才智去彌補,甚至做模型公司跟應用公司要結合,用開源和端到端的模式解決。

國外模型技術強的公司并不代表它擅長做應用,這是第一件事情,模型跟應用的能力合作。

第二,産品經理也會有一些相對的轉型和提升。以前産品經理叫PM,怎麼能夠定義好産品是符合市場需求的。以前遇到難題的時候,我們預設技術不是瓶頸,比如做微信,雖然大家對技術有要求,但是這個是能實作能達到的,更多是工程效率和穩定性的問題。今天是一種算法帶來的産品,這對産品經理而言,他懂得什麼樣的産品今天技術是夠用的,甚至走一步還能夠引領技術的發展。我對技術的評測,我的測試集是什麼,怎麼評價好不好,怎麼讓算法工程師跟上這個步伐。

是以,這個時代的産品經理要對技術有判斷和評價,解決這兩個問題,中國的應用就能走在美國的前面。

孫天澍:從基礎研究的角度,第一,AI大模型的基礎研究怎麼往更有效率的方式走,小模型、小資料,這是從平民化角度。第二個次元更加拉開,計算機的研究、人工智能的研究,大模型對于整個自然科學領域的研究帶來哪些沖擊和變化?

邱錫鵬 :我們離OpenAI算力的差距太大,我感覺對OpenAI能保持緊密的跟随。一方面能夠鍛煉我們的技術,另一方面保持不掉隊,培養人才,能夠達到非常好的效果。 

但是具體趕超,還是要結合目前大陸具體的實際情況,比如靠産業的帶動,從中産生的需求,再把它轉化到技術研究上。我們技術研究的問題,要由真實的需求凝練出來,是以産學研合作在下一步變得非常重要。

另外一方面,不管是AI本身研究還是給整個科學研究帶來的沖擊,有可能它的範式會發生變化。AI for  Science,它依然還是傳統的AI的模式,靠大資料,人去标大量的資料,去訓練一個模型。這個模型可能是專用的,給結構預測來使用,不能幹其他的事,隻能幹這個事。現在的大模型或者以大語言模型為中心的新一代通用AI技術,是先用語言來打底,構造一個非常完整的系列知識。很容易把人的各種經驗通過語言作為載體附加到模型中。

在非常多的科學研究應用上,模式和形态可能跟以前不一樣。未來會更加側重科研發現,類似于科研探索,或者主動讓他得到一些新的結論。這是之前AI for Science技術沒法完成的。

“平民化與兩大商業機會”

孫天澍:大模型在消費網際網路C端的産品形态和商業機會有哪些?到底是網際網路大廠的機會,還是新一代創業公司的機會?

王小川:我先從第二個事情說起,大廠還是創業公司的機會?今天我覺得大模型來了以後,不管是大廠還是創業公司,都已經很狂熱的研究相關技術。我的看法是大廠至少在現有的産品疊代更新裡面有挺多空間,人員密集型的地方可以用大模型來做替代,也能夠更新自己的産品。

但是對創業公司而言,死亡率會更高,很有可能最大的創新突破是屬于創新公司的。行業之前做大模型,有一個概念叫做大創新靠小廠、小創新靠大廠。是以今天大廠本身這樣的一種體量也會有大模型,隻要增加1%就是巨大的收益。但是最大的創新可能來自于創業公司。新的一波機會,我們的看法是從資訊時代走向智能時代,一個大的時代,就像之前工業時代一樣,會有新的公司起來,是以我仍然覺得空間蠻大的。

C端我想分成兩部分,第一個概念出現類似人的助手,因為大模型到今天最大的變化,它不是一個工具。它是我們的夥伴,它自己開始會說話,跟人進行溝通,會語言了,動物和人的差別就是掌握語言。大模型語言今天掌握的不比人差,還有世界知識。是以,它是能夠陪伴我們的夥伴角色。是以很大的概念就是助手,能成為各種各樣的助手,你的寫作助手、問答助手,甚至變成私人老師、私人醫生、私人律師,是拟人的角色。

第二,娛樂行業有巨大的需求,構造虛拟的實體世界。我們知道人除了工作創造以外也需要休閑,大模型可以做情感陪伴,它不僅可以拟人,甚至可以拟出一個虛拟世界來。我管它叫太虛幻境,裡面的故事情節,房屋空間構造,大模型都可以去虛幻。對于娛樂、遊戲行業會有很大的變化。大語言模型能建構出世界觀和世界中的自然、社會、文化邏輯,包括實體規則,都可以構造起來。

是以娛樂行業和助手,這是所見的C端裡重大的兩個方向。

孫天澍:未來開源模型在海外,在中國會不會收斂到一到兩個模型?為開放生态進一步發展,大模型公司還需要做哪些準備?國内大模型公司需要在能力上做什麼準備,能夠達到像OpenAI和Agent智能體未來開放生态布局?

邱錫鵬 :大模型現在生态變得非常開放,這裡有非常多的參與者。這裡涉及到平民化的問題。平民化可能分成兩個:一方面,因為大家都在圍繞着某個開源,甚至不開源,像GPT也可以,圍繞着一個比較大的生态圈,如果提供非常好的個性化、定制化能力的話,就是技術棧,因為參與者很多,積累凝練的也非常多。确實會降低很多研發成本。

但從另一個方面,類似算力成本和計算成本相對來講還是比較高的,是以還是有一定的阻礙。現在有比較高能力的支援非常蓬勃的生态發展包括GPT個性化,包括所謂的各種工具的使用、任務規劃等等,這些能力相對來講還是需要比較大的模型。

這些大的模型計算成本還是比較高的。是以可能在目前來講,特别是在國内,由于成本的原因還不能廣泛地應用到每個人身上,讓它變成每個人的助手。是以在将來,如何去進一步提高模型的效率?把大模型進一步壓縮,甚至有一些新的架構出來,來降低它真正的計算成本,讓每個人都能用得起,這才能達到真正的平民化。機會也是非常多。

繼續閱讀