天天看點

62歲李開複,又有了新身份

作者:創業邦
62歲李開複,又有了新身份

作者丨趙曉曉

編輯丨關雎

圖源丨零一萬物

5 月 13 日,上午 10:00,李開複準時出現在鼎好大廈的A座20層,一身藏藍色西服套裝,淺色襯衫配領帶,三七分的發型,跟去年 3 月份的一場分享會上穿着幾乎一緻,唯一差別是臉上多了一副眼鏡。

這是零一萬物成立一年後,李開複首次在媒體面前公開露面,他回答了關于新品和零一萬物的一切,并首次對去年涉及Llama架構的争議做出回應。

零一萬物去年7月上線,11月釋出了首個模型Yi-34B,半年後的今天又釋出了新的千億參數閉源模型 Yi-Large 和首個國内to C産品 “萬知 AI”,李開複還親自出任萬知的CEO。

在斯坦福的開源評測項目 AlpacaEval 2.0 上,Yi-Large 英語能力主要名額 LC Win Rate(控制回複的長度) 排位世界第二,僅比 OpenAI 今年 4 月釋出的新版 GPT-4 Turbo略輸一點,勝率(Win Rate)則排到了第一。在中文能力上,SuperCLUE 更新的四月基準表現中,Yi-Large 位列國産大模型之首。

62歲李開複,又有了新身份

斯坦福AlpacaEval 2.0 Verified認證模型類别,英語能力評測:零一萬物的Yi-Large Preview 的 LC Win Rate為51.9%,排第二,Win Rate為57.5%,排第一。

去年零一萬物陸續上線的 4 個海外産品中,有一個生産力産品的 ROI (投資回報率)已經實作了 1,這就表示增長還可以更激進。海外産品的收入主要來自C端使用者付費,“今年會有1-2億元收入、近千萬使用者。” 李開複說。

這是一場既要速度又要技術的較量。今天的AI環境與上一次四小龍時代完全不同,它能帶來真實的價值,大模型的臨界點是AI普惠點,誰先點燃這個點,它會成為一個行業裡的巨頭。

有人把李開複稱為“最年長的” 中國大模型創業者,他今年已經 62 歲,零一萬物也成為中國六家大模型獨角獸之一。40 年前,李開複在博士論文申請信裡寫到,“AGI就是我的夢想。”

“我這次創業,十年都不會套現。”李開複說。

做AGI 時代的微軟

去年 3 月的分享會上,李開複把AI 2.0定義為“絕對不能錯過的一次革命。”它的巨大躍遷之處是克服了AI 1.0單領域、多模型、沒有實作商業化的限制,能帶來真實的價值。

“比如生産力的 AI 應用,過去從來沒有一刻可以做到别人幫我寫報告、寫文章和做 PPT,也從來沒有一個軟體,可以幫我分析總結一千頁、甚至一萬頁的文字。”李開複說。

2022 年底,ChatGPT出現後對市場進行了最快速度的教育。GPT4釋出後,成為大模型領域的“一個金标準”,同時還點燃了 to B 跟 to C 的機會。

一家公司如果抓住了一次技術浪潮,它會成為一個行業裡的巨頭,如果兩次技術浪潮都能抓住,它就會成為一個世界性的卓越公司。

“是以我們要自己下場做。”李開複說。

李開複1983 年開始在卡耐基梅隆大學攻讀計算機博士,對人工智能領域已經有近 40 年的研究。過去十幾年,他一直是創業者背後的支援者,這次走向台前,是因為他相信這是人類有史以來最重要的技術,不能錯過這次革命。

零一萬物的起點是海外,to B。

去年 9 月,零一萬物在海外上線了4 款産品,其中有一個生産力産品的 ROI(投資回報率)已經實作了 1。這意味着,零一萬物從使用者手中收到的訂閱費,已經低于擷取使用者成本加 GPU 的成本,擺脫了“燒錢獲客。”

李開複和團隊有一個标準,一般至少要看到ROI達到 0.6 才會開始推,否則使用者越多越虧錢。如果産品推到了 1,就表示增長還可以更激進。4款海外産品裡,娛樂、陪伴類的ROI 還在較低的階段,生産力産品已經給零一萬物帶來了一個億的收入,有近千萬的使用者。

去年11 月釋出的開源模型Yi-34B,在權威榜單中超越了Meta AI研發并開源的 Llama2-70B、阿聯酋的技術創新研究所開發的Falcon-180B等大幾倍的模型,成為當時世界範圍内開源最強基礎模型之一。

釋出會開始的前夕,零一萬物的團隊連夜在 Hugging Face、魔搭社群等海外社群上線了六個 API ——Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark ,“一早起來就看到Reddit上的讨論非常火熱。”

目前,零一萬物的海外産品模型選型是Yi-Large 加 GPT-4 的組合,“最開始推出的時候我們的自研模型還沒有做好,Yi-Large在海外上線後,會成為我們實時對比測試自研模型的平台。”零一萬物生産力産品負責人曹大鵬說。

“現在我們完全有底氣把已經達到PMF(Product Market Fit,産品與市場互相比對)的産品,再推回中國。”李開複說。

海外的AI生态已經非常繁榮,很多AI原生應用已經誕生,甚至達到了數千萬美金的收入,也有很多的成熟産品和公司用OpenAI的 API做出了自己的第二曲線新業務。相比之下,國内會慢一點,還在探索階段。

零一萬物暫時不做國内的to B業務,不接項目制的訂單,是因為李開複覺得國内還沒有逃離上次 AI 1.0 的魔咒——一些很優秀創業公司,陷入了一個高成長但低品質的惡性循環裡。

to C相對好做一些,萬知是零一萬物的第一款C端産品,精準切入了“找、讀、寫” 職場人的三大需求,也是業内第一款具有“AI-First”理念、将模型能力與應用場景完美融合的to C應用産品。

“所有的應用都應該是AI-First、AI-Native,沒有AI就不成立。”李開複說,“比如PPT 制作功能,在國内外就很少看到。”Google前CEO艾瑞克·史密斯對此給予的肯定是,“資訊包裝是500億美金的市場”。

零一萬物會做很多事,海外、國内,to B、to C,它Day One 就是一個全球化的是公司。公司已經啟動下一代 Yi-XLarge MoE 模型訓練,沖擊 GPT-5 的性能與創新性。

“我們的理念就是要做AGI 時代的微軟。”李開複說。

每個公司都要找到自己的TC-PMF

任何時候,創業者都要學會在相對充分的資源裡,尋求成本和效率的最優解。

李開複定義了一個新的詞彙:TC-PMF——在尋找産品與市場比對點的基礎上,加上了技術(technology)和成本(cost),這是一個四維的比對。

強調技術和成本,是因為李開複認為,PMF已經不能完整地定義大模型的創業了,因為要考慮到模型現在的技術能力、之後的發展情況和推測成本。

“現在的AI 和移動網際網路有一個很大差别,就是移動網際網路沒有推理成本。”李開複說。

比如某些應用需要 AI 不能有幻覺,那麼現在的技術就有挑戰;有些應用需要大尺寸的模型或者長文本視窗,但這可能帶來 50 秒的推理延遲,如果處理一百萬token ,就要花 75 塊錢。

在移動網際網路時代,PMF曾是衆多初創企業追求的核心目标,使用者規模增長所帶來的邊際成本很低。但在大模型時代,模型訓練和推理成本都很貴,是每一個創業公司都會面臨的增長陷阱,很多公司會是以胡亂燒錢,走向破産。

“是以每個公司都要找到自己的 TC-PMF。”李開複說。他把TC-PMF即将在一個應用領域出現的那個點叫AI普惠點,隻有達到這個點,技術、模型和成本之間才能達到最完美的比對狀态。而在這個點來臨之前,企業要先把産品做出來,等待時機,成為一個Popular App。

抖音成為Super app的時間點有兩個,第一個點是4G的普及,第二個點是安卓千元機的普及,兩個點的先後到來,一下子把短視訊市場擴大了100倍。

最快找到的方式是自己做推理引擎,這需要很強的模型團隊、AI Infra(基礎層)團隊和應用團隊,三個團隊成為一體,互相配合。這是一件聽起來簡單,但做起來很難的事情,也是企業自建推理引擎遇到的最大挑戰。

零一萬物團隊是國内極少數能吸引到谷歌、微軟在内的高水準算法人才的公司,除了團隊之間配合默契外,他們尤其重視 AI Infra的優化工作:從選擇伺服器到設計機房和部署 GPU,再到建向量資料庫,都是自己來,自己掌握降低推理成本的節奏。

“好處是,别人的推理成本降低十倍時,我們可能降二十、三十倍。”李開複說。多方面優化GPU 成本後,其訓練千億參數的 Yi-Larege 模型時,同比下降了一倍左右;接入自研向量資料庫後,成本比用第三方向量資料庫下降至18%。海外 TC-PMF 已經進入ROI為正的階段。

必須自己找 TC-PMF,還因為李開複相信,“沒有一種技術可以吃一輩子,一定要找到技術之外的壁壘。”

他舉例,移動網際網路時代,為什麼安卓、蘋果、微信這麼強,抖音還能殺出來?

就是因為位元組跳動很早就預測到了用 AI 來推薦短視訊,找到了自己的PMF,把握住時間視窗,打造了非常高的使用者粘性和成長率。當它成為一個有海量使用者的普惠應用,微信就再也沒辦法複制抖音、把它殺死了。

大模型推理成本的下降會推動中國AI大模型進入“落地為王”的階段,李開複判斷,今年會迎來“大模型應用爆發元年”,明年下半年,将迎來大模型普惠應用的井噴期。

“做AGI 是我的夢想”

李開複現在有四個身份:創新工場創始人、投資人、零一萬物創始人、萬知CEO(Chief Experience Officer首席體驗官)。

62歲李開複,又有了新身份

2009 年,李開複在北京中關村成立了創新工場,開辟了中國風險投資和創業的新模式,至今他已經做了 15年的投資人。在AI 1.0時代,創新工場投了第四範式等10多家AI獨角獸企業。

去年李開複 61 歲,他選擇成為一名創業者,這個年紀已經是大多數人的退休年紀,隻因為他看到了人類有史以來最重要的技術,才決定“再努力一把。”

這也是李開複40多年前寫進博士申請信裡的夢想,希望未來有機會能在AGI領域做一些事。過去幾十年,他一直在研究AI可能會對人類産生的影響,并先後出版了三本相關書籍,多數人對他“儒雅”的印象也都源于他“作家”的身份。他還建議年輕人多了解AI,别隻關注“AI會不會取代我們的工作。”

成為萬知CEO是因為他沒給自己設其他選項,“從一開始我就考慮自己做CEO,”李開複說,對于首款to C産品,他覺得前期還需要傾注更多心血去發現問題并及時修善。從萬知上線到現在,他每天都會測上一百條以上的問題。

最有價值的修改建議是搜尋框的加長,這是他在谷歌時遇到的問題,使用者在搜尋框輸入兩三個字搜不出來東西,輸入十個字結果就變好了,最後解決方案是做了一個更長的搜尋框。

據零一萬物 API 平台負責人藍雨川透露,零一萬物今年在C端收入會在1-2 億元,微軟的Office每年有幾十億美金的收入。“生産力産品市場的天花闆非常高,我們也在思考如何把人工智能工作空間做得更大。”藍雨川說,作為結果,零一萬物可以擴充海外市場,比如去中東、東南亞。

過去一年,李開複成為非常有熱度的人物,一多半是因為零一萬物在短時間内上線,又在短時間内推出了多款新品,并在天使輪就成為獨角獸。另一小半是因為陷入Llama架構的争議。

“套殼的說法純屬子虛烏有,當時有很多技術專家寫過詳細文章解釋了。”李開複說,中國大模型的架構都是基于Transformer或 Llama 的架構,技術圈對 Llama 架構這個稱呼本來就不同意。

“對于大模型來說,權重更高的是訓練本身以及通過訓練獲得的參數和代碼。零一萬物 Yi 模型是從零開始訓練,自己獲得的參數和代碼,沒有參考任何 Llama 或其他模型的參數。” 李開複說。

今天的AI已經是個充分競争的市場,比拼的不止是技術、團隊,還有心态。對于AI,李開複是有點偏執在的,他專注于把産品做好,其他的事情交給市場去驗證。

他最近還開了抖音号,但不是為了直播帶貨,是為了分享好的技術和産品。站在投資人身份的角度,李開複說如果他手裡有很多錢,會全部投給零一萬物。

這次創業,李開複的期望是“沖一下萬億美元”,AGI是一個很大很大的夢想,不能隻是為了賺點錢。

他也承諾投資人,十年不會套現。