天天看點

零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

作者:智東西
零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

作者 | 程茜

編輯 | 心緣

智東西5月13日報道,今天,在成立一周年之際,國内AI大模型獨角獸零一萬物重磅釋出系列産品更新。

閉源模型方面,零一萬物釋出全球SOTA千億參數閉源大模型Yi-Large,評測結果部分超越GPT-4,同時,零一萬物創始人及CEO李開複該公司正在訓練更大參數規模的MoE模型Yi-XLarge MoE。

在開源領域,零一萬物将早先釋出的Yi-34B、Yi-9B、6B中小尺寸開源模型版本更新為Yi-1.5系列,每個版本達到同尺寸中SOTA性能最佳。

開源位址:https://huggingface.co/01-ai

魔搭社群:https://www.modelscope.cn/organization/01ai

同時,李開複還介紹了一站式AI工作平台萬知,支援PC網頁和微信小程式使用,能做會議紀要、周報、寫作助手、PPT,解讀财報、論文等各類檔案,同時可以在1-2分鐘内生成PPT。

零一萬物成立于去年5月,一周年之際其産品矩陣重磅更新,2023年11月釋出首款預訓練大模型Yi-34B之後,其已經形成了面向開源、閉源和B端、C端的完整産品矩陣。

在媒體交流環節,李開複分享說,零一萬物的C端海外生産力應用今年收入預計将達到1~2億元,以國外使用者訂閱付費為主。

通用人工智能(AGI)是李開複40多年來的夢想,據他透露,他曾在一年前向投資人承諾10年不套現,上市是零一萬物團隊未來兩年會努力的目标。

李開複看好國産晶片的發展,稱零一萬物将在合适的時候去采用國産晶片,同時創新工場一直在關注這方面的投資。零一萬物的模式比較務實,會持續探索如何用最少的晶片、最低的成本訓練出最好的模型。

此外,李開複也提到自己最近開了抖音号,将直播分享技術、産品以及一些觀點。

一、千億參數閉源大模型評測超GPT-4,已啟動Yi-XLarge MoE,将沖擊GPT-5性能

零一萬物釋出全球SOTA千億參數閉源大模型Yi-Large,并同步開放API,允許開發者調用,在此基礎上還釋出了一站式AI工作平台萬知。

李開複透露,經測試,Yi-Large評測結果已經至少達到對齊GPT-4,部分名額超越GPT-4。

零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

在第三方測評結果中,Yi-Large在斯坦福英語測評中位居第二,僅次于GPT-4-Turbo,中文SuperCLUE結果中,位于國産大模型榜首。

零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

此外,零一萬物正在訓練的基于MoE架構的更大模型Yi-XLarge MoE,目前初步訓練結果顯示,Yi-XLarge MoE的各個名額都已經超過Yi-Large,将沖擊GPT-5的性能與創新性。

零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

在此前開源的6B、34B模型之上,今天,該公司宣布Yi-1.5開源系列同步更新,開源了6B、9B、34B不同參數規模,以及預訓練、Chat模型等,包括Yi-34B Base+Chat、Yi-9B Base+Chat、Yi-6B Base+Chat。

零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

李開複稱,Yi-1.5系列模型已經全面超越Gemma、Mistral以及Llama-3-8B模型,測評結果顯示,Yi-1.5系列中34B模型在34B-50B模型中處于絕對領先地位,并且一些名額中表現甚至不遜色于70B模型。

那麼,開源、閉源模型如何見使用者?第一種方法是調用API,零一萬物宣布面向國内市場一次性釋出了包含Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark等多款模型API接口。

此外,還有價錢相對較低的API,包括基于開源34B模型微調出的Yi-Vision、多模态視覺模型Yi-Vision以及參數規模更小的Yi-Spark。

零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

目前零一萬物已經提供了免費的額度,供開發者使用,李開複透露說,初步接觸的開發者中有80%選擇從原來的模型轉移到使用零一萬物的模型。

據零一萬物API平台負責人藍雨川透露,Yi-Large API的定價是20元對應百萬tokens,大概是GPT-4 Turbo成本和定價的1/3,對比其他大尺寸模型同樣非常有競争力。同時零一萬物還提供了更快更便宜的Yi-Large-Turbo。

二、一站式AI工作站萬知上線,速讀超長文檔,2分鐘生成PPT

零一萬物一站式AI工作站萬知有微信小程式和PC網頁版。使用者通過使用萬知既可以閱讀海量資料、分析圖表和文字,又可以在1-2分鐘内生成PPT。

零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

李開複談道,所有應用都應該是AI原生,未來生産力工具的使用模式會徹底被颠覆,使用者提出指令,大模型就可以生成各種内容。

他現場展示了萬知的各項能力。

首先,當問到“我要做台灣鹵肉飯,請給我食材表格、和做法時間步驟的思維導圖”。萬知通過表格呈現了鹵肉飯的食譜,還通過思維導圖呈現了制作的步驟。

零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

在回答關于北京的熱門演出時,萬知給出了具體的活動時間、地點,還會有甘特圖呈現出來,使用者根據自己的時間空閑就能清晰看到演出的具體資訊。

萬知也可以快速閱讀了解PDF文檔、了解圖表。将PDF文檔上傳後,萬知在閱讀完成後,右邊就會生成總結和建議提問。

面對PDF中的單一圖表,萬知會根據上下文生成内容,如下圖中“關于2010年至2022年間按地理區域劃分的被授予AI專利百分比”的圖表,萬知會給出圖表的來源以及其中呈現出的明顯趨勢供使用者了解。

零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

此外,萬知作為生産力工具的場景中,還能快速生成PPT,當為學生介紹什麼是AI,PPT内容需要深入淺出,還要有精彩的圖檔。萬知首先會自動總結PPT内容應該涵蓋的重點,然後直接生成PPT。使用者如果對PPT中某一頁圖檔不滿意,也可以通過AI增強搜圖快速換圖。

李開複稱,萬知生成的PPT比微軟Office Copilot的效果更好,一個PPT的制作時間大概在1-2分鐘左右。

三、大模型走向普惠,AI 2.0時代TC-PMF成關鍵

關于對未來的沉澱和展望,李開複談道,最近有一個熱門的讨論:一些人認為我們應該瘋狂追求AGI,AGI一旦發生就會改寫全部;另一部分人認為模型做得越大越難用,我們應該快速找到PMF(産品市場比對度)。

他認為,這兩種觀點都對,但都不完整,沒有一家公司可以隻靠技術長期領跑所有公司,一定是靠非技術優勢,也就是最終産品的勝出。

是以,企業不能忘記PMF重要性,但在AI 2.0時代還需要考慮TC-PMF(Product-Market-Technology-Cost Fit,技術成本 X産品市場契合度),其中T代表技術,C代表成本。

零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

今天模型基于Scaling Law在快速演進,企業需要不斷預測未來技術的走向,同時整個行業的推理成本過高,社交、電商、短視訊等很多應用無法全面嵌入AI,企業需要不斷降低推理成本。

在應用方面,一般來說要實作最佳的AI-First應用,需要頂級模型才能實作。但有時候一些應用會先爆發,可以在更小的模型上實作。

針對上述這些現象與行業的痛點,李開複剖析了零一萬物一直以來堅持的4個發展原則。

首先,零一萬物的産品面向全世界,其單一産品今年收入達到1億人民币,産品ROI接近1,上線9個月海外産品使用者數已經接近千萬。

零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

第二個特點是模基共建,李開複談道,國外大廠的GPU數量達到國内創企的10倍以上,在這樣的背景下,零一萬物的模型和推理團隊有基本一樣的規模。

在訓練方面,零一萬物此前和英偉達合作,成為全球前三實作FP8訓練的,也就是說可以從頭到尾使用FP8精度實作更快速訓練。他補充道,在這一技術的累積下, 其訓練成本相比同行能低一半左右。

第三個特點是持續重視使用者體驗,模型的價值産生在對使用者的價值,一個很典型的功能就是萬知對于圖表的分析,而不是普通照片的了解。

零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

最後,對所有大模型玩家的一個考驗是,企業需要考慮如何同時開發産品、了解市場和使用者,還要關注技術發展的速度以及模型能力的演進、成本下降等。這裡所需要的能力Know-How,包括足夠的前瞻性,還需要是否可以以獨立的力量實作、執行力等。

零一萬物千億參數模型Yi-Large釋出,新MoE模型對打GPT-5

李開複認為,在此基礎上,零一萬物有四大優勢,零一萬物的技術、産品以及創新工廠的研究人員可以預測技術發展趨勢、對産品的打磨能力和耐心、投資人的預測能力、推理團隊不斷降低推理成本。

談到大模型能力轉化為生産力所看重的市場回報與資料名額,零一萬物生産力産品負責人曹大鵬分享說,産品在0-1階段重點關注長期留存率,包括能否産生使用者自發傳播的口碑,在1-100階段會更關注增長速度是否足夠快、商業模式和付費轉化等名額。

在打造AI-First應用時,零一萬物看重技術和成本,既要在模型能力上達到全球領先水準,又要從使用者視角出發,降低價格同時品質滿足使用者需求。

結語:開閉源矩陣雙輪驅動,零一萬物瞄準AI原生應用

成立一年,零一萬物的産品矩陣擁有開源、閉源模型,且應用方向涵蓋B端、C端,其正在基于底層大模型強大的了解推理能力,去挖掘使用者日常的核心痛點,如制作PPT、分析圖表等,使得AI原生的應用真正出現。

今年以來,在全面趕超國外頂尖大模型的同時,國内諸多大模型應用爆發,深入使用者生活、工作的方方面面,産業競争的焦點正在轉移,未來随着模型性能的進一步增強,以及這些應用與使用者的距離被拉近,AI原生應用的更多高價值場景将被挖掘出來。

繼續閱讀