天天看點

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

作者:智東西
位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

智東西

作者 | 三北

編輯 | 雲鵬

智東西4月18日報道,今日,位元組跳動旗下火山引擎宣布自研DPU(Data Processing Unit)成功應用,已部署上萬台DPU伺服器,成為業界少數幾家具備自研DPU能力的雲廠商。

火山引擎宣布推出三款基于自研DPU的計算執行個體,分别基于NVIDIA GPU、Intel CPU、AMD CPU,其中NVIDIA GPU計算執行個體相較上一代實作3倍性能提升。

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

同時,火山引擎還推出了新版機器學習平台,上線模型效果對比等服務,平台支援單任務GPU萬卡叢集大模型訓練、微秒級延遲網絡;推出智能推薦-高速訓練引擎,據稱支援100GB-1TB超大模型高速訓練。

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

當下正值大模型掀起AI時代的新浪潮,火山引擎試圖從算力、平台等各層面為客戶提供必要的“入場券”。

火山引擎總裁譚待談道,國内有數十家做大模型的企業,大多已經在火山引擎雲上,包括MiniMax、智譜AI、毫末智行、昆侖萬維等知名企業。比如MiniMax據稱是首家在公有雲上實作千卡訓練的公司,于2022年與火山引擎合作推進大模型常态化訓練,并推出了超大規模推理平台,據稱支撐單日過億次調用。今日,金山辦公WPS AI宣布将嵌入全線協同辦公産品,WPS AI采用的正是MiniMax大模型。

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

可以看到,“火山引擎+MiniMax+WPS”這樣的國内大模型實踐,正在開辟有别于“微軟+OpenAI+Office”的大模型落地新通路。

會上,智東西與部分媒體對火山引擎總裁譚待、位元組跳動副總裁楊震原進行的采訪。

當智東西問到火山引擎圍繞生成式AI在IaaS、PaaS、SaaS領域有什麼樣的布局時,譚待稱,就像記者提到的AWS等雲廠商選擇與第三方合作(如推出生成式AI平台支援企業調用第三方大模型),火山引擎也是這個思路。火山引擎本身不做大模型,而是服務于大模型創業公司,共同開展對外服務。

火山引擎是位元組跳動于2021年6月推出的雲服務業務闆塊,至今逐漸完善了IaaS+PaaS+SaaS雲服務體系。靈活疊代、資料驅動、體驗創新是火山引擎的核心戰略點,圍繞這些要素本次火山引擎還推出了分布式雲原生平台、混合雲veStack、火山引擎管理駕駛艙Plus、雲遊戲、創意互動Vlog等不同層面新品。

會上,火山引擎宣布與位元組跳動國内業務并池。基于内外統一的雲原生基礎架構,抖音等業務的空閑計算資源可極速排程給火山引擎客戶使用,據稱離線業務資源分鐘級排程10萬核CPU,線上業務資源也可潮汐複用,彈性計算搶占式執行個體的價格最高可優惠80%以上。

一、自研DPU落地超萬片,計算執行個體3倍性能提升

天下武功,唯快不破。面向企業靈活疊代的算力需求,譚待宣布,火山引擎DPU目前已成功應用,在位元組内部已部署上萬台DPU伺服器。

譚待解讀道,火山引擎DPU全面加速計算、存儲、網絡雲化,能實作計算“0”損耗、網絡性能提升4倍、存儲性能提升1倍。2022年7月,火山引擎傳出将DPU闆卡項目命名為“氦卡”,英文名為HeCard,據稱對标阿裡雲自研的CIPU。

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

不到一年時間之後,今天,火山引擎宣布推出三款基于自研DPU的計算執行個體,包括:

1、NVIDIA GPU計算執行個體,據稱相較上一代實作3倍性能提升。

2、Intel CPU計算執行個體,據稱整機性能提升超93%,單核性能提升超13%,小規模(小于12核ECS執行個體)性能提升超6倍。

3、AMD CPU計算執行個體,據稱整機性能提升超138%,單核性能提高超39%,小規格性能提升達10倍。

多雲融合是市場的另一大趨勢,但雲的分布式挑戰廣泛存在。

為此,火山引擎推出了一系列新産品,包括:

1、推出分布式雲原生平台,基于超20萬節點、千萬級核支援超大規模驗證,提供一緻雲原生體驗,支援低成本多雲應用遷移。

2、推出多雲CDN平台,據稱能促進綜合成本降低10%,運維人力減少50%,遇到故障支援秒級切換。

3、推出混合雲veStack,通過功能及架構演進,支援汽車、政府、能源等客戶的混合雲需求。

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

譚待說,企業需要在數字化時代快速開發、快速疊代,那就需要選擇上雲,做好多雲政策,進而基于雲上智能進行創新。

會上,晶泰科技聯合創始人兼CEO馬健圍繞《雲上自動化智能化藥物研發》主題,分享了基于火山引擎服務的智能化藥物研發實踐。

二、支援萬卡多模态大模型訓練,推出智能推薦高速訓練引擎

譚待緊接着談到了近期熱門的大模型。國内知名企業如毫末智行、MiniMax、智譜AI、昆侖萬維等都在火山引擎支援下進行多模态大模型訓練疊代,覆寫智能駕駛、科研、金融等多個領域。

為了支援通用智能時代的企業創新,本次火山引擎在智能方面釋放了兩大更新:

1、推出智能推薦-高速訓練引擎,軟硬一體支援100GB-1TB超大模型高速訓練,高可用、可內建,助企業降本增效。

2、更新火山引擎機器學習平台,釋出模型效果對比服務,支援單任務GPU萬卡叢集大模型訓練、微秒級延遲網絡。

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

多模态大模型創業公司如何實作靈活疊代?包括知名大模型企業MiniMax、自動駕駛企業毫末智能及位元組自有的抖音平台的相關負責人帶來了實踐分享,背後都離不開火山引擎提供的服務。

MiniMax聯合創始人楊斌談到了自研大模型的思考與實踐,團隊自2020年底創業之初考慮的就是技術如何啟用、産品如何建構和算力從哪裡來的問題,應該是第一家在公有雲上實作千卡訓練的公司,去年與火山引擎合作做千卡以上的常态化訓練,并推出了超大規模推理平台,據稱支撐單日過億次調用,實作了技術與産品的疊代閉環。

位元組跳動副總裁楊震原帶來了抖音的機器學習實踐,他認為,數字化時代更需要定量明确目标,機器學習能找到更優解,這在抖音的效果廣告、店鋪選品、優惠券發放、運力排程、自動駕駛等方面都有驗證。但用好機器學習也面臨複雜和昂貴兩大問題,為此抖音采用了火山引擎推出的一站式雲原生機器學習平台,讓訓練快速跑起來。

楊震原認為,業務創新需要試錯,試錯要大膽、靈活,但試錯也一定要控制成本。通過潮汐、混部等方式,火山引擎實作資源的高使用率和極低成本。以抖音推薦系統為例,工程師用15個月的樣本訓練某個模型,5小時就能完成訓練,成本隻有5000元。火爆全網的抖音“AI繪畫”特效,從啟動到上線隻用一周多時間,模型由一名算法工程師完成訓練。

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

毫末智行定位于自動駕駛人工智能技術,目前已推出全球首個自動駕駛生成式大模型DriveGPT(雪湖·海若)。毫末智行CEO顧維灏認為,我們可以将自動駕駛分為1.0硬體驅動、2.0軟體驅動、3.0資料驅動三個時代,為此公司建立了資料、算法、車端、雲端的閉環,并推出了DriveGPT,背後離不開火山引擎專門打造的智算中心提供67億億次/秒的高性能運算,以及2T/秒的高性能存儲及800G/秒的網絡服務。

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

三、推出三款資料驅動新品,助力平安銀行等數字化轉型

在資料驅動方面,本次,火山引擎推出三款新品:

1、火山引擎LAS,助力企業建構Serverless智能湖倉。據稱其性能為開源Spark的270%,開源Presto的260%,支援Serverless全托管,比傳統方案降低綜合成本30%以上。

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

2、火山引擎Serverless流式計算Flink,基于位元組跳動超100億級QPS實踐,穩定性提升超50%,同樣支援Serverless化并支援批流一體等多模态計算。

3、 火山引擎管理駕駛艙Plus,支援0代碼搭建,實時觀測戰略目标達成進度,支援小程式、APP等多端覆寫的移動化線上。

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

會上,平安銀行行長特别助理蔣新發以《智能化銀行3.0,零售轉型新篇章》問題,分享了基于火山引擎資料驅動服務的智能銀行實踐。

四、聚焦體驗創新,上線6款音視訊産品及企業級服務

視訊正朝着更高清、更互動、更沉浸方向發展,比如火山引擎在2022年助力了提升世界杯使用者體驗,累計直播觀看達106億人次。

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

本次,火山引擎帶來六款音視訊方面的産品及全新更新,包括推出火山引擎雲遊戲、創意互動Vlog、AR互動營銷方案、RTC-WTN音視訊服務,更新數字人産品、音視訊雲端一體veVOS服務。

除了使用者體驗,火山引擎還帶來了企業使用者體驗提升産品更新。火山引擎更新企業數字化辦公IT基礎設施一飛連,據稱支援身份、網絡、終端一站式IT管理,以及雲、網、端一站式辦公組網,體系化保證辦公安全。

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

根據官方資料,飛連已覆寫超100萬台終端裝置,比如小米公司就通過這一服務支援員工數字化辦公,提高效率和安全。

此外在生态方面,火山引擎本次還推出了“生意雲”,打造生意增長一站式數字化解決方案。

位元組參戰!火山引擎推出大模型訓練雲平台,自研DPU執行個體性能提升3倍

結語:雲上智能,火山引擎突圍的關鍵一戰

當下,大模型正推動新一波AI浪潮,推動雲計算服務的範式發生變化。本次,火山引擎在例行春季釋出會上透露了其在自研DPU、計算執行個體、AI PaaS 平台、資料智能PaaS平台及應用創新等方面的進展,其中有一大部分都契合了當下的通用智能趨勢,展現了這家基于強大抖音等集團主業務的雲廠商的快速發展的實力。

智能無疑是火山引擎突圍成雲大廠“新貴”的關鍵一城。2021年脫胎于位元組跳動布局IaaS+PaaS+SaaS完整雲服務體系,2022年開始提供“産品+場景”的解決方案,并陸續推出數智平台VeDI等高技術PaaS服務平台,今年,火山引擎的關注點也快速聚焦自身擅長的智能領域,有望為雲廠商格局帶來重大影響。

繼續閱讀