天天看點

火山引擎打造“多雲多模型”架構 推動行業智能化更新

作者:光明網

AI大模型技術應用爆發,雲市場也在加速變革。

4月18日,火山引擎在其舉辦的“原動力大會”上釋出自研DPU等系列雲産品,并推出新版機器學習平台:支援萬卡級大模型訓練、微秒級延遲網絡,讓大模型訓練更穩更快。火山引擎總裁譚待表示,AI大模型有巨大潛力和創新空間,火山引擎會服務客戶做好大模型,共同推動各行業的智能化更新。

“國内有數十家做大模型的企業,大多已經在火山引擎雲上”,譚待認為,大模型不會一家獨大。與其他雲廠商力推自家大模型不同的是,火山引擎将接入多家大模型深度合作,為企業和消費者提供更豐富的AI應用。

會上,火山引擎宣布與位元組跳動國内業務并池。基于内外統一的雲原生基礎架構,抖音等業務的空閑計算資源可極速排程給火山引擎客戶使用,離線業務資源分鐘級排程10萬核CPU,線上業務資源也可潮汐複用,彈性計算搶占式執行個體的價格最高可優惠80%以上。

讓大模型訓練快速跑起來

自2022年底釋出以來,ChatGPT成為人類曆史上最快獲得上億使用者的消費級網際網路應用。最新的GPT-4大模型,更是在法律、數學、生物學等多項測試中超過90%人類。

譚待表示,國内很多科技公司投入到大模型建設中,他們有優秀的技術團隊,也有豐富的行業知識和創新想法,但往往缺乏經過大規模場景實踐的系統工程能力。火山引擎要做的就是為大模型客戶提供高穩定性和高成本效益的AI基礎設施。

據悉,火山引擎機器學習平台經過抖音等海量使用者業務長期打磨,支援單任務萬卡級别的超大規模分布式并行訓練場景。GPU彈性計算執行個體可靈活排程資源,随用随取,最高可以為客戶節省70%的算力成本。

位元組跳動副總裁楊震原認為,業務創新需要試錯,試錯要大膽、靈活,但試錯也一定要控制成本。通過潮汐、混部等方式,火山引擎實作資源的高使用率和極低成本。以抖音推薦系統為例,工程師用15個月的樣本訓練某個模型,5小時就能完成訓練,成本隻有5000元。火爆全網的抖音“AI繪畫”特效,從啟動到上線隻用一周多時間,模型由一名算法工程師完成訓練。

MiniMax是目前國内少數已經推出自研大模型産品的AI技術公司,擁有文本、視覺、聲音三種通用大模型引擎能力。據MiniMax聯合創始人楊斌介紹,MiniMax與火山引擎合作建立了超大規模實驗平台,實作千卡級常态化訓練;超大規模推理平台有萬卡級算力池,支撐單日過億次調用。在火山引擎的雲上,MiniMax大模型業務實作快速突破。

譚待透露,火山引擎的大模型雲平台獲得智譜AI、昆侖萬維等衆多企業的良好回報。國内大模型領域,七成以上已是火山引擎客戶。

向“多雲多模型”架構演進

有評論稱,大模型将成為雲廠商彎道超車的機會。譚待對此表示,大模型還在發展初期,面臨資料安全、内容安全、隐私保護、版權保護等許多問題需要努力解決。但可以預見,大模型将帶動雲上AI算力急劇增長,AI算力的工作負載與通用算力的差距會越來越小,這會為各家雲廠商帶來新的機會,同時也會對資料中心、軟硬體棧、PaaS平台帶來新的挑戰。

以資料中心的算力結構為例,譚待表示:“大模型需要大算力,虛拟化會帶來資源損耗,規模越大就損耗越多。未來3年内,大規模的算力中心,都将形成‘CPU+GPU+DPU’的混合算力結構,CPU負責通用計算,GPU負責AI計算,DPU負責資源解除安裝、加速和隔離,提升資源效率”。

此次原動力大會上,火山引擎釋出了新一代自研DPU,實作計算、存儲、網絡的全元件解除安裝,釋放更多資源給業務負載。火山引擎盡管是“最年輕”的雲廠商,其自研DPU已達到業界領先水準,網絡性能高達5000萬pps轉發能力、延遲低至20us。基于自研DPU的各類計算執行個體性能也有顯著提升,例如适用于大模型分布式并行訓練場景的GPU執行個體,相較上一代執行個體叢集性能最高提升3倍以上。

自動駕駛公司毫末智行與火山引擎合作打造智算中心,為DriveGPT自動駕駛生成式預訓練模型提供強大的算力支援。毫末智行CEO顧維灏介紹,DriveGPT使用量産車4000萬公裡的人駕資料訓練,參數規模達1200億,對自動駕駛認知決策模型進行持續優化。

譚待表示,在大模型及下遊應用發展推動下,無論傳統企業還是初創企業,對AI算力都有迫切需求,企業使用多家雲服務将成為常态。同時,各行業有自己高品質的私有語料,大模型不會一家獨大,而是會在千行百業生長,形成多模型共生甚至協作的生态。“未來将是‘多雲多模型’的時代”,譚待稱。

火山引擎也順勢推出了分布式雲原生平台、多雲安全、多雲CDN、veStack混合雲平台等系列産品,支援客戶更好地使用多家雲服務。“位元組跳動用過全球幾乎每一朵公有雲,以及大多數CDN,形成一套完整的分布式雲管理體系和架構實踐”,譚待堅信火山引擎是最懂多雲和分布式雲的雲服務商,這些技術能力都會毫無保留地提供給客戶。

楊震原進一步表示,火山引擎對内對外提供統一的産品,抖音、今日頭條等APP開屏都加上了“火山引擎提供計算服務”。楊震原說:“數字化時代,機器學習可以智能、高效地圍繞目标解決問題。數字化的下一步是智能化,我們在機器學習方面的技術積累和經驗,都會通過火山引擎提供給外部客戶,幫助更多企業做好智能化”。(劉銳)

來源: 光明網

繼續閱讀