大模型時代的“新王炸”來了
就在昨天
百度釋出了一個劃時代的産品
↓
大模型時代的智能計算作業系統
百度智能雲萬源
為什麼說這是個「劃時代」産品?
隻因,時代大變樣了
傳統IT時代,我們有Linux、Windows
雲計算時代,我們有雲平台、雲作業系統
如今,大模型、AI原生不可阻擋
我們同樣需要一個為這個時代而生的
「智能計算作業系統」
而「萬源」恰好應景而生
成為業界首個“下一代智能計算作業系統”
↓
「萬源」的整體架構
主要分為三層
①核心層②Shell層③工具層
↓
傳統OS要運作在PC或伺服器上
萬源同樣也要運作在基礎設施底座上
這個底座,也就是上個時代雲基礎架構
不過,除了傳統雲服務存算網能力
還要額外增加智算基礎設施
第一層,核心Kernel層
再往上,就是作業系統最關鍵的第一層
也就是Kernel,核心層
玩過Linux的小夥伴都知道
Kernel相當于作業系統的基本盤
核心穩不穩,架構好不好,決定了OS下限
而「萬源」的Kernel層
則包括了兩大部分
↓
❶百度百舸·AI異構計算平台
百舸的核心能力
是把底層複雜的雲原生基礎架構隐藏掉
雲基礎設施已經很複雜了
為支撐智算,還要引入海量算力晶片
比如,訓練一個好的大模型
通常需要排程萬卡規模的算力叢集
這對隻善于操控通用算力的傳統雲平台來說
叢集設計、排程、容錯,都是絕大挑戰
而百舸可以輕松操控上萬張算力加速卡
如同一張卡一樣,協同工作,線性擴充
有效訓練時長占比,達到98.8%
線性加速比和帶寬有效性超過95%
同時,由于智算晶片供應的不穩定性
實際使用中,必須考慮多晶片異構
擺脫對單一特定晶片的依賴
進而規避供應鍊風險
如今,在百舸平台上,已經實作了
百卡規模、單一任務下異構晶片混合訓練
也就是說,百舸做到了屏蔽晶片間差異
讓使用者自由選擇不同晶片組合
❷各種預置大模型
核心的另一個重要組成是大模型
預訓練大模型是AIGC時代的靈魂
萬源kernel層内置了各種大模型
(強大的ERNIE4.0、3.5,輕量級的ERNIE Speed/Lite/Tiny,文心視覺大模型,第三方大模型)
隻要開發者對大模型有想法
核心層都能兜底
第二層,Shell層
搞定核心,就如同打通了底層邏輯
那麼,對使用者來講,如何調用核心呢?
傳統OS有Shell,萬源也不例外
千帆ModelBuilder就相當于這個Shell層
幫助使用者實作核心調用和模型二次開發
ModelBuilder提供模型精調工具
使用者可以輕松對基礎模型進行
而不需要從頭訓練大模型
甚至隻需要基于Prompt工程
就能多快好省搞出适合自己業務的模型
同時,ModelBuilder可基于MoE模式
根據具體任務的難度
靈活選擇群組合核心中的最合适模型
實作效果和成本的最優組合
平均推理成本降低30%以上
第三層,開發工具層
接下來,到了最上一層:工具層
可了解為傳統OS裡的應用軟體/工具軟體
在大模型時代,萬源OS提供的是黃金組合
AppBuilder和AgentBuilder
它們都是強大&易用的應用開發平台
內建工作流編排、管理插件
快速開發AI原生應用和智能體
開發者不需要像以前面對傳統OS
要掌握Python、C、Java各種語言
隻需要基于兩大“Builder”
采用“拉家常”般的自然語言
就可以實作快速開發、輕松上線
這樣,萬源從核心到Shell到開發工具
已經實作了層與層之間的有機結合
對比傳統OS的結構,我們可以看到
大模型時代的全新作業系統
有内味兒了
不過,「萬源」還在持續進化ing
對于開發者(包括普通人)來說
他們可以忽略所有智算基礎設施複雜性
也包括各種語言和架構的複雜性
隻需要面對萬源,進行極簡人機互動
所想即所得,所Prompt即所得
而對于百度智能雲的廣大夥伴和客戶
同樣可以一步跨越兩代OS
在「萬源」之上
用AI原生應用和智能體,重塑數字世界
正如百度智能雲沈抖所說
“簡單是終極的複雜”
百度正在用自己對雲、對AI的深厚了解
一步步,踏平,奉獻
讓智能,生成無限可能