大模型时代的“新王炸”来了
就在昨天
百度发布了一个划时代的产品
↓
大模型时代的智能计算操作系统
百度智能云万源
为什么说这是个「划时代」产品?
只因,时代大变样了
传统IT时代,我们有Linux、Windows
云计算时代,我们有云平台、云操作系统
如今,大模型、AI原生不可阻挡
我们同样需要一个为这个时代而生的
「智能计算操作系统」
而「万源」恰好应景而生
成为业界首个“下一代智能计算操作系统”
↓
「万源」的整体架构
主要分为三层
①内核层②Shell层③工具层
↓
传统OS要运行在PC或服务器上
万源同样也要运行在基础设施底座上
这个底座,也就是上个时代云基础架构
不过,除了传统云服务存算网能力
还要额外增加智算基础设施
第一层,内核Kernel层
再往上,就是操作系统最关键的第一层
也就是Kernel,内核层
玩过Linux的小伙伴都知道
Kernel相当于操作系统的基本盘
内核稳不稳,架构好不好,决定了OS下限
而「万源」的Kernel层
则包括了两大部分
↓
❶百度百舸·AI异构计算平台
百舸的核心能力
是把底层复杂的云原生基础架构隐藏掉
云基础设施已经很复杂了
为支撑智算,还要引入海量算力芯片
比如,训练一个好的大模型
通常需要调度万卡规模的算力集群
这对只善于操控通用算力的传统云平台来说
集群设计、调度、容错,都是绝大挑战
而百舸可以轻松操控上万张算力加速卡
如同一张卡一样,协同工作,线性扩展
有效训练时长占比,达到98.8%
线性加速比和带宽有效性超过95%
同时,由于智算芯片供应的不稳定性
实际使用中,必须考虑多芯片异构
摆脱对单一特定芯片的依赖
从而规避供应链风险
如今,在百舸平台上,已经实现了
百卡规模、单一任务下异构芯片混合训练
也就是说,百舸做到了屏蔽芯片间差异
让用户自由选择不同芯片组合
❷各种预置大模型
内核的另一个重要组成是大模型
预训练大模型是AIGC时代的灵魂
万源kernel层内置了各种大模型
(强大的ERNIE4.0、3.5,轻量级的ERNIE Speed/Lite/Tiny,文心视觉大模型,第三方大模型)
只要开发者对大模型有想法
内核层都能兜底
第二层,Shell层
搞定内核,就如同打通了底层逻辑
那么,对用户来讲,如何调用内核呢?
传统OS有Shell,万源也不例外
千帆ModelBuilder就相当于这个Shell层
帮助用户实现内核调用和模型二次开发
ModelBuilder提供模型精调工具
用户可以轻松对基础模型进行
而不需要从头训练大模型
甚至只需要基于Prompt工程
就能多快好省搞出适合自己业务的模型
同时,ModelBuilder可基于MoE模式
根据具体任务的难度
灵活选择和组合内核中的最合适模型
实现效果和成本的最优组合
平均推理成本降低30%以上
第三层,开发工具层
接下来,到了最上一层:工具层
可理解为传统OS里的应用软件/工具软件
在大模型时代,万源OS提供的是黄金组合
AppBuilder和AgentBuilder
它们都是强大&易用的应用开发平台
集成工作流编排、管理插件
快速开发AI原生应用和智能体
开发者不需要像以前面对传统OS
要掌握Python、C、Java各种语言
只需要基于两大“Builder”
采用“拉家常”般的自然语言
就可以实现快速开发、轻松上线
这样,万源从内核到Shell到开发工具
已经实现了层与层之间的有机结合
对比传统OS的结构,我们可以看到
大模型时代的全新操作系统
有内味儿了
不过,「万源」还在持续进化ing
对于开发者(包括普通人)来说
他们可以忽略所有智算基础设施复杂性
也包括各种语言和架构的复杂性
只需要面对万源,进行极简人机交互
所想即所得,所Prompt即所得
而对于百度智能云的广大伙伴和客户
同样可以一步跨越两代OS
在「万源」之上
用AI原生应用和智能体,重塑数字世界
正如百度智能云沈抖所说
“简单是终极的复杂”
百度正在用自己对云、对AI的深厚理解
一步步,踏平,奉献
让智能,生成无限可能