在云计算这条高速路上,伴随虚拟化的广泛使用,软硬件产品迭代速度越来越快,如传统百兆以太网,甚至千兆以太网难以适应未来资源池的互联要求,cpu引入了更多硬件辅助的芯片和寄存器功能等新的问题给用户带来困扰,以防形成“蝴蝶效应”,我们需要把问题扼杀在萌芽。
浪潮云海os incloud sphere是iaas层的核心组成部分,通过服务器虚拟化将存储、网络和其它外设有机地结合到一起,使整个it环境比单独的物理硬件具有更高的可用性、扩展性和安全性,为企业核心业务云化迁移、构建企业云数据中心提供了基础技术和能力。
为了更好地满足用户的需求,提升数据中心效能,浪潮发布云海os incloud sphere虚拟化 4.5,在4.0版本的基础上,深度挖掘国内数百家用户需求,全面提升了产品的性能和易用性。
服务器虚拟化系统性能瓶颈主要表现在网络与存储部分。传统方式hypervisor性能损耗占据5%-10%,性能损耗较小,冯诺依曼架构中,提升节点性能越来越多依靠并行处理技术,尽管cpu制程建设到10nm以下技术和工业难度十分巨大、可提升空间有限,而gpu等协处理器技术发展迅速。因此,ics4.5结合最新的主流硬件环境,在hypervisor层做性能适配,并且最大程度触发并行操作,全面提升网络io的性能。
网络性能全面提升
当前万兆以太网技术已成主流,越来越多的用户选择40gb环境部署业务网络,如流媒体,大文件的传输在虚拟化环境无法满足要求,以太网卡在未来5年内将逐步步入40gb时代,势必给虚拟机业务网吞吐带来了新的挑战。
主机间通信网络带宽大幅度提升,采用mellanox connectx-3 40gb/s环境测试,通过增加授权表锁的规模和增加dom0的虚拟cpu数量,使incloud sphere吞吐量从4.0的29gb/s提升到100gb/s,性能提升达到240%.
【图:三端口40gb以太网卡吞吐量测试】
由于进程调度和网卡缓存等结构性设计,导致物理网卡性能被很大程度削减,如何跑满万兆以太网环境甚至40gb以太网卡能力,是hypervisor需要解决的问题。
裸金属架构虚拟机带宽显著提升,开启8线程模式,采用网卡多队列技术,使incloud sphere吞吐量从17gb/s提升到37gb/s,充分并行处理数据包收发,接近物理网卡线性转发能力,性能提升达到120%.
【图:三端口40gb以太网卡带宽优化测试】
2.windows 类型docker支持
docker集中管理。linux和windows环境docker统一管理,扩展了docker监控管理能力,集成控制台和日志管理,实时监管与诊断容器系统,降低容器部署与管理难度,hypervisor与容器环境统一管控,实现轻量级隔离、可配置与移动性。单台宿主机支持1000+以上容器同时运行。
【图:hypervisor上的docker生命周期管理】
gpu性能增强
传统gpu虚拟化需要配置gpu显卡硬件,并且对服务器pci扩展槽长度和高度有较高要求,往往需要专用的图形工作站。对于gpu高性能等使用场景,常常采用多任务执行的io和计算集群环境,对于低速gpu虚拟化使用场景,显卡成本较高,很难批量采用。
incloud sphere和intel联合开发,打造了无需额外配备硬件gpu的vgpu解决方案:率先支持intel gvt-g显卡虚拟化技术,vm中安装驱动程序,每颗cpu支持7块vgpu。,使用标准的iris pro graphics驱动兼容性更强,优化虚拟机显示,适用于低负载的视频编解码,渲染,游戏处理等场景。
在面向高校和科研院所环境中,存在广泛的科学计算和深度学习的需求。单台incloud sphere宿主机支持的vgpu会话数从4.0的96块提升到128块。
l 科学计算:科学计算和高性能计算协处理器体现在利用nvidia等显卡虚拟化,ics提供了更高规格的vgpu密度,可利用cuda工具包为c和c++开发人员构建gpu开发环境。传统高性能计算中瓶颈在于计算节点,核心矛盾在于任务调度的颗粒度,若任务太细,集群数量、消息队列和数据汇总要求高;若任务太粗,又无法解决单个gpu节点物理性能不足问题。所以vgpu的价值在于提供了更多的协处理器,对于子任务计算要求不高。
l 深度学习:多个vgpu,simd ( 单指令多数据流)的架构,擅长对于大批量数据并行处理。如cudnn等技术。神经网络需要大量的矩阵计算的操作,自动编码器,稀疏编码深信度网络等模型。
充分考虑访问灵活性和linux等用户使用场景,4.5版本在web用户界面做了大量优化,管理员不收终端环境影响,访问便捷,随时随地可进行访问和管理。同时兼容原有客户端模式,并进行优化,集成了ssh控制台,仅消耗传输指令的带宽,对于linux类客户操作系统提供更多的访问和控制方法。
【图:ics 4.5 web 界面】
自动修复能力增强:客户可以使用 windows 更新机制安装能够提供增强的存储和网络性能的 i/o 驱动程序( pv 驱动程序)。同时希望安装完整版hypervisor管理代理(执行 vm 生命周期操作或监视性能)的客户应tools iso 中安装该组件。
增强的存储迁移非共享存储环境,虚拟磁盘块在不同宿主机之间热迁移,支持开机状态,停止状态和挂起状态。因此,极大方便了不同服务器和存储环境的业务切换,虚拟机在任何环境中均可实现开机状态下按需调度,方便系统扩容和硬件升级。
incloud sphere 4.5的推出旨在给予用户更高速的性能体验和人性化的交互。未来,incloud sphere将继续坚持在产品的稳定可靠、安全易用上的不断投入,实现性能的进一步的提升,为用户提供稳定安全的服务器虚拟化系统。
原文发布时间为:2016年12月26日
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。