#头条创作挑战赛#
一、延伸群集概述
vSAN 延伸集群是VMware 针对其超融合产品提供的站点级别的双活方案,其中相同数量的 vSphere 主机在两个站点之间均匀分布,主备站点通过高带宽/低延迟链接连接。第三个站点托管(vSAN 见证主机)连接到两个数据站点,这种连接可以通过低带宽/高延迟链路进行。
每个站点都被视为一个vSAN 故障域。用于描述 vSAN 延伸群集配置的命名法为 X+Y+Z,其中 X是数据站点 A 上的 ESXi 主机数,Y 是数据站点 B 上的 ESXi 主机数,Z 是站点 C 上的见证主机数。支持的最小配置为 1+1+1(3 个节点)。最大配置为20+20+1(41 个节点)。在 vSAN 延伸集群中,任何配置中都只存在一个见证主机。
部署在 vSAN 延伸群集上的虚拟机在站点 A 上将有一个数据副本,在站点 B 上具有第二个副本,并将任何见证组件放置在站点 C 的见证主机上。此配置是通过容错域、主机和虚拟机组以及ffinity 规则实现的。如果发生单个完整站点故障,将有虚拟机数据的完整副本和超过 50% 的可用组件,这将允许虚拟机在 vSAN 数据存储上保持可用。如果某一个站点发生灾难,vSphere HA将在其他站点上重新启动虚拟机。
二、vSAN 延伸群集基础概念
vSAN 延伸群集与故障域
容错域支持所谓的“机架感知”,其中虚拟机的组件可以分布在多个机架中的多个主机上。如果发生机架故障,虚拟机将保持可用。但是,这些机架通常托管在同一数据中心。如果发生数据中心范围的事件,容错域无法帮助提高虚拟机的可用性。
延伸集群基本上建立在容错域的基础上,现在提供所谓的“数据中心感知”。VMware vSAN 延伸群集现在可以为虚拟机提供可用性,即使数据中心发生灾难性中断也是如此。
vSAN 见证主机
见证主机是专用的 ESXi 主机或 vSAN 见证设备,其目的是托管虚拟机对象的见证组件。
vSAN 见证设备必须同时连接到主 vSAN 节点和备份 vSAN 节点才能加入群集。在稳定状态操作中,主节点驻留在“首选站点”中;备份节点驻留在“辅助站点”中。除非见证主机连接到主节点和备份节点,否则它不会加入 vSAN 群集。
vSAN 见证主机网络连接
vSAN 见证主机必须由管理 vSAN 群集的同一 vCenter Server 进行管理。
vCenter Server 和 vSAN Witness Host 之間的連接方式必須與 vCenter 控制其他 vSphere 主机的方式相同。
vSAN 见证主机还必须在 vSAN 见证主机和 vSAN 节点之间建立连接。这通常通过 vSAN 见证主机 vSAN VMkernel 接口与 vSAN 数据网络之间的连接来执行。
这些将在后面的章节中更全面地介绍。
更新或升级 vSAN 见证设备
可以使用与传统 ESXi 主机相同的方法轻松维护和修补 vSAN 见证设备。
更新或修补 vSAN 主机时,不需要部署新的 vSAN 见证设备。vSAN 见证设备支持标准升级机制。如果需要,可以轻松部署新的 vSAN 见证设备。
注: 使用 OEM 提供的 vSphere ISO 升级 vSAN 主机时,必须记住,可能会包含其他 OEM 特定的驱动程序或软件。使用 VMware 提供的 vSphere ISO 对于升级 vSAN Witness Appliance 至关重要。
读取 vSAN 延伸集群中的局部性。
在传统 vSAN 群集中,虚拟机的读取操作分布在群集中数据的所有副本副本上。如果策略设置为 NumberOfFailuresToTotolerancerate =1,这会导致数据的两个副本,则 50% 的读取将来自副本 1,50% 的读取将来自副本 2。在非延伸 vSAN 集群中,如果策略设置为 NumberOfFailuresToToDurate =2,则会产生三个数据副本,33% 的读取将来自副本 1,33% 的读取将来自副本 2,33% 的读取将来自副本 3。
在 vSAN 延伸集群中,我们希望避免因跨站点间链路读取而导致的延迟增加。引入了读取局部性机制,以确保 100% 的读取发生在 VM 所在的站点上。读取局部性将覆盖 NumberOfFailuresToRerate=1 策略的行为,以在组件之间分配读取。
读取局部性的另一个注意事项是避免站点之间不必要的虚拟机 vMotion 操作。由于读缓存块存储在一个站点上,因此如果 VM 自由移动并最终位于远程站点上,则缓存在移动后将处于冷状态。(请注意,这仅适用于混合配置,因为全 fl灰烬配置没有显式读取缓存。现在,在缓存再次预热之前,性能将次优。为避免这种情况,软ffinity 规则尽可能将 VM 保留在同一站点/容错域的本地。制定此类规则的步骤将在本指南的 vSphere DRS 部分中详细介绍。
见证流量分离 (WTS)
默认情况下,使用 vSAN 延伸群集时,标记为 vSAN traffic 的见证虚拟机内核接口必须与标记为 vSAN traffic 的每个 vSAN 数据节点的 VMkernel 接口建立连接。
Witness Traffic 分离在延伸群集配置上受支持。可以指定备用 VMkernel 接口来承载发往见证服务器的 traffic,而不是带有 vSAN 标记的接口。此功能允许为节点到节点和节点到见证 traffic 提供单独的网络,从而实现更灵活的网络配置。
混合 MTU(巨型帧)
除了 WTS 之外,还支持混合 MTU 大小(例如,9000 表示 vSAN 数据,1500 表示 vSAN 见证 traffic)。
每个站点策略
每站点策略规则为延伸群集方案提供额外的保护或灵活性。
“允许的主要故障数”确定对象是在每个站点上受保护还是仅在单个站点上受保护。值为 1 将启用跨站点保护。值为 0 时,数据仅保留在一个站点或另一个站点上。
允许的辅助故障数定义站点中的存储对象可以容忍的磁盘或主机故障数。
仅当“允许的主要故障数”为 0 时,ffinity 才适用。当允许的主要故障数为 0 时,此规则允许管理员选择 vSAN 对象应驻留在哪个站点,即首选容错域或辅助容错域。
使用新策略规则的数据访问行为
传统上,vSAN 延伸集群使用镜像容错方法将数据副本写入每个站点。这些是对每个站点的完整写入,读取使用站点 Affi nity功能在本地处理。写入操作取决于虚拟机存储策略规则。
允许行为的双站点镜像/主故障
当“允许的主要故障数”规则等于 1 时,将继续以镜像方式跨站点写入。当“允许的主要故障数”规则等于 0 时,写入将只发生在 Affinity 规则中指定的站点中。从 VM 所在的站点继续读取。
允许行为的本地保护/辅助故障
当存在允许的次要故障数规则时,站点内的行为将遵循容错方法规则。允许的故障数和容错方法确定每个站点需要多少主机才能满足规则要求。
每个站点内的写入和读取方式与传统 vSAN 群集中的写入和读取方式相同,但每个站点。
仅当无法在本地修复数据时,才会从备用站点获取数据,例如,在备用站点上仅存在数据副本的情况下。
亲和力
ffinity 规则仅指定 vSAN 对象(首选或辅助)将驻留在哪个站点上。仅当“允许的主要故障数”规则设置为 0 时,才会遵守此规则。VMware 建议虚拟机在其 vSAN 对象所在的同一站点上运行。
由于ffinity 规则是存储策略规则,因此它仅与 vSAN 对象相关,而与虚拟机放置无关。这是因为当虚拟机和 vSAN 对象不在同一站点上时,需要执行读取和写入操作来遍历站点间链接。
使用每站点策略规则时的 vSAN 延伸群集容量大小调整
使用每站点策略规则,容量要求可以根据策略规则要求完全更改。
Availability | PFTT | SFTT | Capacity Required in Preferred Site in GB | Capacity Required in Secondary Site in GB | Capacity Requirement |
无冗余的双站点镜像 | 1 | 100 | 100 | 2 倍 | |
使用 RAID1 的双站点镜像(1 次故障) | 1 | 1 | 200 | 200 | 4 倍 |
使用 RAID1 进行双站点镜像(2 次故障) | 1 | 2 | 300 | 300 | 6 倍 |
使用 RAID1 进行双站点镜像(3 次故障) | 1 | 3 | 400 | 400 | 8 倍 |
使用 RAID5 的双站点镜像(1 次故障) | 1 | 1 | 133 | 133 | 2.66 倍 |
使用 RAID6 进行双站点镜像(2 次故障) | 1 | 2 | 150 | 150 | 3 倍 |
仅首选站点 RAID1(1 个故障) | 1 | 200 | 2 倍 | ||
仅首选站点 RAID1(2 次失败) | 2 | 300 | 3 倍 | ||
仅首选站点 RAID1(3 次失败) | 3 | 400 | 4 倍 | ||
仅首选站点 RAID5(1 个故障) | 1 | 133 | 1.3 倍 | ||
仅首选站点 RAID6(2 次失败) | 2 | 150 | 1.5 倍 | ||
仅非首选站点 RAID1(1 个故障) | 1 | 200 | 2 倍 | ||
仅非首选站点 RAID1(2 次失败) | 2 | 300 | 3 倍 | ||
仅非首选站点 RAID1(3 次失败) | 3 | 400 | 4 倍 | ||
仅非首选站点 RAID5(1 个故障) | 1 | 133 | 1.3 倍 | ||
仅非首选站点 RAID6(2 次失败) | 2 | 150 | 1.5 倍 |
使用每站点策略规则时的 vSAN 延伸群集组件示例
随着每站点策略规则添加本地保护,对象将分布到更多组件中。
由于见证主机的带宽要求基于组件数,因此使用这些策略规则将增加组件总数。
vSAN 上的其他对象(如快照)将增加组件总数。
使用每站点策略规则时的 vSAN 延伸群集见证带宽注意事项
每 2 个组件的见证带宽要求为 1000Mbps。使用此公式,下面是几个示例:
200 个具有 500GB vmdk 的虚拟机使用跨站点保护策略规则和本地镜像将需要:
- 7 个用于交换,7 个用于虚拟机主空间,18 个用于 vmdk = 32
- 32 个组件 X 200 个虚拟机 = 6,400 个组件 每 2 个 1000Mbps 为 6.4 X 2Mbps = 12.8Mbps
使用具有本地纠删码的跨站点保护策略规则的 200 个具有 500GB vmdk 的虚拟机将需要:
- 9 个用于交换,9 个用于虚拟机主空间,17 个用于 vmdk = 35
- 35 个组件 X 200 个虚拟机 = 7,000 个组件 每 2 个 1000Mbps 是 7 X 2Mbps = 14Mbps
这些示例表明,添加本地保护会增加组件数量和见证带宽要求。
站点容灾
此策略设置确定数据是否在两个站点之间镜像,或者如果未镜像,数据将放置在哪一端。
无 - 标准群集 - 不使用延伸群集时使用此设置。
双站点镜像 - 此设置允许通过将数据镜像到两个站点来丢失整个数据中心站点。这就是大多数人对拉伸集群的看法。
以下两个设置通常用于处理其复制的应用程序。例如,将一个虚拟机设置为固定到一侧,将另一个虚拟机固定到另一侧。可以自行群集的典型应用程序包括Exchange DAG,SQL AlwaysOn,Oracle Dataguard等。
- 无 - 将数据保留在首选状态。如果要将数据“固定”到首选站点,此设置非常有用。
- 无 - 将数据保留为非首选。此设置将数据固定到相反的站点。
无 - 延伸群集。此选项会将虚拟机组件保留在延伸群集的单端,但会采用随机分布。vSAN 对象管理器将尝试将它们保留在同一站点上,但除此之外,它将主要查看站点内的可用容量,并将其用作跨站点随机放置虚拟机的指导逻辑。对于大量应用程序来说,此设置可能有意义,这些应用程序不需要任何一个数据中心丢失的生存能力。大多数人显式构建延伸集群,以保护大多数工作负载免受数据中心故障的影响。不过,此策略对于一组占用大量容量但优先级较低的虚拟机可能有意义。
故障容忍策略
此策略规定了站点内将发生的数据保护。请注意,如果之前选择了延伸群集策略,则此 RAID 保护级别将在两个站点上镜像。在此示例中,RAID-1 镜像将创建四个数据副本(每个站点 2 个)。
请注意,每个站点必须保持达到保护级别的最小主机数(RAID 4 为 5 个主机,RAID 6 为 6 个主机)。
适用于 vSAN 延伸群集的 vSAN 文件服务支持
文件服务现在可以在 vSAN 延伸集群和 vSAN 2 节点拓扑中使用,非常适合那些也需要虚拟服务器的边缘位置。
即使通过站点级保护跨站点保护虚拟共享,文件服务器也是负责从客户端系统连接的单个实体。因此,人们希望它与虚拟服务器连接位于同一站点上,以提供最佳数据路径。此机制将维护客户端与所用协议服务、VDFS 代理、VDFS 服务器和至少一个后备 vSAN 对象的共置。
网站集的选项为“首选”、“辅助”或“任之一”。
站点 一个虚拟共享的设置是表示层(NFS 或 SMB服务)所在的位置。它与数据是否或如何跨站点放置无关。这是由与共享关联的存储策略决定的。存储策略设置将能够以与任何其他类型的对象数据相同的方式保护共享数据,例如无站点级镜像、站点级镜像以及站点级镜像,每个站点(包括 RAID-1 和 RAID-5/6)具有二级保护的站点级镜像。
当站点发生故障时,将托管 SMB 共享,并且将按预期故障转移到备用站点。当恢复 SMB 虚拟共享的站点故障时,不会自动将 SMB 虚拟共享故障回复到所需站点。重新平衡以重新获得与站点ff的合规性只会由于重新平衡运行状况检查操作而发生。
对于标准 vSAN 集群,在非错误状态下提供虚拟服务所需的最小主机数为三个主机,但它仍然可以仅使用两个主机提供处于错误状态的虚拟服务。在非错误状态下提供虚拟服务所需的最小主机数为 2。此处描述的最小主机计数反映了在每个主机上以非错误状态提供协议服务所需的“虚拟服务虚拟机”或“FSVM”的最小数量。
三、支持的vSphere版本和功能
vSphere 版本
vSAN 延伸群集中的高级功能支持需要 vSAN 版本、磁盘格式版本、体系结构和主机数量的组合。下表说明了每个功能的最低要求。有关更多详细信息,请参阅知识库2148493。
特征 | 最低要求 |
数据存储共享 | 需要 vSAN 8 更新 1。 此功能仅适用于 OSA |
快速存储架构 (ESA) | 需要 vSAN 8 更新 1。 |
通常建议按 vSAN 版本使用最新的磁盘格式。
vSphere Distributed Resource Scheduler (DRS)
对于 vSAN,vSphere DRS 是非常可取的。DRS 将提供初始放置帮助,在出现不平衡时对环境进行负载平衡,并按照虚拟机/主机ffi ffi规则自动将虚拟机迁移到其正确的站点。它还可以帮助在恢复后根据总体利用率将虚拟机迁移回节点。否则,管理员将不得不手动执行这些任务。
vSphere DRS 仅在 vSphere Enterprise+ 或更高版本中可用。
vSphere Enterprise for ROBO 提供 DRS-Lite 功能。虽然适用于 ROBO 的 vSphere Enterprise 中不包含主动工作负载迁移的全部功能,但它确实包括在将主机置于维护模式(例如执行升级时)自动迁移主机或主机虚拟机的功能。
vSphere Availability (HA)
与在任何环境中一样,vSphere HA 非常适合与 vSAN 配合使用。当主机发生故障时,HA 将重新启动虚拟机。此外,当 vSAN 节点发生故障时,vSphere HA 将在备用主机上重新启动虚拟机。当 vSAN 节点被隔离时,vSAN将为虚拟机供电,但不会重新启动它们。vSphere HA 用于在尚未隔离的主机上重新启动这些虚拟机。
与 vSAN 一起使用时,要使 vSphere HA 正常工作,需要进行一些其他设置。本指南稍后将详细介绍这些设置。
磁盘格式
VMware 建议升级到最新的磁盘格式,以提高性能、可扩展性和功能。
vSAN 见证主机
物理 ESXi 主机和 vSAN 见证设备(嵌套 ESXi)都支持作为延伸群集见证主机。
VMware 为不希望将物理主机用于此角色的客户提供了 vSAN 见证设备。vSAN 见证设备可以在 ESXi 免费许可主机、vSphere 许可 (ESXi) 主机、驻留在 OVH(以前称为 vCloud Air)中的主机、vCloud Air Network (VCAN) 合作伙伴或任何托管的 ESXi 安装上运行。
混合和全闪存支持
VMware vSAN 延伸群集在混合配置(具有本地存储的主机,包括用于容量的磁盘和用于缓存的 fl ash 设备)和全闪存配置(具有本地存储的主机,这些存储由用于容量的 flash 设备和用于缓存的 flash 设备组成)上均受支持。
使用快速存储架构 (ESA) 的 vSAN 8
使用快速存储架构 (ESA) 的 vSAN 8 支持适用于延伸集群配置的所有延伸群集功能和增强功能,但 - vSAN 文件服务除外。支持延长延伸集群的正常运行时间。
四、延伸群集部署要求
以下是实施 vSAN 延伸集群的要求列表。
VMware vCenter Server
vSAN 延伸群集配置可由单个 VMware vCenter Server 实例创建和管理。
见证设备
在 vSAN 延伸群集中,见证组件仅放置在见证主机上。物理 ESXi 主机或 VMware 提供的特殊 vSAN 见证设备可以作为见证主机。
如果将 vSAN 见证设备用于见证主机,则不会使用客户的任何 vSphere 许可证。用作见证主机的物理 ESXi 主机必须相应地获得许可,因为如果客户选择这样做,这仍可用于置备虚拟机。
不得将见证主机添加到 vSAN 群集。见证主机是在创建 vSAN 延伸集群期间选择的。
见证设备将在 vSphere Web 客户端 UI 中具有唯一标识符,以帮助识别主机是否为见证设备(虚拟机中的 ESXi)。它显示为“蓝色”主机,如下所示:
注: 仅当部署设备 ESXi 见证时,这才可见。如果将物理主机用作见证服务器,则它不会更改其在 Web 客户端中的外观。每个延伸集群都需要一个专用见证主机。
网络要求
使用容错域跨多个站点在延伸群集中部署 vSAN 时,必须遵守特定的网络连接要求。
第 2 层和第 3 层支持
数据站点与 vSAN 见证主机之间的所有vSAN 延伸群集网络通道均为单播。
在确定网络拓扑时,必须考虑 vSAN 使用与管理 VMkernel 接口(通常为 vmk0)相同的 TCP 堆栈。因此,vSAN VMkernel 接口使用与管理 VMkernel 接口相同的默认网关。可以覆盖 VMkernel 适配器的默认网关,以便为 vSAN 网络提供不同的远程网关。此功能简化了以前需要手动配置静态路由的路由配置。
- VMware 建议通过第 3 层路由数据站点和见证站点之间的 vSAN 通信。如果使用传统的延伸群集配置,则数据节点将需要从 vSAN VMkernel 接口到标记为 vSAN Tra ffi c 的 vSAN 见证主机 VMkernel 接口的静态路由。
- 使用见证 Tra ffi c 分离时,如果管理 VMkernel 接口(通常为 vmk0)以外的 VMkernel 接口标记为“见证”tra ffi c,则需要静态路由才能与标记为 vSAN Tra ffi c 的 vSAN 见证主机 VMkernel 接口进行通信。
- 如果管理 VMkernel 接口标记为“见证”traffic,则当主机已可以使用默认网关与 vSAN 见证主机 VMkernel 接口通信时,则不需要静态路由。
- 注: vSAN 元数据 traffic 可以使用专用接口而不是管理 VMkernel 接口进行隔离。如果出于安全考虑,则支持将管理 tra ffi c 与工作负载 traffic 隔离。支持为 vSAN 元数据 tra ffi c 选择管理 VMkernel 接口,但应符合所需的体系结构和风险注意事项。
- VMware 支持延伸第 2 层或第 3 层中的数据站点之间的 vSAN 通信,但须注意以下事项:延伸第 2 层不需要静态路由第 3 层需要静态路由才能在站点之间正确通信。
vSAN 见证主机网络连接
vSAN 见证主机上的管理 (vmk0) 和见证 (vmk1) 虚拟机内核接口不得配置为使用同一子网上的地址。这样做会创建多宿主情况,在知识库2010877中引用。
如果只有一个子网可用于 vSAN 见证主机,建议在 vmk1 上取消标记 vSAN traffic,并在 vSAN 见证主机上的 vmk0 上标记 vSAN traffic。
vSAN 见证主机不支持使用网络地址转换 (NAT)
vSphere Client中未显示上述静态路由的配置。可以使用各种方法配置静态路由,包括:
- 从每个 vSphere 主机的命令行或 vSphere CLI 使用 esxcli
- 使用 PowerCLI 脚本在一个或多个主机上控制静态路由
- Confifizing static routing using Host Profiles
部署 vSAN 延伸集群时,必须考虑其中每一项,这些项目都有助于确定要与 vSAN 延伸集群一起使用的网络拓扑。
支持的地理距离
对于 VMware vSAN 延伸群集,地理距离不是支持问题。关键要求是站点之间的实际延迟数。
带宽和延迟要求
数据站点到数据站点网络延迟
数据站点到数据站点网络是指非见证站点(例如运行虚拟机并保存虚拟机数据的站点)之间的通信。托管虚拟机对象的站点之间的延迟或 RTT(往返时间)不应大于 5 毫秒(单向< 2.5 毫秒)。
数据站点到数据站点带宽
托管虚拟机对象的站点之间的带宽将取决于工作负载。有关特定的最低要求,请参见 vSAN 文档以了解网络连接要求。
有关确定带宽要求的更多详细信息,请参阅本指南的设计注意事项部分。
见证网络延迟的数据站点
这是指非见证地点和见证地点之间的通信。
在大多数 vSAN 延伸群集配置中,托管虚拟机对象的站点与见证节点之间的延迟或 RTT(往返时间)不应超过 200 毫秒(单向 100 毫秒)。
见证服务器的延迟取决于群集中的对象数。VMware 建议在高达 10+10+1 的 vSAN 延伸群集配置上,小于或等于 200 毫秒的延迟是可以接受的。但是,如果可能,最好使用小于或等于 100 毫秒的延迟。对于大于 10+10+1 的配置,VMware 要求延迟小于或等于 100 毫秒。
用于见证网络带宽的数据站点
托管虚拟机对象的站点与见证节点之间的带宽取决于驻留在 vSAN 上的对象数量。必须适当调整数据站点到见证带宽的大小,以实现可用性和增长。标准规则是 vSAN 上每 2 个组件 1000Mbps。
有关确定带宽要求的更多详细信息,请参阅本指南的设计注意事项部分。
支持用于见证 Traffic 分离的混合 MTU
传统 vSAN 群集要求所有 vSAN VMkernel 接口的 MTU 大小保持一致。由于 vSAN 数据网络连接到 vSAN 见证主机,因此 vSAN 延伸群集具有确切的要求。当 VMkernel 端口通信且具有混合的 MTU 大小时,潜在的通信挑战包括丢弃数据包、重新传输等。
当使用见证 Traffic 分离时,这个概念发生了变化。“后端”vSAN 数据网络不与 vSAN 见证通信。与 vSAN 见证的通信是通过标记为“见证”的 vm kernel 接口进行的。
vSAN 数据网络上的 MTU 大小以及用于与 vSAN 见证通信的网络可以正常工作。
VMware 不支持直接相互通信的接口的混合 MTU。它确实支持不同的MTU 用于不同的 vSAN 延伸集群 traffic 类型。
vSAN 运行状况检查可识别见证 Traffic 分离部署,并允许为 vSAN 数据和 vSAN 见证网络提供不同的MTU。
此图显示了安装了巨型帧并启用了 vSAN Traffic 的 vSAN 数据网络 (VMkernel vmk2)。
在 vSAN 见证上,管理 VMkernel (vmk0) 标记为 vSAN Traffic,MTU 为 1500。
vSAN 见证具有“vSAN Tra ffi c”标记,但在使用见证 Traffic 分离时,它会与数据节点上标记的“见证”接口进行通信。此安装中未使用 vmk1,这是一个有效的配置。
vSAN 运行状况检查显示主机与 vSAN 见证正确通信,即使它们具有不同的MTU 设置也是如此。
共享同一 VLAN 的多个 vSAN 见证主机
多个 2 节点 vSAN 部署可以在同一共享 VLAN 上发送其见证服务器。每个远程站点不需要自己单独的 VLAN。
五、延伸集群的最小值和最大值配置限制
每个主机的虚拟机数
每个 ESXi 主机的最大虚拟机数取决于 vSAN 延伸群集配置。最大值与标准 vSAN 部署相同。
VMware 建议客户以标准 vSAN 群集中支持的最大虚拟机数的 50% 运行其主机,以适应整个站点故障。
如果发生完全站点故障,故障站点上的虚拟机可以在幸存站点中的主机上重新启动。
每个群集的主机数
最小主机计数
vSAN 延伸群集中的最小主机数为 1 个加上 vSAN 见证主机。站点 2 包含一个物理 ESXi 主机;站点 3 包含一个物理 ESXi 主机;站点 1 包含 vSAN 见证主机(虚拟设备或物理)。系数是 1+1+2。这通常称为 2 节点配置。如果 2 节点配置中的两个节点位于同一站点上,则 vSAN 见证主机可以位于同一站点或备用站点上。在 <> 个节点位于备用站点中的配置中,vSAN 见证主机必须位于第三个站点中。
最大主机计数
vSAN 主机的最大数量为 40 个,外加 vSAN 见证主机。
对称配置
vSAN 支持对称配置,其中站点1 最多包含 20 个 ESXi 主机,站点 2 包含相同数量的 ESXi 主机,以及第三个站点中的 vSAN 见证主机 (20+20+1)。
非对称配置
vSAN 还支持非对称配置,其中某些工作负载可能使用站点 Affi规则作为存储策略的一部分。
示例 1:站点 1 包含 20 个 ESXi 主机,站点 2 包含 10 个 ESXi 主机,见证主机位于第三个站点中。
在此用例中,某些工作负载仅在站点 1 中可用(使用 PFTT=0/SiteAffinity=首选),而其他工作负载在站点 1 和站点 2 中可用。
示例 2:站点 1 包含 12 个 ESXi 主机,站点 2 包含 16 个 ESXi 主机,见证主机位于第三个站点中。
在此用例中,某些工作负载仅在站点 2 中可用(使用 PFTT=0/SiteAffinity=非首选),而其他工作负载在站点 1 和站点 2 中可用。
见证设备
每个 vSAN 延伸集群最多有 1 个见证主机。本指南的设计注意事项部分讨论了见证主机要求。VMware 以开放式虚拟设备 (OVA) 格式提供完全受支持的 vSAN 见证设备。这适用于不希望将物理 ESXi 主机专用于见证的客户。此 OVA 实质上是在虚拟机中运行的预许可 ESXi 主机,可以部署在第三个站点的物理 ESXi 主机上。
vSAN 存储策略
允许的主要故障数 (PFTT)
FTT/PFTT 策略设置对对象最多为 1。这是因为延伸群集由 3 个容错域组成。
允许的故障数 (SFTT)
使用时,SFTT 规则确定延伸群集中本地保护的容错方法。
容错方法
容错方法规则通过 RAID-1(镜像)提供性能保护,RAID-5/6(纠删码)提供容量保护。
在 vSAN 延伸集群中,如果主机数量和容量可用,则可以使用本地保护实施纠删码。全闪存 vSAN 是支持纠删码的要求。
亲和力
当 PFTT 规则值为 0 时,将使用ffinity 规则。此规则有两个值:“首选”或“辅助”。这决定了基于关联性的 vmdk 将驻留在哪个站点上。
其他策略规则
其他策略设置不受在延伸集群中部署 vSAN 的影响,可以根据非延伸 vSAN集群使用。
容错域
容错域在 vSAN 延伸集群中起着至关重要的作用。与前面讨论的允许故障数 (FTT) 策略设置类似,vSAN 延伸集群中的最大故障域数为 3。第一个容错域是“首选”数据站点,第二个容错域是“辅助”数据站点,第三个容错域是见证主机站点。
未完待续。
第二部分内容请看:https://m.toutiao.com/is/iQMBqud/ - VMware vSAN 延伸群集(双活)指南01-基础知识介绍 - 今日头条