更新时间:2024-05-09
HA(High Available,高可用)通常需要两个或者两个以上的主机节点组成集群,当虚拟机所在节点发生意外(主机掉电、网口掉线等)时,将选择一台资源充足的节点重启该虚拟机,极大的降低了业务中断时间。
当集群内某台主机由于断电发生宕机或硬件故障时,HA机制将自动把虚拟机(包括虚拟网络设备)恢复到其他主机上运行,保障业务的连续性。
超融合平台支持为HA的故障检测配置响应方式:“不处理”、“重启切换”
前提条件:
加密卡故障:集群其他主机有对应的加密卡。
GPU故障:集群其他主机有同样的显卡、同样的切分方式、且剩余显存满足迁移条件。
最佳实践建议:若客户环境符合条件时(加密卡、GPU)配置响应方式为“重启切换”,其余默认开启。