云管平台SCP

深信服云计算平台(Sangfor Cloud Platform)向下统一管理多数据中心、向上以服务目录的形式提供laas、Paas、大数据服务,为用户提供省时省事、平滑弹性、安全可靠、业务承载丰富的云计算集成平台,助力企业数据中心云化演进。
点击可切换产品版本
知道了
不再提醒
SCP 6.10.0(R1)
{{sendMatomoQuery("云管平台SCP","集群资源调度配置")}}

集群资源调度配置

更新时间:2024-05-09

功能说明

集群动态资源调度DRS是一种用于平衡调度集群资源的技术实现,传统DRS调度通过检测各主机的资源使用情况,及时对虚拟机进行迁移,避免出现资源热点或负载不均衡,保障业务连续性,但效果无法保障,比如根据阈值触发没有预测和建议无法提前预知;没有考虑虚拟机的计算繁忙程度只考虑主机;只考虑资源,没有考虑调度后的性能和可靠性影响。深信服超融合DRS 2.0可以基于主机或者云主机过去5天的资源历史预估未来2小时的负载进行智能调度,从主机和虚拟机两个维度来参考评分进行调度从业务上保证优化效果;通过丰富的指标评分估算,保证迁移后业务可靠性等级不下降,性能得到提升。

注意事项

  1. 部分类型的虚拟机不支持DRS2.0,如非集群虚拟机、NFV、快速恢复的虚拟机、指定运行位置的虚拟机、指定故障域的虚拟机、开启了CDP的虚拟机、开启了CPU独占的虚拟机、正在使用GPU的虚拟机、存在USB映射的虚拟机。
  2. UPS联动关机生效的主机不支持DRS2.0
  3. 磁盘故障预测,磁盘类型是只支持希捷和西部数据的SATA磁盘(HDD)。不支持的磁盘扣分偏差为5-10分(定级为L3)。
  4. 磁盘故障预测前10天不可用,内存故障预测前30天不可用,需要历史数据做训练。
  5. 集群下无法一次性生成所有调度建议,10分钟最多生成50条迁移建议。
  6. Raid卡故障检测,目前只支持megaraidSAS3008类型raid卡。
  7. 内存故障预测,支持X86,因无训练数据及模型支持故不支持ARM

前提条件

  1. 多台超融合主机组成集群。
  2. 虚拟机存储在外置存储或虚拟存储。
  3. 虚拟机运行位置配置为自动选择。
  4. 虚拟机未开启CDP功能,未配置CPU独占功能,未配置USB映射。

操作步骤

  1. 在登录SCP平台,选择[可靠中心/动态资源调度(DRS],进入动态资源调度配置界面。

  1. 用户可以选择调度方式自动调度、手动调度和禁用。当设置了自动调度,调度引擎将根据集群资源负载评分情况自动进行调度;当设置了手动调度,调度引擎将根据资源负载评分情况给出调度建议,用户需手动执行调度建议;当设置了禁用,调度引擎将不会主动给出调度建议。
  2. 用户选择调度建议,根据不同的调度模式计算出虚拟机的最佳迁移路径,是集群符合对应调度模式的最佳状态。当前调度模式分为性能均衡模式和成本最优模式。性能均衡模式的目的是为了让各主机之间负载达到一个均衡状态,成本最优模式的目的是尽可能的将虚拟机集中运行在一台或几台主机上,空出更多的主机资源,达到节约资源的目的。

性能均衡模式:选出高负载主机,对高负载主机上所有虚拟机进行性能收益的计算,虚拟机从高负载主机迁移到低负载主机上性能收益有提升,且目的主机的可靠性等级不可低于源主机的可靠性等级。

成本最优模式:选出低负载主机,对主机按照内存负载由低到高进行排序,按顺序将低负载主机上的虚拟机迁移到高负载主机上,虚拟机性能下降不可超过阈值规定的百分比,且目的主机的可靠性等级不可低于源主机的可靠性等级。

  1. 用户可以设定分级策略,不同的敏感度对应不同的主机负载阈值,调度灵敏度可选择保守(不太频繁的调度);中间(默认);激进(较频繁的调度)。调度灵敏度的阈值,与选择调度模式有关,不同的调度模式,不同的调度灵敏度阈值。
  2. 用户可在AI预测算力等级选择是否开启AI智能预测,集群可基于主机或者虚拟机过去7天的负载预估未来2天的负载进行智能DRS调度,假如开启该功能,集群资源调度会使用AI智能探测算法,让资源调度更加的智能化,也可以根据虚拟机数量选择调整AI预测算力值。
  3. 用户可用设定调度时间段控制DRS调度时间窗口,确保不在业务高峰期发生DRS调度。
  4. 若有些虚拟机的调度方式因为某些场景需要特殊处理,则配置例外虚拟机调度。调度方式可选择:手动、自动、禁用。