超融合HCI

深信服超融合SANGFOR HCI是面向下一代数据中心的软件定义基础架构,通过虚拟化技术融合计算、存储、网络和安全等资源,并提供运维管理、容灾备份、智能监控等高级特性,帮助用户构建极简、稳定、高性能的云化数据中心基石。
点击可切换产品版本
知道了
不再提醒
HCI6.9.1
{{sendMatomoQuery("超融合HCI","vGPU管理")}}

vGPU管理

更新时间:2023-12-06

功能说明

用户本来使用传统物理架构,现在想对业务进行虚拟化改造,上超融合,原本有少数业务比如GIS是需要显卡支持的,现在需要一起虚拟化改造,因此需要虚拟化平台支持配置显卡。

用户有大规模的需要显卡支持的应用,在GPU资源的使用会遇到闲置浪费、分配不灵活的情况,希望能做到GPU使用灵活、按需分配、资源共享。

平台的显卡资源在分配、使用、调整的时候,需要做到可视化,方便管理者更好地管理显卡资源。

注意事项

  1. 使用vGPU需获取NVIDIA的授权。
  2. 使用vGPU的虚拟机必须安装和超融合平台对应版本的英伟达显卡驱动,可前往 “深信服技术平台 - 帮助文档 – 超融合HCI-通用文档-VGPU相关软件下载”获取显卡驱动。
  3. 超融合的vGPU授权分为两种:vWSvCSvWS用于专业图形和计算场景,vCS用于面向计算常见进行优化,如人工智能、深度学习、科研场景等。
  4. vCS不支持Windows虚拟机,最小切割粒度为4GB,最大为32GB
  5. 不是所有显卡都支持vGPU的,支持vGPU的显卡才能使用vGPU,不支持的可以使用直通模式。
  6. 支持将2张显卡直通给一台虚拟机,其中T42080Ti最大可支持8张。
  7. vGPU场景下,显卡兼容性可查询“信服云兼容性平台”。
  8. 直通场景下,需使用英伟达公版驱动,显卡版本和驱动下载参考下列链接:https://www.nvidia.cn/Download/index.aspx?lang=cn
  9. 6.9.0及其之后的版本开始支持国产GPU, 目前国产GPU仅支持直通,暂不支持切分。

支持ARM的型号:寒武纪 MLU370 S4(飞腾)、华为 Atlas 300V Pro(鲲鹏)

支持x86的型号:寒武纪 MLU370 S4、寒武纪 MLU270 S4、摩尔线程 S2000

暂不支持海光

windows 在使用摩尔线程S2000显卡时,不支持采集GPU使用率和显存使用率。

openeuler系统在使用华为atlas 300v pro时,不支持采集GPU使用率和显存使用率。

前提条件

  1. 显卡服务器+显卡,两台显卡服务器组成集群使用,或者一台显卡服务器和一台普通服务器组成集群,需要至少一张显卡。可以用深信服购买的显卡,也可以使用用户原有的显卡。
  2. 服务器有2D3D服务器区分,原本的一体机是不能插显卡的,插显卡需要专门的显卡服务器。

操作步骤

超融合环境部署。硬件方面,在服务器上插上显卡,注意显卡的供电线要接上,显卡才会工作(显卡的功率大,有专门的供电线);软件方面,在服务器上安装超融合系统软件时或者是已有集群在插上显卡之后,平台检测硬件有显卡的时候,界面会自动显示是否需要开启IOMMU的选项,选择开启(开启之后需要重启主机才生效)。