更新时间:2023-12-07
功能说明
• 用户本来使用传统物理架构,现在想对业务进行虚拟化改造,上HCI,原本有少数业务比如GIS是需要显卡支持的,现在需要一起虚拟化改造,因此需要虚拟化平台支持配置显卡。
• 用户有大规模的需要显卡支持的应用,在GPU资源的使用会遇到闲置浪费、分配不灵活的情况,希望能做到GPU使用灵活、按需分配、资源共享。
• 平台的显卡资源在分配、使用、调整的时候,需要做到可视化,方便管理者更好地管理显卡资源。
注意事项
- 使用vGPU需获取NVIDIA的授权。
- 使用vGPU的云主机必须安装和HCI平台对应版本的英伟达显卡驱动,可前往 “深信服技术支持平台-帮助文档-超融合HCI-通用文档-VGPU相关软件下载”获取显卡驱动。
- HCI的vGPU授权分为两种:vWS和vCS,vWS用于专业图形和计算场景,vCS用于面向计算常见进行优化,如人工智能、深度学习、科研场景等。
- vCS不支持Windows云主机,最小切割粒度为4GB,最大为32GB。
- 不是所有显卡都支持vGPU的,支持vGPU的显卡才能使用vGPU,不支持的可以使用直通模式。
- 支持将2张显卡直通给一台云主机,其中T4、2080Ti最大可支持8张。
- vGPU场景下,显卡兼容性可查询“信服云兼容性平台”。
- 直通场景下,需使用英伟达公版驱动,显卡版本和驱动下载参考下列链接:https://www.nvidia.cn/Download/index.aspx?lang=cn。
- 6.9.0及其之后的版本开始支持国产GPU, 目前国产GPU仅支持直通,暂不支持切分。
• windows 在使用摩尔线程S2000显卡时,不支持采集GPU使用率和显存使用率。
• openeuler系统在使用华为atlas 300v pro时,不支持采集GPU使用率和显存使用率。
前提条件
- 显卡服务器+显卡,两台显卡服务器组成集群使用,或者一台显卡服务器和一台普通服务器组成集群,需要至少一张显卡。可以用深信服购买的显卡,也可以使用用户原有的显卡。
- 服务器有2D和3D服务器区分,原本的一体机是不能插显卡的,插显卡需要专门的显卡服务器。
操作步骤
HCI环境部署。硬件方面,在服务器上插上显卡,注意显卡的供电线要接上,显卡才会工作(显卡的功率大,有专门的供电线);软件方面,在服务器上安装HCI系统软件时或者是已有集群在插上显卡之后,平台检测硬件有显卡的时候,界面会自动显示是否需要开启IOMMU的选项,选择开启(开启之后需要重启主机才生效)。