一、功能需求
软件版本:MCloud4.3.35
硬件版本:MCloud3012-HG
MCloud超融合产品配置有GPU设备时,如何配置VGPU进行使用。目前MCloud超融合产品支持虚拟化切割的显卡型号有:NVIDIA 系列 Tesla T4,Tesla M10/M60,Tesla P100/P40/P6/P4,Tesla V100 RTX 6000/8000;AMD 系列FireProS7150,FireProS7150X;本案例使用TeslaT4环境编写。
二、组网图
三、配置步骤
1、下载VGPU设备驱动使用的若为nvidiaTeslaT4显卡可在NAS目录:172.153.254.4:\技术服务部\06-文件及备份技术支持\09-其他\英伟达Tesla T4显卡VGPU驱动以及使用教程;下载VGPU驱动。
2、Linux安装NVIDIAVGPU驱动具体步骤如下:
(1)打开终端输入lspci|grepNVIDIA查看连接的GPU型号和数量是否正确。
(2)查看若有返回值则存在NVIDIA显卡的开源驱动,需要卸载该驱动:lsmod|grepnouveau
(3)vi /etc/modprobe.d/blacklist.conf在该文件中写入blacklist nouveau,将nouveau添加到黑名单。
(4)备份原有镜像mv /boot/initramfs-(unamer).img/boot/initramfs(uname-r).img/boot/initramfs-(unamer).img/boot/initramfs(uname-r).img.bak
(5)重塑镜像dracut/boot/initramfs-$(uname-r).img$(uname-r)
(6)重启服务器:reboot
(7)安装显卡驱动:./NVIDIA-xxxxxxx.run根据对话框安装显卡驱动。
(8)查看显卡驱动是否正常:nvidia-smivgpu-s有切割GPU规格表明驱动安装成功。
3、重启进入物理机BIOS开启虚拟化IOMMU功能,开启成功后在软件界面显示IOMMU开启。
4、检查云平台是否能正常识别GPU设备。
5、按照需要的规格将物理GPU进行切割,切割完成后显示如下:
6、使用windowsserver2016镜像,创建nvidia授权云主机(要求使用英文语言安装,推荐配置8核16G或4核8G)。
7、在虚拟机中安装java环境,推荐使用NAS路径下的openjdk安装包进行安装,其他安装包可能需要手动开启tomcat服务。
8、使用NVIDIA-ls-Windows安装包安装英伟达授权服务器软件,安装完成后可以使用localhost:8080/licserver登录授权管理平台且页面无报错则表示授权服务器部署成功。
9、点击configuration选择相应的网卡保存配置后申请授权。
10、导入申请到的授权文件。
11、创建云主机分配VGPU,系统完成之后可以使用NVIDIA-GRID-vSphere安装包中的grid驱动根据使用的操作系统进行VGPU驱动安装,安装成功后在桌面右键能够打开英伟达控制面板,输入授权服务器的授权网卡IP地址和端口号后许可证显示已获取则表示VGPU环境部署成功。
四、配置关键点
需确保正确安装了显卡相对应的VGPU驱动
五、风险提示
1、一台云主机仅支持同时加载一个vGPU,暂不支持将物理GPU和vGPU同时加载到同一台云主机使用。
2、已透传的物理GPU,不支持虚拟化切割成多个vGPU。
3、执行加载、卸载vGPU操作前,请确保云主机状态为已停止。
4、已加载GPU规格、已加载GPU设备或运行中的云主机无法加载GPU规格。
六、关键字
MCloud,VGPU,超融合,显卡,虚拟化