云计算百科
云计算领域专业知识百科平台

输入nvidia-smi指令报错Failed to initialize NVML: Driver/library version mismatch的解决方法(不用重启电脑或服务器)

方法一:

可以试一下下面这写指令,重新加载 NVIDIA 模块

sudo rmmod nvidia_uvm
sudo rmmod nvidia_drm
sudo rmmod nvidia_modeset
sudo rmmod nvidia
sudo modprobe nvidia
sudo modprobe nvidia_modeset
sudo modprobe nvidia_drm
nvidia-smi

再次运行 nvidia-smi 检查状态:运行成功!!! 

方法二:

如果上面方法不行,可以试一下把下面链接方法试一下,删除那些进程

看nvidia模块使用情况

lsmod | grep nvidia

nvidia_uvm            647168  0 nvidia_drm             53248  0 nvidia_modeset        790528  1 nvidia_drm nvidia              12144640  152 nvidia_modeset,nvidia_uvm            12144640  152 nvidia_modeset,nvidia_uvm  这就需要我们来手动地关闭nvidia_modset和nvidia_uvm服务。

查看所有的nvidia相关的进程 

sudo lsof -n -w  /dev/nvidia*

然后,我们通过kill -9 PID 终止掉和nvidia_uvm,nvidia_modeset有关的进程。然后再重新执行如下的指令

sudo rmmod nvidia
sudo nvidia-smi   #nvidia-smi发现没有kernel mod的时候,会自动装载

最后,正常情况下问题就解决了。 如果还没有解决,通过如下指令终止nvidia的相关服务

sudo rmmod nvidia_uvm
sudo rmmod nvidia_drm
sudo rmmod nvidia_modeset
sudo rmmod nvidia

再执行

sudo rmmod nvidia

参考链接(亲测有效):【nvidia-smi】Failed to initialize NVML: Driver/library version mismatch解决方法(不用重启)_driver library version mismatch-CSDN博客

赞(0)
未经允许不得转载:网硕互联帮助中心 » 输入nvidia-smi指令报错Failed to initialize NVML: Driver/library version mismatch的解决方法(不用重启电脑或服务器)
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!