方法一:
可以试一下下面这写指令,重新加载 NVIDIA 模块
sudo rmmod nvidia_uvm
sudo rmmod nvidia_drm
sudo rmmod nvidia_modeset
sudo rmmod nvidia
sudo modprobe nvidia
sudo modprobe nvidia_modeset
sudo modprobe nvidia_drm
nvidia-smi
再次运行 nvidia-smi 检查状态:运行成功!!!
方法二:
如果上面方法不行,可以试一下把下面链接方法试一下,删除那些进程
看nvidia模块使用情况
lsmod | grep nvidia
nvidia_uvm 647168 0 nvidia_drm 53248 0 nvidia_modeset 790528 1 nvidia_drm nvidia 12144640 152 nvidia_modeset,nvidia_uvm 12144640 152 nvidia_modeset,nvidia_uvm 这就需要我们来手动地关闭nvidia_modset和nvidia_uvm服务。
查看所有的nvidia相关的进程
sudo lsof -n -w /dev/nvidia*
然后,我们通过kill -9 PID 终止掉和nvidia_uvm,nvidia_modeset有关的进程。然后再重新执行如下的指令
sudo rmmod nvidia
sudo nvidia-smi #nvidia-smi发现没有kernel mod的时候,会自动装载
最后,正常情况下问题就解决了。 如果还没有解决,通过如下指令终止nvidia的相关服务
sudo rmmod nvidia_uvm
sudo rmmod nvidia_drm
sudo rmmod nvidia_modeset
sudo rmmod nvidia
再执行
sudo rmmod nvidia
参考链接(亲测有效):【nvidia-smi】Failed to initialize NVML: Driver/library version mismatch解决方法(不用重启)_driver library version mismatch-CSDN博客
评论前必须登录!
注册