type
status
date
slug
tags
summary
category
password
icon
最近一台机器(环境为:Ubuntu+NVIDIA-430.34)重启后发生了找不到GPU驱动的问题:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
这个问题的原因一般是Ubuntu的内核版本更新了,而显卡驱动是在低版本的内核时安装的,因此发生了不兼容的问题。以往的解决方法是修改Ubuntu默认开机启动的内核版本:需要找到之前使用的内核版本(查看系统已安装内核版本时发现有好几个,也忘记之前安装驱动时内核版本是哪个),并修改grub开机配置,之后便是删除无用内核并禁止内核更新
鉴于上述方法过于复杂,这次采用新的方法:基于新的内核重新生成GPU的驱动模块。
  1. 安装DKMS, DKMS全称是Dynamic Kernel Module Support,它可以帮我们维护内核外的驱动程序,在内核版本变动之后可以自动重新生成新的模块。sudo apt-get install dkms
  1. 查看安装的NVIDIA-GPU驱动版本ls /usr/src
    1. notion image
  1. 重新生成驱动模块sudo dkms install -m nvidia -v 430.34
  1. 若成功,可以看到显卡信息。nvidia-smi
  1. 重新设置内核禁止更新uname -a # 查看正在使用的内核,e.g. linux-image-4.15.0-88-generic sudo apt-mark hold linux-image-4.15.0-88-generic
 
NVML-driver-library-version-dismatchLinux使用教程
GraphPKU
GraphPKU
北京大学张牧涵老师团队
公告
type
status
date
slug
tags
summary
category
password
icon
组会排期:
分享者1
分享者2
日期
孟繁续
8.22
陈立斌
毛彦升
杨昊桐
刘晔玮
江凡
王雨轩
汤平之
何梓源
华羽宸
张雪峰
施沛廷
孙一可
李自安
胡逸
亢世嘉
王奕丁
王彦博
彭鑫港
王希元
徐宇飞
地点:资源西楼2202
腾讯会议:694-682-1555
线下午餐时间 12:00
会议开始时间 12:30