服务器重启nvidia无法使用

服务器重启nvidia无法使用

1、问题

服务器进行了重启后,进行docker run 使用gpu时报错:

docker: Error response from daemon: OCI runtime create failed: container_linux.go:380: starting container process caused: process_linux.go:545: container init caused: Running hook #0:: error running hook: exit status 1, stdout: , stderr: nvidia-container-cli: initialization error: nvml error: driver not loaded: unknown.

用nvidia-smi命令查看也发现无法使用,并提示

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. 
Make sure that the latest NVIDIA driver is installed and running.

说明重启导致nvidia蹦了

二、原因

linux服务器重启之后有时候内核更新了,这时候系统会自动更新内核,那么原来的nvidia驱动器的版本就跟不上内核的版本了。

三、方案一

参考(https://zhuanlan.zhihu.com/p/89714824)

sudo yum install dkms
sudo dkms install -m nvidia -v 418.87.00

其中,418.87.00 是之前安装 nvidia 驱动的版本号,可通过下面方法查到:

ls /usr/src | grep nvidia

但本人试过,没用

四、方案二

重装nvidia驱动

4.1 依赖环境

yum install kernel-devel gcc cmake build-essential -y

4.2 修改设置

4.2.1 屏蔽nouveau

Nouveau 是由第三方为 NVIDIA 显卡开发的一个开源 3D 驱动,也没能得到 NVIDIA 的认可与支持。虽然 Nouveau Gallium3D 在游戏速度上还远远无法和 NVIDIA 官方私有驱动相提并论,不过却让 Linux 更容易的应对各种复杂的 NVIDIA 显卡环境,让用户安装完系统即可进入桌面并且有不错的显示效果,所以,很多 Linux 发行版默认集成了 Nouveau 驱动,在遇到 NVIDIA 显卡时默认安装。

企业版的Linux 更是如此,几乎所有支持图形界面的企业 Linux 发行版都将 Nouveau 收入其中。

对于个人桌面用户来说,处于成长阶段的 Nouveau 并不完美,与企业版不一样,个人用户除了想让正常显示图形界面外很多时候还需要一些 3D 特效,Nouveau 多数时候并不能完成,而用户在安装 NVIDIA 官方私有驱动的时候 Nouveau 又成为了阻碍,不禁用 Nouveau 安装时总是报错, 错误如下:

ERROR: The Nouveau kernel driver is currently in use by your system. This driver is incompatible with the NVIDIA driver……

查看命令

ls mod | grep nouveau
image-20210811152336472.png

修改dist-blacklist.conf文件

vim /lib/modprobe.d/dist-blacklist.conf
#将nvidiafb注释掉:
#blacklist nvidiafb

#然后添加以下语句:
blacklist nouveau
options nouveau modeset=0

重启

sudo reboot

屏蔽后,lsmod | grep nouveau 将无信息输出

但,实践试过,还有信息输出,下面操作之后才无信息输出:

重建initramfs images:

mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)

这时lsmod | grep nouveau 命令才显示无内容,说明禁用成功

4.2.2 屏蔽nouveau或者采用:

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

加入:

blacklist nouveau
options nouveau modeset=0

更新使其生效

sudo update-initramfs -u

4.2.3 修改运行级别为文本模式

systemctl set-default multi-user.target

如果不改为文本模式将无法安装

或者用下面的操作:

systemctl set-default multi-user.target
# init 3

4.2.4 重新启动服务器

sudo reboot

4.3 NVIDIA驱动下载安装

下载地址:NVIDIA 驱动程序下载

image-20210811154129768-16286676920411.png

image-20210811154209646.png

复制到服务器的文件夹中,cd到此文件夹中

修改权限

chmod +x NVIDIA-Linux-x86_64-440.118.02.run

安装

./NVIDIA-Linux-x86_64-440.118.02.run

安装过程,选择yes 跟accept

如果报错 unable to find the kernel source tree for the currently running kernel…,使用下面命令安装,3.10.0-1062.18.1.el7.x86_64需要改成自己的目录,可以用uname -r查看

./NVIDIA-Linux-x86_64-440.118.02.run --kernel-source-path=/usr/src/kernels/3.10.0-1160.25.1.el7.x86_64 -k $(uname -r)

4.4 安装成功

nvidia-smi
image-20210811154801866-16286680836212.png

[参考]

CentOS7安装NVIDIA显卡驱动maqian5的博客-CSDN博客centos7安装nvidia显卡驱动

Ubuntu 安装 NVIDIA 显卡驱动详细步骤(ERROR: The Nouveau kernel driver is currently in use by your system)_wohu1104的专栏-CSDN博客

CentOS 7 安装 NVIDIA 显卡驱动和 CUDA Toolkit_Xue Shengke 博客-CSDN博客

Linux服务器重启后nvidia-smi无法使用的解决方法_周晓松的个人主页-CSDN博客

参考4(https://blog.csdn.net/real_cactus/article/details/110621471)

nvidia-smi 报错:无法与 nvidia driver 通信 - 知乎 (zhihu.com)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,163评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,301评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,089评论 0 352
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,093评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,110评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,079评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,005评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,840评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,278评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,497评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,394评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,980评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,628评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,649评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,548评论 2 352

推荐阅读更多精彩内容