参考资料:
1.【亲测】Ubuntu16.04手动安装nvidia显卡驱动+CUDA 8.0--Acer E5-572G版
2.import tensorflow as tf错误
3.Ubuntu16.04 安装Python3.6
4.Ubuntu16.04 python2.7升级python3.5
安装NVIDIA驱动之前
1)去nvidia驱动官网下载符合自己显卡的驱动的 .run 文件;
2)卸载掉原来的nvidia驱动: sudo apt-get autoremove --purge nvidia-*
如果是 run 文件安装的,则这样卸载: sh ./nvidia********.run --uninstall
3)打开配置文件,禁用nouveau:sudo gedit /etc/modprobe.d/blacklist.conf
4)禁用nouveau第三方驱动,在最后一行添加:blacklist nouveau
5)执行:sudo update-initramfs -u
6)执行或者重启后执行:lsmod | grep nouveau , 只要没有输出就好了。
开始安装驱动:
1)进入控制台1,在终端输入:Ctrl-Alt+F1(可能会出现乱码,解决方案:ubuntu 16.04 server tty1中文乱码)
2)然后关闭x window界面:sudo service lightdm stop
3)将目录切换到nvidia驱动所在的目录下,并赋予run文件执行权限:sudo chmod a+x NVIDIA*.run
- 然后安装:sudo ./NVIDIA*.run --no-opengl-files 。即不安装OpenGL文件,注意no前面是两个 - - ,其他都是一个。还有其他几个参数可选:
--no-opengl-files 只安装驱动文件,不安装OpenGL文件。这个参数最重要;
--no-x-check 安装驱动时不检查X服务;
--no-nouveau-check 安装驱动时不检查nouveau;后面两个参数可不加。
5)然后可用nvidia-smi命令测试是否可以看到显卡信息,若能看到,即为成功;
6)然后开启x window界面:sudo service lightdm start
7)重启,并不会出现循环登录的问题.
安装cuda
注意:下载的CUDA的版本要记住,后面安装cuDNN要和CUDA的版本要配套,参考“参考资料2”
1)重启后再次进入字符终端界面(Ctrl + Alt + F1),并关闭x window图形界面,进入安全模式安装(lightdm):sudo service lightdm stop
2)在安装cuda时,可以自动安装NVIDIA驱动的,但是这样安装的驱动版本较低,会自动安装OpenGL等文件,又会造成冲突,有问题,所以需要先安装NVIDIA驱动,在安装CUDA时选择不安装驱动。切换到cuda_8.0.44_linux.run的目录,执行:sudo sh cuda_8.0.44_linux.run
!Note:安装的时候,要让你先看一堆文字(EULA),我们直接不停的按空格键到100%,或者Ctrl+C跳过;然后根据提示是否接收,我们选择 accept
3)然后一路根据提示进行操作,遇到提示是否安装nvidia驱动 ,选择no,即不安装,因为之前已经装好了。
4)其他的可以一路accept, yes或回车,默认安装
5)开启x window图形界面,回到界面,或者从一开始直接在界面安装
应该也行:sudo service lightdm start
6)安装的时候,选择安装Sample,用以安装之后的验证。
7)安装后CUDA后,需要设置环境变量, sudo gedit /etc/profile
8)在profile结尾加上:
export PATH=/usr/local/cuda-8.0/bin{PATH}} (替换成自己系统cuda的bin位置,一般默认是这个)
9)保存后,在终端中 source /etc/profile
10)然后跳转至cuda的sample文件夹下:cd ***samples/1_Utilities/deviceQuery (看自己具体路径,如果是run,默认会在home下面)
11)执行make,如果提示权限不够,就 sudo make
12)之后执行文件:./deviceQuery
最后是 Result = PASS 就OK了。
安装cuDNN
我下载的是Download cuDNN v6.0 (April 27, 2017), for CUDA 8.0
在下载包所在目录,打开终端:
tar xvzf cudnn-8.0-linux-x64-v5.1-ga.tgz(这是你自己下载的文件名)
sudo cp -P cuda/include/cudnn.h /usr/local/cuda/include
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
在终端输入:
sudo apt-get install libcupti-dev
安装python
Ubuntu16.04本身有Python2.7,这里安装python3.6
参考“参考资料3&4”
问题:
zipimport.ZipImportError: can't decompress data; zlib not available
方法:
python学习笔记-zipimport.ZipImportError: can't decompress data; zlib not available
安装TensorFlow
根据“参考资料2”,下载tensorflow_gpu-1.4
命令:
pip install tensorflow-gpu==1.4
测试
ImportError: libcusolver.so.8.0: cannot open shared object file: No such file or directory
解决方案:
sudo ldconfig /usr/local/cuda/lib64