参考https://blog.csdn.net/u012325865/article/details/73034018
1、检查是否安装了GPU
lspci | grep -i nvidia
看到GPU显卡型号是GeForce GTX 1080 Ti,另一张是集显
2、下载对应GPU 显卡的驱动
在官网下载对应的驱动http://www.nvidia.cn/Download/index.aspx?lang=cn
要选择自己GPU对应型号的驱动,这里盗了张图。
然后跳转到下载页面,下载 NVIDIA-Linux-x86_64-390.67.run
3、下载CUDA
https://developer.nvidia.com/cuda-toolkit-archive
然后跳转到下载页面,下载 cuda_8.0.61_375.26_linux.run
4、安装gcc、g++编译器
root登陆
yum install gcc
yum install gcc-c++
5、安装kernel-devel和kernel-headers
yum install kernel-devel
yum install kernel-headers
6、赋予权限
chmod 755 NVIDIA-Linux-x86_64-390.67.run
chmod 755 cuda_8.0.61_375.26_linux.run
7、禁用nouveau
系统直接显示1366X768的分辨率,就是默认装了驱动的,但不是NVIDIA的官方驱动。Centos默认安装了开源的nouveau kernel driver, 与NVIDIA驱动冲突。所以需先退出图形界面并将nouveau禁用后,才能安装NVIDIA官方驱动。
参考 https://blog.csdn.net/zhangtong11111/article/details/7913197
1)退出图形界面,进入init 3文本模式
Ctrl+Alt+F2 进入纯命令模式
登陆----获取root权限
输入init 3
2)在/etc/modprobe.d/blacklist.conf中添加两行内容:
blacklist nouveau
optionsnouveau modeset=0
2)给当前镜像做备份
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
3)建立新的镜像
dracut /boot/initramfs-$(uname -r).img $(uname -r)
4)重启系统
5)进入init 3文本模式,检查nouveau driver是否没有被加载
lsmod | grep nouveau
8、安装驱动和CUDA
切换至安装包文件夹
./NVIDIA-Linux-x86_64-390.67.run #根据提示安装
./cuda_8.0.61_375.26_linux.run #根据提示安装,Ctrl+C跳过协议,是否安装driver这里一定选no,因为上一步已经安装了驱动了,我试过选yes后:自动安装驱动并提示需要重启,重新执行CUDA安装,又会卡在这里,循环安装驱动-重启。安装路径我使用默认,这个路径你要记得,后续配置环境变量会使用到。
这里介绍我遇到的两种错误和解决方法。
1)假如安装驱动报错:
ERROR: The Nouveau kernel driver is currently in use by your system. This
driver is incompatible with the NVIDIA driver, and must be disabled
before proceeding. Please consult the NVIDIA driver README and your
Linux distribution's documentation for details on how to correctly
disable the Nouveau kernel driver.
解决方法:禁用Nouveau显卡驱动,可以参考我前面的步骤,也可以参考https://blog.csdn.net/stu741/article/details/40046397
2)假如安装CUDA报错:
The driver installation is unable to locate the kernel source. Please make sure that the kernel source packages are installed and set up correctly.
If you know that the kernel source packages are installed and set up correctly, you may pass the location of the kernel source with the '--kernel-source-path' flag.
sudo yum install epel-release
yum install --enablerepo=epel dkms
建议不要尝试升级内核,我试过然后系统崩溃了,一切重来。
9、配置环境变量
gedit ~/.bashrc
#写入bashrc文件保存
#gpu driver
export CUDA_HOME=/usr/local/cuda-8.0
export PATH=/usr/local/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH="/usr/local/cuda-8.0/lib:${LD_LIBRARY_PATH}"
source之后查看安装结果
source ~/.bashrc
nvidia-smi
11、测试cuda
cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery
make
./deviceQuery
安装成功!
12、安装cudnn7.5
从官网上(https://developer.nvidia.com/cudnn)下载相关版本的CUDNN(需要先注册账号才能下载):一定要选择CUDA相对应版本的。
解压并拷贝到系统目录下:
切换至所在目录
tar xzvf cudnn-8.0-linux-x64-v6.0.tgz
cp cuda/include/cudnn.h /usr/local/cuda/include
cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
13、查看CUDA,CUDNN 版本号
查看 CUDA 版本:
cat /usr/local/cuda/version.txt
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
14、安装Anaconda3
1)清华镜像源下载安装包:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
2)执行安装,安装路径不要用默认的/root/anaconda3,因为这个路径是root权限的,安装后每次使用anaconda3都要切换用户到root,非常不方便。因此最好是将anaconda安装到用户权限目录。
修改/opt目录及其子目录的所有者为用户:chown -R user1 /opt 目录opt用户改成user1,包括dir里面的子目录和文件。
anaconda安装路径改为/opt/anaconda3,不添加到环境变量(稍后手动添加),不安装Microsoft VSCode。
bash Anaconda3-5.0.1-Linux-x86_64.sh
3)安装完毕后手动添加环境变量:
切换回用户账户,修改用户的环境变量 gedit ~/.bashrc,在文件末尾添加一行:export PATH=/root/anaconda3/bin:$PATH,再使其生效source ~/.bashrc。
修改系统环境变量 gedit /etc/profile,打开profile文件
在文件末尾添加一行:export PATH=/root/anaconda3/bin:$PATH,其中,将“/root/anaconda3/bin”替换为你实际的安装路径,保存。
使环境变量生效 source /etc/profile,发现python改为3.6版本了。
15、安装Tensorflow 1.3
pip install tensorflow==1.3