系统:Ubuntu16.04 LTS
显卡:GeForce GTX 1060
1 安装NVIDIA显卡驱动
1.1 下载NVIDIA显卡驱动程序
从(https://www.geforce.cn/drivers)上选择支持本机显卡的的驱动程序下载,这里选择NVIDIA-Linux-x86_64-384.98.run,下载至~/Downloads文件夹
1.2 安装
首先屏蔽nouveau启动,这里选择blacklist方式,将nouveau驱动添加到黑名单blacklist.conf中
#打开blacklist文件
sudo vi/etc/modprobe.d/blacklist.conf
#在文件末尾添加以下语句
blacklist nouveau
#关闭文件后更新
sudo update-initramfs -u
#重启系统
reboot
#确认nouveau已被禁止
lsmod | grep nouveau
按Ctrl + Alt + F1到控制台,关闭当前图形环境
输入用户名和密码登录
#以下三句确保结束x-window服务
sudo init 3
sudo rm -r /tmp/.X*
sudo service lightdm stop
#进入驱动下载文件夹
cd ~/Downloads
#改文件权限为可执行文件
chmod +x NVIDIA-Linux-x86_64-384.98.run
#执行文件,--no-opengl-files只安装驱动文件,不安装OpenGL文件
sudo ./NVIDIA-Linux-x86_64-384.98.run --no-opengl-files
#根据提示完成安装即可,后重启
reboot
#检查驱动是否安装成功
nvidia-smi
输出以下信息说明安装成功
2 配置tensorflow-gpu
2.1 安装CUDA
2.1.1 下载CUDA
从https://developer.nvidia.com/cuda-80-ga2-download-archive下载CUDA8.0。CUDA已更新至9.0,未防止出现不兼容性,建议下载旧版。网页如需注册,可注册一下,注册到通过可能需要几分钟到十几分钟。
2.1.2 安装
#改变文件权限
chmod u+x cuda_8.0.61_375.26_linux.run
#执行文件
sudo ./cuda_8.0.61_375.26_linux
#接下来进入CUDA的安装过程,按q键跳过license说明
#accept接受协议
#是否安装NVIDIA启动选择否(重要!CUDA自带的显卡驱动兼容性差,而且我们之前已经手动安装了显卡驱动)
Istall NVIDIA AcceleratedGraphics Driver for Linux-X86_64 367.48?
(y)es/(n)o/(q)uit: #请选择n
#其他选项按y或默认即可
2.2 安装cuDNN
2.2.1 下载cuDNN
从(https://developer.nvidia.com/rdp/cudnn-download)下载cuDNN5.1到~/Downloads文件夹。同样为防止出现不兼容性,建议下载旧版,网页如需注册,可注册一下。
2.2.2 安装
#进入刚刚cuda的安装目录
cd /usr/local
#解压后自动配置
sudo tar -zxvf ~/Downloads/cudnn-8.0-linux-x64-v5.1.tgz
#设置环境路径
vi ~/.bashrc
#在文件末尾添加以下三个语句
exportLD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:/usr/local/cuda-8.0/extras/CUPTI/lib64:$LD_LIBRARY_PATH
exportCUDA_HOME=/usr/local/cuda-8.0
exportPATH=/usr/local/cuda-8.0/bin:$PATH
#关闭文件后更新
source ~/.bashrc
#确认完成CUDA安装
nvcc -V
输出以下信息说明安装成功
2.3 安装tensorflow-gpu
系统:Ubuntu16.04LTS
python:python2.7
tensorflow官网上给出了virtualenv、“native” pip、Docker、Anaconda和源代码安装五种方式,这里推荐使用virtualenv安装
#安装pip和virtualenv
sudo apt-get install python-pip python-dev python-virtualenv
#创建virtualenv环境,命令中“~/tensorflow”可更改为自定义路径
virtualenv --system-site-packages ~/tensorflow
#激活virtualenv环境,之后每次使用tensorflow之前,都需要首先激活环境
source ~/tensorflow/bin/activate
#命令行改变为“(tensorflow)$”
#确保pip版本在8.1以上
easy_install -U pip
#安装tensorflow-gpu,tensorflow默认安装1.4版本,未避免出现不兼容性,这里推荐安装1.2的较低版本
pip install --upgrade tensorflow-gpu==1.2
#完成安装,运行以下程序确认tensorflow-gpu可以运行
python
import tensorflow as tf
hello = tf.constant('Hello,TensorFlow!')
sess = tf.Session()
出现如下信息,说明tensorflow-gpu启动成功
#输出“Hello, TensorFlow!”说明tensorflow成功运行
print(sess.run(hello))
tensorflow的安装说明主要来自tensorflow官网,如果安装过程出现问题,请参阅(https://www.tensorflow.org/install/install_linux)以获得更多信息和帮助。
鉴于笔者水平有限,以上安装步骤如有错误或疏漏之处,烦请不吝指教