1 搭建准备
进行深度学习主机的环境搭建,首先当然是要了解自己的机器啦,下面我们来看看本次搭建的软硬件配置。
硬件配置:
机箱主板:联想P910
存储:512G(SSD)+4T(HDD)+32G(RAM)
CPU:2*E5-2630V4
显卡:TITAN XP*1
软件配置:
操作系统:64位windows7专业版
深度学习开发比较方便是在linux系统啦,目前ubuntu16.04是比较稳定的版本,支持大多数的库,亲测不会出现太多的问题。由于配置了显卡和后期会使用CNN,还需要安装cuda和cuDNN,考虑到各版本的相互的兼容性问题,选取比较稳定的软件版本,如下所示:
ubuntu 16.04
CUDA 9.0
cuDNN 7.1.1
(各软件及版本下载链接之后给出)
2 开始搭建
2.1 安装linux单系统(ubuntu16.04)
2.1.1 首先去网易开源镜像下载ubuntu16.04
2.1.2 下载软碟通,使用软碟通和ubuntu的镜像文件,制作U盘启动盘
具体操作如下:
打开-选择下好的系统iso文件-选择u盘-启动-写入硬盘映像
“写入方式”选择“USB-HDD+”
接着单击“格式化”,按默认即可(一般默认文件系统位FAT32)
注意镜像文件大小,应小于U盘大小
2.1.3 重启电脑,在黑屏状态下,按住F12,进入U盘启动,进入ubuntu安装引导
ubuntu安装参见链接
安装时最好保持机器在断网的状态下,提高安装速度
2.2 安装显卡驱动+CUDA+cuDNN
2.2.1 下载cuda9.0及安装
首先,根据硬件型号及系统环境,下载所需资源:(安装cuda时会安装显卡驱动)
CUDA下载链接+安装方法
https://developer.nvidia.com/cuda-downloads
设置环境变量:
sudo gedit /etc/profile
$ export PATH=/usr/local/cuda-7.5/bin:$PATH
$ export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH
2.2.1下载cuDNN及安装
cuDNN下载链接
https://developer.nvidia.com/rdp/cudnn-download
如果是奇怪的后缀,就cp打开
1sudo tar -xzvf cudnn-8.0-linux-x64-v5.1.tgz
2sudo cp cuda/include/cudnn.h /usr/local/cuda/include
3sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
4sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
安装tensorflow-GPU版本
pip install tensorflow-gpu
相关教程链接:
https://www.r-bloggers.com/lang/chinese/2042
Ubuntu16.04 + Titan XP + cuda8.0 + cudnn5.1 + opencv3.3.0 + caffe
http://blog.csdn.net/mynotwo/article/details/78661664
Ubuntu16.04安装NVIDIA Titan Xp显卡驱动
http://blog.csdn.net/javahaoshuang3394/article/details/76425009
http://www.52nlp.cn/从零开始搭建深度学习服务器环境配置ubuntu-1080ti-cuda-cudnn
安装完cuda要进行测试
2、安装cuda 9.0 deb文件(自带显卡驱动)
2.1 获取CUDA安装包,在NVidia官网下载local deb文件。
2.2执行如下命令安装:
$ sudo dpkg -i cuda-repo-ubuntu1410-7-0-local_7.0-28_amd64.deb
$ sudo apt-get update
$ sudo apt-get install cuda
2.3设置环境变量:sudo gedit /etc/profile
$ export PATH=/usr/local/cuda-9.0/bin:$PATH
$ export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH
2.4重启机器:用其中一个样例进行验证测试
$ cuda-install-samples-7.5.sh ~
$ cd ~/NVIDIA_CUDA-Samples_7.5/5_Simulations/nbody
$ make
$ ./nbody
或者在sample目录中make测试项目1_utility,再运行./deviceQuery
一些小技巧:
1.查询NVDIA显卡编号
lspci | grep -i nvidia
2.显卡信息
nvidia-smi
3.显存信息
nvidia-smi -l
3.查询cuda版本+移除cuda+查询cuda链接目录
apt search cuda
apt remove cuda
ll /usr/local/cuda
ln 可以用来指向cuda目录
如果是升级cuda和cuDNN,直接覆盖即可,pip会自动进行管理。
python相关安装:
sudo apt-get install --no-install-recommends
git graphviz python-dev python-flask python-flaskext.wtf
python-gevent python-h5py python-numpy python-pil
python-pip python-protobuf python-scipy