基于google搜索积累的数据,google这家公司在人工智能,数据分析特别是机器学习方面拥有着大量的经验和算法。因此,在2015年底,google开源了自家的机器学习框架tensorflow时,也是引起了非常大的关注。到现在,这个项目在github上获得的star数已经超过其他的一些老牌的机器学习库,而且有许多人愿意为tensorflow贡献代码,它的未来是非常可观的。
要使用tensorflow当然首先要能够正确安装,tensorflow的安装现在已经非常简单了,分cpu版本和gpu版本,为了简单起见,这里只讨论cpu版本(电脑没带独显也是原因之一)。google提供了很多种安装方式,主要分三种,一种是pip安装,非常简单,重要的是它在各个平台都是可以用的,包括windows,第二种是通过docker安装,也差不多是一键安装,具体的介绍可以看这里,最后一种,就是从源代码编译安装,最麻烦,但是我们这里唯一可用的方法。因为就算在centos6下通过pip安装好了tensorflow,在运行的时候仍然会报glibc版本过低的错误,而docker更是不可能,因为内核版本低于3.10不能安装docker,所以我们愉快地选择了源码安装。
顺便一提,之所以选择这么折腾的方式,完全是因为公司的服务器是centos6.8的系统,然后我还没有sudo权限。
快速安装
我们可以直接通过pip安装。
pip install tensorflow
windows要求:64位python>=3.5
linux要求:glibc>=2.16
mac没有测试,可以参考官方安装指南
由于centos6上glibc最多到2.12,而强行使用高版本的glibc会导致程序意外崩溃,因此,我们采用本机源码编译安装。
源码安装
我这里用户名为wecooool,home位置为/home/wecooool/
在正式编译之前有如下若干个准备步骤
编译高版本gcc,因为需要用到c++11,所以要求gcc版本大于4.8,我们这里选择gcc4.9.4 。使用比4.9.4稍低版本的gcc是可以成功编译4.9.4的gcc,系统自带的4.4.7版本的gcc是满足要求的。我这里将它安装到/home/wecooool/software
文件夹,然后使用如下命令修改系统环境变量,使得后续的编译会使用新的gcc,而非系统里面老版本的gcc
export PATH=/home/wecooool/software/bin:$PATH
export CC=/home/wecooool/software/bin/gcc
export CXX=/home/wecooool/software/bin/g++
export C_INCLUDE_PATH=/home/wecooool/software/include
export CXX_INCLUDE_PATH=$C_INCLUDE_PATH
export LD_LIBRARY_PATH=/home/wecooool/software/lib
编译高版本python,tensorflow要求python版本至少是2.7或者3.3,而我们这里为了让代码能在windows上也能运行,选择python3.5.2,同样通过编译安装。具体的configure命令如下
./configure --prefix=/home/wecooool/software/Python-3.5.2 --enable-shared
加上enable-shared
是为了编译出动态链接库,方便其他程序调用。然后就是配置环境参数
export PATH=/home/wecooool/software/Python-3.5.2/bin:$PATH
export LD_LIBRARY_PATH=/home/wecooool/software/Python-3.5.2/lib:$LD_LIBRARY_PATH
完成后在bash中输入python3
应该就能进入python3.5.2的shell.之后下载get-pip.py,然后python3 get-pip.py
就完成了pip的安装,在bash中输入pip
或者pip3
应该都会调用新安装的pip.通过pip3 install numpy
安装numpy.
安装bazel,google使用bazel构建tensorflow,因此我们需要编译之。首先安装64位jdk1.8,因为bazel需要java8来编译,从oracle网站上选择jdk-8u111-linux-x64.tar.gz(官网上jdk具体的名字和链接地址可能会略有变化)下载,然后解压,将文件夹移到合适的地方,这里我们选择放到/home/wecooool/software/
,再来就是修改环境变量
export JAVA_HOME=/home/wecooool/software/jdk1.8.0_111
export PATH=$JAVA_HOME/bin:$PATH
在bash中输入java -version
应该有信息显示为64位的java1.8
java安装完成之后可以开始编译bazel
git clone https://github.com/bazelbuild/bazel.git
cd bazel
git checkout -b dev 0.4.0
./compile.sh
编译的结果为output/bazel,使用命令cp output/bazel /home/wecooool/software/bin/
,因为这个路径已经加入path,可以直接调用,这时在bash中输入bazel
应该能调用刚刚生成的bazel.
文件系统不应为NFS,否则后续的编译会出现奇怪的错误**
准备工作到此结束,接下来要开始正式编译tensorflow
首先下载源代码,
git clone https://github.com/tensorflow/tensorflow
cd tensorflow
此时还需要修改一个地方才能开始编译,vim tensorflow/tools/git/gen_git_source.py
,将文件开头的#!/usr/bin/env python
改成#!/usr/bin/env python3
,因为python3才是我们新生成的python.
开始configure,输入./configure
,会出现很多的选项供我们选择,这里主要是修改python位置,输入/home/wecooool/software/Python-3.5.2/bin/python3
,其他的选项就直接回车就行了。
之后就简单了,编译
bazel build -c opt //tensorflow/tools/pip_package:build_pip_package
安装
mkdir _python_build
cd _python_build
ln -s ../bazel-bin/tensorflow/tools/pip_package/build_pip_package.runfiles/org_tensorflow/* .
ln -s ../tensorflow/tools/pip_package/* .
python3 setup.py develop
到这里安装应该已经完成了,测试一下
$ python3
...
>>> import tensorflow as tf
>>> hello = tf.constant('Hello, TensorFlow!')
>>> sess = tf.Session()
>>> print(sess.run(hello))
Hello, TensorFlow!
>>> a = tf.constant(10)
>>> b = tf.constant(32)
>>> print(sess.run(a + b))
42
>>>
安装完成之后,记得把所有的环境变量的修改(export开头的语句)放进~/.bashrc,免得每次登录都重新设置一遍。