近期因为运行深度模型程序的需要,在自己的台式机上运行Theano
,遇到了不少问题。实际上如果只是让程序跑起来,不考虑速度的话,直接pip install theano
就搞定了,但如果加上GPU,还是在Windows上,就很容易呼天抢地了……
关于Theano
的详细配置,其实Theano documentation里已经介绍很清晰了,但无奈其中的Windows部分,大多数依赖项都是按照旧版本来写的,所以几乎是一步一坑,处处地雷。。。
下面结合自己配置Theano
+GPU的经历,大概总结下我最终配置成功的操作。
关于Python
在Windows系统下,不太建议直接使用python+pip管理,各种底层基于C的package使用pip install
经常出错。这个网站Unofficial Windows Binaries for Python Extension Packages提供了大多常用package的编译好的版本,可以下载后直接pip
安装 whl
文件,但这种处理方式还是过于原始,费心费力……
比较好的做法是使用Python的集合发行版,比如Anaconda
或Winpython
。这种发行版一般会内置好大多数常用package,尽量实现python与底层操作系统的隔离。个人更喜欢Anaconda
,除了因为包管理外,Anaconda
还支持环境,可以避免在机器上安装各种py2
、py3
版本的python。
现在安装Anacoda的话,默认环境的python好像是3.5的,但这不重要,随时用conda create
就可以创建一个新的python版本。Theano
官方教程也推荐用在Windows下使用Anaconda
,但你会发现,你运行conda install libpython
都会出问题。。。
关于Anaconda与Theano
安装好Anaconda
后,怎么安装Theano
,配置GPU,可以参考这篇文章:windows10下theano启用gpu:CUDA + Anaconda。我就是最终参考这篇文章配置好的,这里就直接引用下,不再详细拷贝过来了。
只补充说明以下几点:
- 关于
Visual Studio
,根据原文注意下是否版本支持就行,一定注意在PATH中添加对应的路径。 - 有时候运行
Visual Studio
的cuda
样例工程,会遇到编译失败(fatal error)问题,这一般是因为路径下有旧的不兼容的工程生成文件,先删掉旧的再重新编译即可。 - 原博客中,创建python34环境后,重新更改了环境变量,指向python34的env,其实也可以使用
activate env_name
激活某个虚拟环境,这样Anaconda
会自动更改python版本指向,缺点是每次重新运行cmd时都需要先activate一下。两种方法各有优劣,看自己喜好。 - 有个编码的错误,需要改动
Theano
的一处源码,参考原文评论,需要修改的位置是Anaconda3/envs/python34/lib/site-packages/theano/compat/__init__.py
,第46行左右的yield x.decode()
改为yield x.decode('GBK')
(Mac OSX等系统就不用改这个了……) -
MinGW
等底层支持,使用Anaconda
自动管理即可,如无其他需要,不用手动安装这些工具。
碎碎念
听说Tensorflow
才是未来?目前Keras
的backend是同时支持Theano
和Tensorflow
的,真是好……
再次吐槽下Windows系统对开发人员的不友好……在Linux或Mac OS X上,上面的问题就少多了……
2016.07.24补充:
因为实验室采购了NVIDIA GTX 1080的显卡,我又在Ubuntu环境下配置cuda和Theano,发现坑也不少,主要是因为1080的卡是最新的,所以驱动方面有些注意事项。最后我是参考这篇文章配置好的:深度学习主机环境配置: Ubuntu16.04+Nvidia GTX 1080+CUDA8.0,仅供参考。
Hail Python!