1.安装cuda,自己已经安装cuda8.0,跳过。
之前没有编译,这次编译一下
打开C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0 目录下的Samples_vs2015.sln,然后生成解决方案,
点击菜单栏的生成-->生成解决方案
出现错误c:\programdata\nvidia corporation\cuda samples\v8.0\3_imaging\cudadecoded3d9\ImageDX.h(21): fatal error C1083: 无法打开包括文件: “d3dx9.h”: No such file or director 67> VideoDecoder.cpp
解决方式:安装directX 微软的某个组件
在官网上下载:https://www.microsoft.com/en-us/download/details.aspx?id=6812
安装后再生成
然后查看是否编译成功cd c:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0\bin\win64\Release目录,输入:deviceQuery.exe
出现如下表示成功
2.安装cudnn,开始以为自己没装,所以下载 这里用v5的
https://developer.nvidia.com/rdp/cudnn-download 下载
选择cuDNN v5.1 Library for Windows 10 其实这些东西可以在百度云里面下,又快又好
然后 解压后发现,自己已经把相应文件copy到了cuda里面了
cuda\bin\cudnn64_5.dll —> C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin
cuda\include\cudnn.h —> C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include
cuda\lib\x64\cudnn.lib —> C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\lib\x64
所以还是跳过
3.安装tensorflow,由于自己已经安装了anoconda,所以跳过anoconda的安装。
activate tensorflow
conda install numpy scipy matplotlib spyder
pip install --ignore-installed --upgrade https://storage.googleapis.com/tensorflow/windows/gpu/tensorflow_gpu-1.0.1-cp35-cp35m-win_amd64.whl
4.安装keras
conda install keras
5.查看GPU的使用状况
在windows 下 查询nvidia-smi要用这种方式
cd c:\Program Files\NVIDIA Corporation\NVSMI
nvidia-smi.exe #而且要用管理员权限才能开
主要参考
https://github.com/antoniosehk/keras-tensorflow-windows-installation
工作了,所以新装了一台机子。从无到有的一个过程吧,主要参考的是https://www.tensorflow.org/install/install_windows?hl=zh-cn
要装的是gpu版本的,所以的话要装CUDA Toolkit 这里要求的版本是9.0的
安装 anoconda5.2 python3.6的版本 https://www.anaconda.com/download/
之后cmd命令行出现 conda不是内部或外部命令
感觉估计是环境变量没有加
在用户的path里面添加D:\Users\chunyan\AppData\Local\Continuum\anaconda3和D:\Users\chunyan\AppData\Local\Continuum\anaconda3\Scripts就ok了
conda create -n tf35 pip python=3.5
运行示例代码 出现问题 could not find 'cudart64_90.dll 用everything查找,发现并没有这个文件,很奇怪。说明cuda根本就没有安装上。一直装一直装,才发现,嗯,傻逼了。自己只下了patch3,这只是一个补丁,要下basic installer.
重新下,然后一路安装,就有这个文件了,接下来。
添加环境变量:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin
下载cudnnv7版本 然后 拷到cuda对应的文件夹中
然后tensorflow 就装好了。
查看tf版本 tf.version
安装git 下载https://git-scm.com/download/win
添加环境变量 C:\Program Files (x86)\Git\bin
在windows下使用 make
下载mingw https://sourceforge.net/projects/mingw/?source=typ_redirect
添加环境变量 C:\MinGW\bin
在win下 需要使用 mingw32-make 来使用make
出现错误 makecpython++ 不是内部外部命令
改成python3 无果
尝试 https://github.com/Russell91/TensorBox/issues/101 无果
装了一下opencv pip install opencv_python 是下面的短横,不是中间的。
发现自己搞错了代码,自己要下的是kittiseg 不是mulitinet
出错ImportError: No module named 'tensorvision'
https://github.com/MarvinTeichmann/KittiSeg/issues/17 这是因为win 和 Linux 不一样,所以 导入不了submodle的包
在主文件夹下添加文件install_windows.bat 内容如下
del %~dp0\incl\evaluation
del %~dp0\incl\seg_utils
del %~dp0\incl\tensorflow_fcn
del %~dp0\incl\tensorvision
mklink /D %~dp0\incl\evaluation %~dp0\submodules\evaluation
mklink /D %~dp0\incl\seg_utils %~dp0\submodules\evaluation\kitti_devkit
mklink /D %~dp0\incl\tensorflow_fcn %~dp0\submodules\tensorflow-fcn
mklink /D %~dp0\incl\tensorvision %~dp0\submodules\TensorVision\tensorvision
echo ok
pause
并用管理员身份运行
然后预训练模型下载不下来 ftp://mi.eng.cam.ac.uk/pub/mttt2/models/KittiSeg_pretrained.zip 尝试手动下,用迅雷也没用
打算自己重新训练吧,下载数据放在data里面 ,train.py报错
2018-07-11 13:40:50,993 INFO f: <_io.TextIOWrapper name='hypes/KittiSeg.json' mode='r' encoding='cp936'>
2018-07-11 13:40:50,995 ERROR Data URL for Kitti Data not provided.
2018-07-11 13:40:50,995 ERROR Please visit: http://www.cvlibs.net/download.php?file=data_road.zip
2018-07-11 13:40:50,995 ERROR and request Kitti Download link.
2018-07-11 13:40:50,995 ERROR Enter URL in hypes/kittiSeg.json
尝试 https://github.com/MarvinTeichmann/KittiSeg/issues/134 解决
出现错误 train.py gives tensorflow ValueError: No variables provided
根据https://github.com/MarvinTeichmann/KittiSeg/issues/35
change the line grads_and_vars = zip(clipped_grads, tvars) in optimizer/generic_optimizer.py to grads_and_vars = list(zip(clipped_grads, tvars))
出错 /kitti_seg_input.py", line 355, in start_enqueuing_threads gen.next()
解决方式 还是python2和3不兼容的问题 根据https://github.com/MarvinTeichmann/KittiSeg/issues/69 fork一个3.5的版本
https://github.com/tylercode362/KittiSeg/tree/hotfix/python3.5_support
报错
File "incl\tensorvision\train.py", line 163, in _print_eval_dict
print_str = string.join([nam + ": %.2f" for nam in eval_names],
AttributeError: module 'string' has no attribute 'join'
更改incl\tensorvision\train.py", line 163,
print_str = ",".join([nam + ": %.2f" for nam in eval_names])
train.py 至此可以跑通了。