哎,生命在于折腾。。。
新加一块儿ssd,单独用来装linux系统,几天来专门装这个环境,反复装有几十回,终于把环境装个靠谱能的训练的环境出来。不记录一下对不起这些天的辛苦。
两个大方面:
一、装linux系统
装linux系统碰到如下几个问题:
1、bios设置如何配置
主板是华硕Z390P,此主板很不靠谱,不推荐使用。
此主板官网文档不支持linux系统,但是通过一些方法可以安装ubuntu18.04或ubuntu19.04。centos8不能安装,唉。
其中一个关碍就是bios配置,就z390p这块板子,要改csm兼容模式,disable=>enable,相对于默认设置仅此一处更改,千万别乱改,什么快速启动之类的都不用改。
2、ssd配置
ssd是nvme协议的,本身linux支持起来就不太正常,需要做如下处理:
分三个区:
- 先分一个1G的出来,刷成fat32格式,不选挂在,安装系统时默认装引导(此分区极其重要,必不可少)
- 再分一个60G左右的空间,ext4文件格式,挂在为/
- 剩下空间一个区,ext4文件格式,挂在为/home
3、安装ubuntu时配置
拔网线!按界面操作步骤该设什么设什么,一定要拔网线。
4、进了系统后,拔这个界面全部取消选定
这个界面取消设备的专有驱动选定
然后再连接网线!
然后再连接网线!!
然后再连接网线!!!
二、装tensorflow2.0.0的环境
这部分有三个需要注意:
1.tensorflow只支持到cuda10.0
所以cuda要安装10.0版本,默认下载的是10.2,直接百度cuda10.0去下载
2.cudnn版本要与cuda版本匹配
3.nvidia显卡驱动可以版本高些,比如我安装的就是nvidia-driver-440版本
这部分详细配置可以在简书中搜索这些关键字:ubuntu18 cuda 10.0 cdnn tensorflow
其他就不赘述了
唉,这个正确的方式是一遍一遍穷举出来的成果,都是泪
下一篇,将会把第二篇中的模型用tensorflow2.0.0API重写一遍,体会一下两个版本api的区别,检测一下性能提升,当前性能18s训练100step,captcha模型训练出来需要10-12小时,不知2.0能提升多少。