Colab平台使用(GPU、挂载、tf版本、运行py脚本、设置点击脚本)

划重点:选择GPU、挂载谷歌云端、选择tf版本、运行py脚本、设置点击不断连脚本

针对yolo模型的训练

1. 谷歌云端上传项目

a. 打开谷歌云端,类似百度网盘
b. 上传本地的项目到云端

2. 创建colab笔记本

a. 进入想保存Notebook的文件夹中,左上角新建-更多-Google Colaboratory,如果没有该选项,可点击关联更多应用,找到Google Colaboratory即可

b. 接下来进入colab笔记本,点击修改-笔记本设置

c. 选择硬件加速器-GPU,保存

d. 点击右上角连接,即连接colab GPU服务器。Colab 中的可用 GPU 通常包括 Nvidia K80、T4、P4 和 P100,具体参考Colab 提供哪些类型的 GPU?

3. 挂载谷歌云端

a. 点击装载Google云端硬盘,会直接连接云端,或者出现第二种情况

b. 第二种情况:出现以下代码,shift+enter运行,点击出现的网址,选择账户+允许,直到出现一串符号,复制到2所示框内,enter回车即连接上谷歌云端硬盘

c. 已连接上我的谷歌云端,上面有刚刚上传的项目

4. 设置好模型等数据加载、保存的路径

a. 可以双击需要运行的py文件,比如train.py。看看里面要加载和要保存的路径是否为相对路径
b. 要保存的模型文件直接保存在谷歌云端里,这样不仅可以在colab界面右击文件下载,还可以永久保存在谷歌云端,到时候在云端下载即可,也避免colab可能断连导致文件没来得及保存的情况

5. 开始训练

a. 查看tensorfow版本:

!pip list | grep tensorflow

一般默认是tensorflow2.2.0版本。

b. 转换到tensorflow1.15.2。如需转换到tensorflow1.x,可以使用如下代码(谷歌官方:尽量不要使用pip install来指定tensorflow版本,colab内置的tensorflow是对谷歌服务器专门优化过的,比pip安装的版本表现更好):

%tensorflow_version 1.x

如果之前import过tensorfow包,需要重新加载笔记本,会有提示,再运行上行代码即可
c. 右键需要运行的项目文件名,复制路径

cd 到该目录下

cd /content/drive/My Drive/HI/tensorflow-yolov3

使用!python运行训练脚本

!python train.py

有时候第一个epoch非常慢,我这里P100 16G的GPU要1h左右,后面稳定在10min/epoch的速度,可能是服务器那边的机制,不要担心,先运行着。

6. 设置定时点击脚本

长时间不动colab,可能会出现断开连接的情况,这个时候程序就停了!虽然还保存了已经训练得到的模型,但还是没训练完。所以设置一个定时点击页面的脚本

a. 在网页按F12,进入调试页面-consolo控制台
b. 输入下面的代码,enter回车即可

function ClickConnect(){
    console.log("Clicked on connect button"); 
    document.querySelector("paper-button").click()
}
setInterval(ClickConnect,60000)


若想要停止该脚本,使用下面的命令;或者刷新浏览器,colab不会断开。

delete ClickConnect(id_of_ClickConnect)
# id_of_ClickConnect是执行 setInterval() 时返回的 ID 值
# 如下图,ID为5588

至此,yolo的训练开始,耐心等待吧。

注意事项

  1. pro版:$9.99/月(需美国信用卡)。更好的显卡(P100 16G等)、更稳定的连接性能、更长的连接时间(24小时)。
    支持的信用卡类型
  2. 谷歌云端硬盘购买存储空间:$19.99/年(需美国信用卡),100GB。免费的15GB用于存储模型可能不够用。
  3. yolo训练时刷新页面不会断开,会自动连上,处理一些异常情况;但长时间断开就回不去了
  4. colab没有终端,所以暂时没找到显示显存使用率的方法。
  5. 可以打开多个colab笔记本,它们连接不同的服务器,互不相关,最多连接数还没有验证。
  6. colab笔记本如果pip安装过第三方包,下次再打开不需要再pip了,除非点击工具栏代码执行程序-将运行时恢复出厂设置
  7. colab使用tensorboard:参考colab使用TensorBoard
%load_ext tensorboard
%tensorboard --logdir /content/drive/My\ Drive/HI/tensorflow-yolov3/data/log

注意:路径中的空格前用转义符“\”
torch使用tensorboard,导入包→创建writer,可根据时间设置文件名→writer.add_...,flush→所有epoch完成,close。参考Pytorch的TensorBoard可视化-腾讯云

  1. colab查看显卡配置和驱动情况
!/opt/bin/nvidia-smi
  1. colab里读取路径的分隔符一般使用Linux分隔符:“/”,而不是“\”

常见错误

  1. Buffered data was truncated after reaching the output size limit:模型训练输出每个epoch结果时输出的错误。即使在COLAB上的RAM、GPU、磁盘是空闲的,这个错误仍然发生是因为在COLAB上显示单元格输出的内存有限。但是,机器仍在后台运行,可以从log看到训练信息,由于缓冲的限制它不会显示在界面。一种解决方案是使用verbose=0,而不是1。
  2. 报错:shell-init: error retrieving current directory: getcwd: cannot access parent directories: Transport endpoint is not connected。需要重新启动代码执行程序,注意本地变量都会丢失,参考colab suddenly unable to navigate through directories

参考博客

增大内存、防止断连……Google Colab,你还有什么惊喜我不知道?
How to prevent Google Colab from disconnecting?(可查看最新的页面点击脚本)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,921评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,635评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,393评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,836评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,833评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,685评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,043评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,694评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,671评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,670评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,779评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,424评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,027评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,984评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,214评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,108评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,517评论 2 343