卫星地图中的建筑物分割

地图图像识别的目标

地图图像识别的目标是在卫星图片上标注出建筑物轮廓。是一个图像语义分割问题(Semantic Segmentation). 但是分割目标与其它大型比赛, 如微软的COCO Challenge, 谷歌的Google AI Open Images比赛相比, 物体类别单一, 且图片质量均匀.

如图所示, 是一组人工标注完善的卫星图片, Mask和建筑物匹配度高. 这张图来自Crowdai 上的比赛 Mapping Challenge

卫星图像标注示例

Crowdai已经下线, 我下载了Map Challenge 比赛的数据集. 包括Train, Validation 和Test. Test 没有标注. Train 和Validation的标注是COCO 标注格式. 百度云的下载链接在这里:https://pan.baidu.com/s/1wm4WtOLGiknaqAJSrlzufA 密码:xho2

地图图像识别数据集准备

生成训练样本

目前在完成项目期间, 所使用的训练数据来源都不是人工直接标注出的卫星图像. 而是有一个由人工打上地理标记的图层文件(shapefile格式, GIS领域的标准数据格式), 以及从Google Map上抓取到的对应地区的卫星图片.

为了构建训练数据, 需要完成的第一件事, 是将图层文件中的标记(经纬度坐标), 映射到Google Map卫星图片上(以图片左上角为原点, 向右为X轴, 向下为Y轴).

所使用的方法, 是Google Map JavaScript API的转换方式, 用Python语言重写实现.

标注数据的格式

生成的数据集都是COCO风格的标注数据. COCO标注数据的具体规范, 可以参考https://github.com/cocodataset/cocoapi这个Github repo里的示例代码. 在Windows 安装Pycocotools的话, 可以参考 https://github.com/philferriere/cocoapi

训练数据的问题

目前生成的训练数据中, 标注与真实房屋的位置, 很多图像上有大约10-20个像素的偏差(图片大小300 x 300), 也有不少标注大于房屋实际面积的情况. 我们甚至发现标注面积实际为房屋面积的2倍以上. 这就导致如果精准分割出房屋, 使用IoU>0.5作为阈值过滤掉不合格预测结果, 再计算准确率的话, 很多实际上完美分割的结果, 会被认为是无效的. 我自己制作的示例图如下(非项目中真实使用的图片):

  1. 红色边框较蓝色房屋, 大小相似, 但是位置偏移;
  2. 黄色边框将绿色的建筑物全部囊括, 但是面积要大很多, 此时如果完美分割绿色建筑物, IoU很可能由于小于0.5而无效
训练样本中的问题

深度神经网络模型

1. ResNet + U-Net

Crowdai 上举办了Open Map Challenge, 其所解决的问题和这个问题相近, 排名第一的队伍, 是Neptume.ml公司. Github Repo地址为:

https://github.com/neptune-ml/open-solution-mapping-challenge

其所使用的模型. 是ResNet 101 和U-Net的组合. 使用预训练的ResNet101 对图像进行特征提取. 再使用U-Net进行图像分割.

模型的损失函数由两部分组成

loss = binary_cross_entropy * weight1 + dice_loss * weight2

其中, Binary Cross Entropy是计算预测值与实际标注每一个像素的异同. Dice Loss是用IoU的思想计算预测值与实际标注的偏差. 两种Loss值的权重, 是需要人为设定的超参数. 根据Github中的描述, 模型训练前期, 需要更多考虑Binary Cross Entropy损失值.

2. Mask R CNN

比赛的主办方, 给出的Baselline模型是Mask R CNN模型:

https://github.com/crowdAI/crowdai-mapping-challenge-mask-rcnn

相较比赛第一名使用的RestNet + U-Net的方式, Mask R CNN模型太重型了, 这个模型一般用于解决复杂场景下的图像分类, 物体检测和语义分割问题.

目前尚没有开始尝试在项目中使用这个模型.

面临的问题

目前面临的问题, 是生成的训练集质量较低, 导致肉眼评估模型, 觉得模型表现尚可, 但是使用程序比较预测结果的查全率, 查准率(IoU >= 0.5), 结果很糟.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,053评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,527评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,779评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,685评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,699评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,609评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,989评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,654评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,890评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,634评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,716评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,394评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,976评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,950评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,191评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,849评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,458评论 2 342