【调研】车牌(生成)+检测+识别

车牌(生成)、检测与识别【调研】

@zhongying.ru


背景

车牌识别是自动驾驶和计算机视觉共有的一般任务。要训练高性能的车牌识别模型,必须用尽可能多的图片训练。但是,收集真实车牌会花费大量资源且涉及隐私。一种直接的解决方案是使用简单的脚本按照正则表达式生成车牌号并绘制。然而这样得到的车牌图片都是干净的、高质量的。在这些图片上训练出的模型无法处理现实世界丰富的噪声。当然,可以添加高斯噪声,并对图像进行一些转换。但是,这样生成的图像不一定服从现实噪声的分布。需要生成逼真的图片(给生成的图片加真实噪声),扩充车牌识别的训练数据,以求更好的线上精度。

车牌生成相关技术

Conditional GAN

原始的GAN随机地生成判别器难辨真假的图片,Conditional GAN则是增加了条件信息,来控制生成的图片。
具体地,在生成器和判别器的输入中增加条件y,生成器生成的图片只有足够真实且与条件相符,才能够通过判别器。
条件y的具体内容可以是类别标签、文字、图片等各种形式,因而延伸出文生图图生图语音增强视频生成等各种应用。

Image Domain Translation

1. Paired Two Domains (训练样本需是成对的)

2. Unpaired Two Domains (不需要成对的训练样本)

车牌生成开源项目

模型 优、缺点
license-plate-generator中文车牌生成 透视变换/ HSV变化/ 高斯噪声/ 添加污渍 噪声是人工定义的
Generate-LicensePlate-with-GAN Pix2Pix 需要成对的训练样本(outline图片→车牌照片), 训练中输入的outline图片是从车牌照片抽出的,生成时输入的outline图片从合成图片抽出。
CarLicensePlatesGenerator [paper] CycleGAN 用CycleGAN对合成车牌图片进行风格迁移并贴到背景图上

可结合传统方法和GAN,如可对合成图片进行透视变换等再抽出outline图片作为输入,或者对GAN的输出再进行透视变换、添加污渍、运动模糊等。

其他:

车牌数据集

  • CCPD2019】【检测+识别】
    停车场数据集,30万张手机拍摄的完整照片。仅有蓝牌,车牌的车牌省份主要为皖
    每张图像都是手机拍摄的静止车辆。文件名就是该图像的数据标注,含4顶点位置、倾斜角、亮度、模糊度和车牌号。

    CCPD图片名称含义

    每张图像的分辨率为720(宽)× 1160(高)× 3(通道)。包含以下分类:基础、旋转、远近、脏污、雨雪天雾天。


    现有模型在该数据集各子集上的指标:

    Detection

    指标为precision。

    Model FPS AP DB Blur FN Rotate Tilt Challenge
    Faster-RCNN 11 84.98 66.73 81.59 76.45 94.42 88.19 89.82
    SSD300 25 86.99 72.90 87.06 74.84 96.53 91.86 90.06
    SSD512 12 87.83 69.99 84.23 80.65 96.50 91.26 92.14
    YOLOv3-320 52 87.23 71.34 82.19 82.44 96.69 89.17 91.46
    Recognition

    ACC计算为车牌正确率,而非字符正确率。AP为所有测试样本上的precision,随后为各子集[ DB(ccpd_db/), Blur(ccpd_blur), FN(ccpd_fn), Rotate(ccpd_rotate), Tilt(ccpd_tilt), Challenge(ccpd_challenge) ]上的ACC。

    Model FPS AP DB Blur FN Rotate Tilt Challenge
    SSD512+HC 11 43.42 34.47 25.83 45.24 52.82 52.04 44.62
  • CCPD2020】【检测+识别】
    11766张(train:val:test = 5769:1001:5006)完整照片,均为新能源车牌(绿牌)。

  • 百度Paddle车牌数据集】【识别】
    11万张图片,图像仅包含车牌部分,文件名为车牌号。

  • 【CRPD (Chinese Road Plate Dataset)】【检测+识别】
    https://github.com/yxgong0/CRPD
    完整照片3万张,标注了车牌的4顶点位置和车牌号,其中7500张包含不止一辆车。
    车牌种类包括:单行车牌、双行车牌、教练车、警车、货车等。
    场景包括:静止、运动、转弯、远处。

  • GAN合成的330K张中国车牌】【识别】
    https://github.com/SunlifeV/CBLPRD-330k
    高质量、平衡的数据集,其中包含330,000张图像,含各种类型的中国车牌(蓝牌、绿牌、拼接牌、黑牌等)。该数据集是使用GAN生成的,可确保出色的图像质量和不同车牌类型的平衡分布。该数据集非常适合训练和评估车牌识别模型。

  • 其他小型数据集【检测+识别】
    EasyPR(200+)、ChineseLP(400+)、CLPD(1200)均为完整图片。

Todo:车牌检测与识别

PaddleOCR轻量级车牌识别】:以CCPD2020(新能源车)中5000+张图片为训练数据, 含检测识别

  • todo:数据量足够,调研端到端方法、两阶段SOTA。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,189评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,577评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,857评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,703评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,705评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,620评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,995评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,656评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,898评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,639评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,720评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,395评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,982评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,953评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,195评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,907评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,472评论 2 342

推荐阅读更多精彩内容