python识别复杂背景下的二维码

关于二维码生成与识别,网上有很多资料,生成是比较容易的python相关的库也很多,但是识别才是技术难度比较高的,这里指的是复杂背景下的二维码快速识别;所谓复杂背景就是说二维码占画幅比例很小、存在扭曲、变形、模糊,比如随手拍的照片上二维码,这种情况下往往很随意的角度,给二维码识别带来不小困难。这两天查了不少资料也对比了很多开源实现,但没有找到可以媲美微信扫一扫识别效果的方案,不得不说这种成熟的商用产品即便是一个很小的细分功能也是下了不少功夫的。

我也研究了下,这里给出我自己的初步方案。

基于yolov5网络的二维码定位 ===> 二维码提取 ===> 二维码矫正===> 二维码图像增强 ===> pyzbar识别

我面对的场景是像下面这样的图片:


货运单.png

这种图片如果直接用zbar识别的话,不仅耗时较长而且识别率极低;但是如果直接形态学处理干扰又太多,因此这里先用目标检测网络yolov5做定位。

  • yolo的训练这里就不再赘述了,训练数据是从网络上找的各种二维码图片

识别效果很好几乎100%,需要训练数据或者训练好的代码及模型的私信联系我。以下着重介绍定位后的预处理。定位并提取后的二维码如下:


定位并提取后的二维码
  • 尽管已经提取了二维码,但直接用pyzbar识别效果非常差,识别率不到10%,因此考虑对这些图像进行矫正。

以下面这张提取后的二维码为例:


image.png

首先将图像放缩到统一大小,然后识别二维码边界,最后进行仿射变换矫正图像,代码如下:

import cv2
import imutils
from skimage import measure
import numpy as np



image = cv2.imread('image.png')

image = cv2.resize(image, (600, 600))
height, width = image.shape[:2]
#size = (int(width * 0.25), int(height * 0.25))
#shrink = cv2.resize(image, size, interpolation=cv2.INTER_AREA)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
cv2.imwrite('gray.jpg',gray)

ret2, image_binary = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
ret, binary = cv2.threshold(gray, ret2 * 0.85, 255, cv2.THRESH_BINARY)

#ret, binary = cv2.threshold(gray, 135, 255, cv2.THRESH_BINARY)
cv2.imwrite('binary.jpg',binary)
kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (80, 80))
iOpen = cv2.morphologyEx(binary, cv2.MORPH_OPEN, kernel)
iClose = cv2.morphologyEx(iOpen, cv2.MORPH_CLOSE, kernel)
cv2.imwrite('iClose.jpg',iClose)
# cv2.imwrite('tempcolse.jpg',iClose)

img = 255 - iClose

cv2.imwrite('img.jpg',img)



def Get_cnt(edged):
    cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    cnts = cnts[1] if imutils.is_cv3() else cnts[0]
    docCnt = None
    if len(cnts) > 0:
        cnts = sorted(cnts, key=cv2.contourArea, reverse=True)
        for c in cnts:
            peri = cv2.arcLength(c, True)
            approx = cv2.approxPolyDP(c, 0.02 * peri, True)
            if len(approx) == 4:
                docCnt = approx
                break
    return docCnt


def order_points(pts):
    rect = np.zeros((4, 2), dtype="float32")
    s = pts.sum(axis=1)
    rect[0] = pts[np.argmin(s)]
    rect[2] = pts[np.argmax(s)]

    diff = np.diff(pts, axis=1)
    rect[1] = pts[np.argmin(diff)]
    rect[3] = pts[np.argmax(diff)]
    return rect

def four_point_transform(simage, pts,gap=50):
    # print(pts)
    rect = order_points(pts)

    (tl, tr, br, bl) = rect
    tl[0] = tl[0]-gap
    tl[1] = tl[1]-gap

    tr[0] = tr[0]+gap
    tr[1] = tr[1]-gap


    br[0] = br[0]+gap
    br[1] = br[1]+gap

    bl[0] = bl[0]-gap
    bl[1] = bl[1]+gap

    widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))  
    widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))
    maxWidth = max(int(widthA), int(widthB))

    heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))
    heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))
    maxHeight = max(int(heightA), int(heightB))

    dst = np.array([
        [0, 0],
        [maxWidth - 1, 0],
        [maxWidth - 1, maxHeight - 1],
        [0, maxHeight - 1]], dtype="float32")

    M = cv2.getPerspectiveTransform(rect, dst)
    warped = cv2.warpPerspective(image, M, (maxWidth, maxHeight))
    warped = cv2.copyMakeBorder(warped,50,50,50,50, cv2.BORDER_CONSTANT,value=[255,255,255])
    return warped



#69,64   555,551
#sx,sy = _black_edges(img)
#print(sx,sy)

ss = Get_cnt(img)
print(ss)

warped = four_point_transform(image,ss.reshape(4, 2),gap=35)#这个gap阈值控制下仿射变换的余量,避免有些二维码变换后识别不出来

cv2.imwrite('warped.jpg',warped)

warped.jpg
  • 接下来,就是对二维码做增强然后调用pyzbar做识别:
import pyzbar.pyzbar as pyzbar
from PIL import Image,ImageEnhance
from pyzbar.pyzbar import ZBarSymbol
import qreader





image2 = 'warped.jpg'

img = Image.open(image2)
#img = img.resize((600,600),Image.ANTIALIAS)
img = ImageEnhance.Brightness(img).enhance(2.0)#增加亮度
#
#img = ImageEnhance.Sharpness(img).enhance(1.5)#锐利化
#
#img = ImageEnhance.Contrast(img).enhance(2.0)#增加对比度
#
img = img.convert('L')#灰度化
img.save('cc.png')


barcodes = pyzbar.decode(img)

print(barcodes)
for barcode in barcodes:
    barcodeData = barcode.data.decode("utf-8")
    print(barcodeData)
cc.png

识别结果如下:
[Decoded(data=b'WMWHSE6:2000041942,', type='QRCODE', rect=Rect(left=73, top=73, width=459, height=453), polygon=[Point(x=73, y=82), Point(x=78, y=526), Point(x=532, y=517), Point(x=521, y=73)])]
WMWHSE6:2000041942,

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 200,527评论 5 470
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,314评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 147,535评论 0 332
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,006评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,961评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,220评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,664评论 3 392
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,351评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,481评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,397评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,443评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,123评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,713评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,801评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,010评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,494评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,075评论 2 341

推荐阅读更多精彩内容