基于图像的OMR技术的实现

姓名:屈彦维

学号:16020610026

引自:http://lw.3edu.net/qrs/lw_46795.html

嵌牛导读:在分析OMR与OCR的应用特点后,提出了基于图像的OMR方式。详细讨论了该方法的硬件设计和工作原理,并在软件处理方面着重介绍了倾斜校正和图像分割。它具有对纸张质量要求低和识别准确度高等特点。

嵌牛鼻子:OMR OCR 信号处理 倾斜校正 图像分割

嵌牛提问:如何进行

嵌牛正文:目前,许多文档是以纸质文档的形式存在,例如银行票据、税务报表、标准化考试中的机读卡、人口普查表、彩标投注单、选票、定货单等。而纸质文档不便于保存、检索、统计和修改。将这些信息录入计算机是一件非常繁琐的事情。长期以来人们通过键盘手工输入,不但费时费力且容易出错。在实时性要求较高的场合(如选举中的统计选票)自动、快速、准确地处理文档显得尤为重要。因此,对这些文档进行计算机自动录入具有重要的实现意义。

计算机自动录入是解决这个同瓶颈的关键所在。其中,光学字符识别OCR(Optical Character Recognition)和光学标记识别OMR(Optical Mark Recognition)是解决信号自动录入的有效方法。它们利用光学方法将信息录入到计算机并进行识别处理,能极大地提高数据信息的采集速度,便于计算机存储、管理与检索。

1 OCR与OMR

(1)OCR的工作原理

OCR首先将要识别的文字和图像扫描进计算机,然后进行图像的预处理,再抽取字符特片进行识别,转变为计算机能够识别的字符信息。图像预处理包括去除噪声、歪斜校画龙点睛、图像分割、平滑及规范化等。其中图像分割是一个重要的步骤,它的作用是将要识别的单个字符的图像找到并分割出来。OCR技术主要应用于文字图像识别及处理,例如用于印刷体和限制手写体字符的识别。OCR技术已成为大规模数据录入的首选方案,它将随着计算机技术的发展而更加成熟。

(2)OMR的工作原理

OMR识别“涂点”上有无标记两种状态。“涂点”就是信息卡上可以涂写标记的地址。“涂点”所代表的含义可以事先定义,可以代表一个阿拉伯数字,也可以表示一个英文字母或符号。OMR技术快速简单,识别率高且成本低,广泛应用于标准化考虑自动阅卷、各类调查问卷的统计、选举结果的统计等,是自动识别领域中应用较多的一种方法。

2 基于图像的OMR技术

目前OMR一般采用光电对管阅读技术。识别用的器件是半导体发光管及光敏管。发光管是光源器件,由它发出的光照射到“涂点”上。光敏管是接收器件,接收来自“涂点”位置的反射光。因为涂有标记的地方反光弱,未涂标记的地方反光强,所以光敏管接收到的光信号强度不同。不同强度的光信号可以代表有无标记两种状态。将“涂点”位置处的发光管和光敏这组成一只电眼,可识别一个涂点。若干个电眼排列起来组成光电头可完成对一排涂点的识别。

该方法实现应用中有如下限制:信息卡上的“涂点”要与电眼完全对齐,即信息卡在录入时不能倾斜;信息卡不能折皱;纸张质量、印刷技术要求高;填写标记要规范,否则就要影响识别结果。实际应用中,信息卡在录入时由于走纸机构机械误差而略有倾斜,会造成识别出错。

OCR由于采用了图像处理技术,信息卡在录入时的倾斜能自动校正,保证录入的高精度,也能处理略有折皱的信息卡。因此,OCR对所用纸张的质量、印刷技术要求不高,降低了运行成本。同时可以保留填写的原始图像备查,进行复核或重新识别。

在借鉴OCR优点的基础上,笔者在课题《彩标阅读及识别系统》中采用了基于图像的OMR技术。所谓基于图像的OMR技术,就是将信息卡经光电变换,形成二值化图像;再经歪斜校正、图像分割,对分割出的小块图像(含“涂点”)中的黑点数进行计数。若大于某个阈值,就认为有标记,否则就没有标记,从而完成了标记识别。相对OCR而言,它省去了最耗时的字符特征抽取步骤。

3 硬件组成

本系统框图如图1所示。

(1)图像传感器

采用国产的CIS(Contact Image Sensor)图像传感器,其光学分辨率比CCD略低,但是其驱动电路、光学系统和机械结构却比CCD简单。光学系统中采用特殊光源实现光学滤波,消除或减轻了信息卡背景信息对分割、识别的影响。工作时,由CPLD(Complex Programable Logic Device)产生一个周期性的同步脉冲SYN引导每次扫描,时钟信号CLK在移动寄存器的作用下,对CIS内的像元依次进行扫描,像元上的光电信号串行输出。

(2)走纸控制

输入的信息卡通过光学系统成像在图像传感器的光敏面上,在CPLD器件产生的扫描信号的驱动下,图像传感器对信息卡进行横向自扫描;步进电机驱动输纸机构使信息卡纵向运行,从而实现了信息卡的二维扫描。

(3)模拟信号处理

模拟信号处理要考虑信息卡颜色的深浅、字迹的轻重和光强均匀度的变化等引起的脉冲幅度的变化。在光电变换中,对信号幅值影响较大的是:光束照射在光敏面上,光强的不均匀性及波动影响表现为白电平浮动对比度的变化也会引起信号幅值的较大起伏。处理的好坏直接影响到采集图像的质量。其过程为:CIS图像传感器摄取的原始图像信号,经放大、采样保持及滤波、对消、浮动阈值及二值化等一系列处理,消除或减轻了信息卡背景明暗变化、光源变化、开关噪声、高低频干扰等对系统的影响,获得高质量的二值化信号。

(4)数字信号处理

采用A、B两块大容量的SRAM轮流工作在读或写状态。合并二值化的信号,同时为了加快数据采集的速度,每次将16位的串行信号转换为2个字节的并行数据。在标志寄存器的控制下,将信号暂时写入A中,同时计算机通过16位ISA总线从B中取数据。在下一周期,二值化信号写入B中,计算机通过16位ISA总线从A中取数据。这样就保证数据传输的高效性。

(5)逻辑控制

整个系统的逻辑控制采用Lattice公司的CPLD——L1032,它负责控制轮纸机构、图像传感器、两块SRAM的轮换;并随时检测系统的工作状态,协调各部分的工作;并将检测到的状态即时送给计算机,便于计算机对整个系统的管理。

4 软件处理

在大数据量的文档处理中,为了满足快速高效地处理,文档必须针对OCR技术或OMR技术进行专门设计。这样才适合光电阅读。在信息卡上设计定位标记块是一种有效手段。它分为水平定位标记块和垂直定位标记块,并且按照与填写的字符相同的颜色(黑色)来印刷。一个水平定位标记块表示一个字符行,垂直定位标记表示一个字符列。标记填写在以字符行列交叉点为中心的矩形区域。定位标记块主要用于字符定位和信息卡图像的倾斜校正,如图2所示。

另一种有效手段就是常常对信息卡学习,获得相应的先验知识,如信息卡的行数、列数、标记出现的主要区域、表格类型、每个黑色定位标记块的大致位置等。由于对同一批表格而言这些参数都是相同的,在对后续表格的处理中就可利用这些参数指导图像的分割和识别,从而提高了整批表格的处理效率。

硬件系统对信息卡进行扫描信号处理后,得到二值化的图像信号,但是二值化的图像信号中标记所代表的数字信息才是最终结果。为此,还要对二值化的图像信号在PC机上利用软件进行噪声处理、倾斜校正、分割及识别处理,得到感兴趣的识别结果。最后再将识别结果进行输出显示。在基于图像的OMR技术中,倾斜校正和图像分割是最关键的。

(1)倾斜校正

由于输纸机构有走纸不均匀的情况,信息卡图像不可避免地会产生一定的倾斜。因此必须对倾斜的图像进行旋转,旋转到正常位置,才便于图像分割。

信息卡学习,获得正常图像的定位标记块的位置。将倾斜图像沿X,Y轴方向投影,所有的水平定位标记块和垂直定位标记块会分别在投影图上产生对应的峰,从而可以确定水平定位标记块和垂直定位标记块的位置。根据正常图像和倾斜图像的定位标记块的位置,就可以计算出旋转角δ。

将倾斜图像f(x,y)绕坐标原点O(0,0)旋转一个角度-δ,图像的原始坐标为(x,y),旋转后的坐标为(x',y'),按式(1)旋转变换,旋转后的图像为(x',y')。

(2)图像分割

根据上述投影法,可以获得水平定位标记块和垂直定位标记块的位置,并得到交叉点的位置。由于标记填写在以字符行列交叉点为中心的矩形区域,并且设矩形区域长为X列,宽为Y行,以此交叉点向左向右各扩展(X+4)/2列,向上向下各扩展(Y+4)/2行形成一分割框,即矩形区域完全包含在该分割框内。逐行以分割框为单位对整个图像进行分割,并统计各分割框内的黑点数。若大于某个阈值,就认为有标记;否则就没有标记。再结合各标记事先定义的含义,得到识别结果。

基于图像的OMR技术采用图像传感器作为扫描部件,将信息卡的完整图像读入微机,并进行图像识别。它克服了采用光电对管阅读的OMR方式的缺点,同时它具有如下优点:

·识别精度高;

·纸张质量、印刷技术要求低,可以处理略有折皱的信息卡;

·调整表格灵活,可适应多种信息卡;

·采用了计算机图像处理技术,可保存信息卡的原始图像备查,提高了系统的安全性、可靠性和防伪性。

基于图像的OMR技术提高了信息卡处理准确率,应用在彩票阅读及识别系统课题中取得了良好的效果。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容

  • 这些年计算机视觉识别和搜索这个领域非常热闹,后期出现了很多的创业公司,大公司也在这方面也花了很多力气在做。做视觉搜...
    方弟阅读 6,436评论 6 24
  • 不同图像灰度不同,边界处一般会有明显的边缘,利用此特征可以分割图像。需要说明的是:边缘和物体间的边界并不等同,边缘...
    大川无敌阅读 13,815评论 0 29
  • 图像识别意义: 图像是指物体的描述信息,数字图像是一个物体的数字表示。视觉是人类感知外部世界的最重要手段,据统计,...
    木木口丁阅读 8,399评论 1 21
  • 作者所在班级1402012 作 者 姓 名符子龙 作 者 学 号14020120006 《基于深度学习的视网膜OC...
    Jerooooome阅读 5,552评论 0 2
  • Python 应用-主要是自己用到过的方面 1.网络爬虫:scrapy,爬取数据,入库(sqlite3) 2.数据...
    程序员进阶阅读 226评论 0 1