丽水化工机械网

当前的位置是:主页 >> 化工机械厂家

OCR识别的处理技术流程

时间:2022-04-28 来源网站:丽水化工机械网

OCR识别的处理技术流程

一个OCR识别系统,其目的很简单,只是要把影像作一个转换,使影像内的图形继续保存,若有表格,则将表格内资料及影像内的文字一律变成计算机文字,使能达到影像资料的储存量减少,识别出的文字可再使用及分析,当然也可节省因键盘输人的人力与时间。

要想实现这一目的,可以对比人识别文字的过程:

首先,如果我们阅读一篇用并非自己知道的语言所写的文章,我们能大概地分辨不同的字母,但却不能理解其意义。然而,对于这样的文章,我们通常能够理解其中的数字符号。因为它们是我们所广泛使用的。同样的道理可以解释为什么许多OCR系统只能辨认数字,而只能相对较少地辨认数字与字母的组合字。

其次,在字母与数字中有许多相似的地方,比如,在识读到字母与数字的组合字的时候,你几乎很难分辨出字母“O”与数字“0”的 差别。作为人类,我们是可以通过阅读句子和段落来了解其精确的意思。但对于机器设备来说,这个过程实在是太困难了。

最后,我们要依靠对照来帮助分辨字符。对于那些出现在很黑的底板或其他字词和图画上的字符,我们很难阅读。同样的道理,设计一套能够理解所需要的数据而舍弃无用信息的字符识别系统也是一项艰难的任务。

OCR的处理流程如下:

首先将标的物的影像输人,然后经过影像前处理、文字特征抽取、比对识别等过程,最后经人工校正将认错的文字更正,将结果输出。详细如下:

影像输入

要想进行OCR处理,必须先通过光学仪器,如影像扫描仪、传真机或任何摄影器械,将影像转人计算机。随着科技的进步,扫描仪等输人装置已制作得愈来愈精致,轻薄短小,品质也高,对OCR有相当大的帮助。扫描仪分辨率的提高使影像更清晰,扫描速度的加快提高了OCR处理的效率

影像前处理

影像前处理是OCR系统中需解决问题最多的一个模块。从得到一个不是黑就是白的二值化影像或灰阶、彩色的影像,到分离出一个个的文字影像的过程,都属于影像前处理。它包含了影像正规化、去除噪声、影像矫正等的影像处理,以及图文分析、文字行与字分离的文件前处理。影像处理的原理及技术都已成熟,在网站上有不少可用的链接库;在文件前处理方面,则凭各家本领了;影像需先将图片、表格及文字区域分离出来,甚至可将文章的编排方向、文章的提纲及内容主体区分开,而文字的大小及文字的字体也可如原始文件一样地判断出来。值得一提的是如何将独立文字从文字行抽取出来。中文字特别的地方在于它有部首的观念。因此,不只是上下的合成,左右合成的字也特别多,且有可能是两部分(如“利”、“明”等),也有三部分的(如“捌”、“晰”等)合成。当这些字与英文或数字同时存在且紧靠在一起时,判断如何连接或切出,是相当困难的。对排版整齐的印刷文件都无法百分之百解决,更何况是每个人写字习性都不同的手写文件。也因此,手写的OCR产品走向是特殊且有限制的。

文字特征抽取

单以识别率而言,特征抽取可说是OCR的核心,用什么特征,怎么抽取,直接影响识别的好坏,所以在OCR研究初期,特征抽取的研究报告特别多。而“特征”可说是识别的筹码,可简易的区分两类。一类为统计的特征。例如文字区域内的黑/白点数比,当文字区分成好几个区域时,这一个个区域黑/白点数比之联合,就成了空间的一个数值向量。在对比时,基本的数学理论就足以应付了。而另一类特征为结构的特征。例如文字影像细线化后,取得字的笔画端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法进行比对,市面上的线上手写输人软件的识别方法多以此种结构的方法为主。

(待续)

声明:

本文来源于网络版权归原作者所有,仅供大家共同分享学习,如作者认为涉及侵权,请与我们联系,我们核实后立即删除。

银耳子面膜

小银管眼线液笔

银耳子面膜