帮帮文库

返回

基于Tesseract开源OCR引擎的类身份证对象识别v1.1 基于Tesseract开源OCR引擎的类身份证对象识别v1.1

格式:word 上传:2022-06-24 19:26:24

《基于Tesseract开源OCR引擎的类身份证对象识别v1.1》修改意见稿

1、“.....二代身份证,机动车驾驶证,汽车行驶证,名片等等类似的用于证明身份的证件。身份证件识别是光学字符识别,技术的个应用分支。对的研究始于上世纪早期,由德国科学家首先提出并申请了专利,但这个研究也仅仅停留在理论层面上。随着电子计算机的诞生,才得以真正将技术实现,此后这项技术得以快速的发展并逐渐发展到实际应用阶段。目前,对该技术的功能已经趋于完善,对印刷体类的字符识别已发展的比较成熟,已有不少商业应用案例。国内来说,虽然该技术的研究从上世纪七十年代起才兴起,但发展迅速,尤其是针对中文字符的识别技术达到或超过了世界领先水平。随着技术的不断成熟,如何将这项技术更多的应用到我们的生活中成为项研究热点。在当前移动互联网快速发展的大环境下,使用手机管理身份证件信息成为个比较热门而有价值的应用方向,将技术嵌入这类应用中,就能够实现自动识别证件信息,解决了身份证件录入复杂,管理不便的问题,从细微处解决了商务社交中的个非常头疼的问题。目前证件字符的识别已成为个研究的热门分支......”

2、“.....但是将其与身份证件管理相结合却是近年来才兴起的。直到年才由汉王科技推出了首个中文身份证件识别系统,此后随着中文技术的发展,该系统也通过不断地更新以提高识别能力及应用功能。在移动互联网时代,使用手机管理身份证件变成种非常方便的移动应用场景,很多研发系统的公司都看到了其中的商机并先后推出自己的身份证件识别系统,身份证件识别领域呈现百花齐放的状态。直接拍摄身份证件,自动识别身份证件信息并保存到通讯录中,用户不再需要保存大量纸质身份证件即可轻松管理收到的大量身份证件。基于这个应用场景,近几年国内出现了以汉王身份证件通身份证件全能王为代表的手机身份证件管理,他们集成了身份证件自动识别和身份证件管理功能,兼容多种语言的身份证件识别,可以将识别的身份证件直接导入到手机通讯录,极大的方便了商务名片的手机及整理工作。同时,名片识别系统的应用也并不局限在手机终端完成,也可以服务器端完成。在当前基于微信的公共平台应用越来越广泛的条件下......”

3、“.....这些应用主要是向服务器发送名片识别的请求,服务器端完成识别工作后返回电子名片,进而保存并管理电子名片。这样的应用主要是开发服务器端的系统而无需手机,降低了应用的成本,也能够将接口有偿提供给第三方使用,方便其他公司在自己的应用中接入名片识别功能。本文工作内容总结本文的主要工作是利用相关技术和方法开发了个基于开源的引擎的开放接口的身份证件识别系统,以下是实现这个系统所做的研究工作采用开源的技术,对识别的身份证件图片进行预处理。首先对预处理需要所需的步骤进行了分析,逐介绍了这几个步骤的处理方法。首先说明了图片的灰度化及二值化过程及方法,然后介绍了使用形态学的方法进行图像去噪的过程,最后使用了种顶点链编码的方法对二值化后的图像进行倾斜校正。研究使用引擎进行字符识别的方法,为了提高对于中英文混合身份证件的文字识别率,对系统中所使用的中英文字库进行训练。研究使用引擎识别出字符后,根据身份证件的语义特征,如何准确的确定身份证件中的字符语义并进行分类。第章主要阐述身份证件识别的背景及意义......”

4、“.....通过对当前身份证件识别基本模型的概要分析和对字符识别引擎的简要介绍,引出了本文的主要研究工作和内容安排。第二章给出了在基于微信的应用场景下的系统整体设计方案,并介绍了该系统详尽的环境搭建步骤,同时对该系统的扩展进行了规划。第三章介绍了身份证件图像的预处理。身份证件图像的预处理过程包括对彩色图像的灰度化以及灰度图像的二值化选用合适的二值化方法,基于数字形态学的身份证件图像去噪处理,倾斜身份证件图像的矫正。第四章利用引擎识别经过预处理的身份证件图片,测试利的灰度值,然后依次取邻域循环上述处理方式,由此构成新的图像,。取邻域中所有像素灰度值的平均值作为邻域中心的像素灰度值倾斜校正文档图像在不同程度上均会产生倾斜,本文的面图像产生倾斜主要有两种情况,种就是在印刷过程中导致的倾斜,从而在扫描时必然会发生倾斜,另种就是由于拍摄时的不当而造成的倾斜。卷版面图像可能不是横平竖直的,而存在定的倾斜角度,尤其对于很小的倾斜角度,在图像录入过程中,是无法避免的......”

5、“.....对后面的版面分割理解的影响不是很大,可以不考虑。般来说,大多数的版面分割方法,在进行分割之前都要进行倾斜校正。常见的倾斜校正方法有投影法,近邻聚集法,变换法。投影校正采用投影迭代的方式计算出倾斜角度,即将文档图像分成若干水平条,分别计算局部角度,然后再进行分析比较,得到整个文档的倾斜角度的方法。此方法存在它的局限性,所能处理的文档的倾斜角度般在超过这个角度的文档图像是不适用此算法的。投影校正算法的基本步骤为采用水平投影方式,统计各行的目标像素的数目并记录预设几个角度,分别进行水平投影,记录对应的投影值对预设的几个角度得到的相应行的投影值进行对比,寻找其中投影值最大的,记录此时的角度作为整个文档的倾斜角度。近邻法近邻法作为新的检测倾斜角度的算法,它主要针对连通区域进行操作。该算法主要的算法步骤分以下几步遍历图像,进行连通区域的搜索根据提供的文档图像的个区域,确定该区域的连通区域对得到的连通区域进行筛选,选择相邻的连通区域,并计算出这些连通区域的中心点通过这些区域的中心点的连线......”

6、“.....得到整幅文档图像的倾斜角度。该算法主要适用于文档结构相对比较简单的文档图像,算法的主要工作都集中在连通区域的搜索和操作上。由于幅图像的连通区域数较多,从而导致算法计算复杂度较大,这是算法的主要缺点。它与其他算法的不同在于它基本不受文档图像的倾斜角度适用,可以处理任何倾斜。变换变换在进行图像分析的算法中使用的频率比较高,是比较经典的工具。它基于霍夫变换原理来进行相关的计算,首先进行空间变换,将图像的像素点等信息通过公式变换到指定的参数空间,再统计参数空间中相应的参数的出现频率,从而确定文档图像的倾斜角度。用变换求出四边直线的方程,从而确定文档的倾斜角度,将图像旋转,此时认为图像是正的。变换的优点在于它对噪声不敏感,有较强的抗干扰性,即使被检测的曲线发生中断,影响也不是很大。变换的应用范围很广,可以用于直线检测,也可以对已知形状的目标进行检测,确定目标的大致边界。通常对于纯文本的文档图像采用变换来进行倾斜角度的检测......”

7、“.....而且在些情况下,用变换来计算倾斜角度,比较困难,般能处理的倾斜角度在,并且对于复杂结构的版面,是无法使用的。图像增强图像增强是根据具体的应用场景和图像的模糊情况而采用特定的增强方法来突出图像中些部分,削弱或者消除无关信息,以达到强调图像的整体或者局部特征的目的。常见的图像增强方法有灰度变换直方图修正图像锐化消除噪声图像滤波以及彩色图像增强等。可以将图像增强的方法分成两类空域增强法和频域增强法。空域增强法直接对图像中的像素点的灰度值进行处理频域增强法是将在图像转换到频率域,然后采用相应的处理方法进行增强。常规增强灰度变换灰度变换是对原始图像中的灰度进行计算,得到新的灰度值,从而达到图像增强的目的。灰度变换的原理如下设原图像的灰度为,变换后的图像的灰度为表示用来进行变换的函数公式,。即将,原图像中的灰度值为的像素点通过公式变换成,变换后的图像中的灰度值为,整幅图像的灰度范围产生定程度的延生或压缩,使得图像的整体对比度得到改善,来达到图像增强的效果......”

8、“.....函数中只涉及图像的灰度信息,不包括相应像素点的位置信息,更不涉及邻域的位置信息。变换函数的设计有两个角度,种是根据需求以及图像的相关信息,来进行设计,通过实验来测试效果,即根据需求来完成变换函数的设计另种是从图像灰度信息出发,以改变整幅图像的灰度分布,也就是根据目标来设计变换函数。具体如何设计变换函数,需要由待增强图像来确定。灰度变换方法主要有线性变换非线性变换以及分段线性变换等。直方图修正直方图修正是根据概率论演化得到的种以图像灰度为研究对象的对比度增强处理。该算法大致按如下步骤进行遍历图像分别统计图像中各灰度级示该灰度级的像素在图像中出现的概率密度,记做根据各灰度级的概率密度,可以得到概率密度函数,它是组离散的柱形的直线,成为直方图。当灰度级是个连续的数值,那样直方图将是组连续的柱形直线,接近条连续的曲线。直方图修正算法就是将像素点对应灰度值按照变换公式进行变换。常见的直方图修正方法有直方图均衡化和直方图规定化......”

9、“.....从而达到对图像增强的效果。常见的模板有或者。加权增强的特例就是均值滤波和中值滤波,对应的加权数组的取值分别为,和,。本章小结本章主要介绍了对图像进行预处理的常见几种方法,其中包括灰度化的方法二值化的三种常用方法中值滤波均值滤波倾斜度校正的三种方法以及图像增强的几种方法,对于本文涉及到的方法将会在后面的章节对其进行详细的叙述改进方法。第四章核心图像的提取与还原核心图像提取的目的在实际应用中,提取原图像源的方式是多种多样的般可以采用扫描仪,相机等设备。使用扫描仪获得的图像源般都是规整的,对于证件来说则是个长方形。而对于使用相机来获取的图像源来说,获得到的原本为长方形的对象可能会由于拍摄条件的限制变形为不规则的四边形。所以在整张图片中获取核心目标。并将其修正回长方形对于之后的裁取识别十分重要。图像的还原的工具本文中使用的基础的图像还原工具是。的全称是。是个基于开源发行的跨平台计算机视觉库,可以运行在和操作系统上。它轻量级而且高效由系列函数和少量类构成,同时提供了等语言的接口......”

下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(1)
1 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(2)
2 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(3)
3 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(4)
4 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(5)
5 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(6)
6 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(7)
7 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(8)
8 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(9)
9 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(10)
10 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(11)
11 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(12)
12 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(13)
13 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(14)
14 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(15)
15 页 / 共 48
预览结束,还剩 33 页未读
阅读全文需用电脑访问
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档