帮帮文库

返回

32基于Tesseract开源OCR引擎的类身份证对象识别v1.1 32基于Tesseract开源OCR引擎的类身份证对象识别v1.1

格式:word 上传:2025-12-08 09:33:11
图像中些部分,削弱或者消除无关信息,以达到强调图像的整体或者局部特征的目的。 常见的图像增强方法有灰度变换直方图修正图像锐化消除噪声图像滤波以及彩色图像增强等。 可以将图像增强的方法分成两类空域增强法和频域增强法。 空域增强法直接对图像中的像素点的灰度值进行处理频域增强法是将在图像转换到频率域,然后采用相应的处理方法进行增强。 常规增强灰度变换灰度变换是对原始图像中的灰度进行计算,得到新的灰度值,从而达到图像增强的目的。 灰度变换的原理如下设原图像的灰度为,变换后的图像的灰度为表示用来进行变换的函数公式,。 即将,原图像中的灰度值为的像素点通过公式变换成,变换后的图像中的灰度值为,整幅图像的灰度范围产生定程度的延生或压缩,使得图像的整体对比度得到改善,来达到图像增强的效果。 此算法关键就是设计用使用引擎进行字符识别的方法,为了提高对于中英文混合身份证件的文字识别率,对系统中所使用的中英文字库进行训练。 研究使用引擎识别出字符后,根据身份证件的语义特征,如何准确骤进行了分析,逐介绍了这几个步骤的处理方法。 首先说明了图片的灰度化及二值化过程及方法,然后介绍了使用形态学的方法进行图像去噪的过程,最后使用了种顶点链编码的方法对二值化后的图像进行倾斜校正。 研究法开发了个基于开源的引擎的开放接口的身份证件识别系统,以下是实现这个系统所做的研究工作采用开源的技术,对识别的身份证件图片进行预处理。 首先对预处理需要所需的步片。 这样的应用主要是开发服务器端的系统而无需手机,降低了应用的成本,也能够将接口有偿提供给第三方使用,方便其他公司在自己的应用中接入名片识别功能。 本文工作内容总结本文的主要工作是利用相关技术和方以服务器端完成。 在当前基于微信的公共平台应用越来越广泛的条件下,也出现了以微名片为代表的微信名片应用,这些应用主要是向服务器发送名片识别的请求,服务器端完成识别工作后返回电子名片,进而保存并管理电子名了身份证件自动识别和身份证件管理功能,兼容多种语言的身份证件识别,可以将识别的身份证件直接导入到手机通讯录,极大的方便了商务名片的手机及整理工作。 同时,名片识别系统的应用也并不局限在手机终端完成,也可身份证件信息并保存到通讯录中,用户不再需要保存大量纸质身份证件即可轻松管理收到的大量身份证件。 基于这个应用场景,近几年国内出现了以汉王身份证件通身份证件全能王为代表的手机身份证件管理,他们集成联网时代,使用手机管理身份证件变成种非常方便的移动应用场景,很多研发系统的公司都看到了其中的商机并先后推出自己的身份证件识别系统,身份证件识别领域呈现百花齐放的状态。 直接拍摄身份证件,自动识别技术的研究,但是将其与身份证件管理相结合却是近年来才兴起的。 直到年才由汉王科技推出了首个中文身份证件识别系统,此后随着中文技术的发展,该系统也通过不断地更新以提高识别能力及应用功能。 在移动互息,解决了身份证件录入复杂,管理不便的问题,从细微处解决了商务社交中的个非常头疼的问题。 目前证件字符的识别已成为个研究的热门分支。 国内外研究现状及发展方向虽然国内从上世纪七十年代起就开始了将这项技术更多的应用到我们的生活中成为项研究热点。 在当前移动互联网快速发展的大环境下,使用手机管理身份证件信息成为个比较热门而有价值的应用方向,将技术嵌入这类应用中,就能够实现自动识别证件信类的字符识别已发展的比较成熟,已有不少商业应用案例。 国内来说,虽然该技术的研究从上世纪七十年代起才兴起,但发展迅速,尤其是针对中文字符的识别技术达到或超过了世界领先水平。 随着技术的不断成熟,如何首先提出并申请了专利,但这个研究也仅仅停留在理论层面上。 随着电子计算机的诞生,才得以真正将技术实现,此后这项技术得以快速的发展并逐渐发展到实际应用阶段。 目前,对该技术的功能已经趋于完善,对印刷体等等类似的用于证明身份的证件。 身份证件识别是光学字符识别,技术的个应用分支。 对的研究始于上世纪早期,由德国科学家的训练集针优化训练过程定制性别的识别训练集定制民族的识别训练集定制地址的识别训练集本章小结总结与展望第章绪论研究背景及意义再当前的社交生活中存在这许多证件,二代身份证,机动车驾驶证,汽车行驶证,名片制作文件修正文件聚类合并训练的优化本章小结第六章识别的优化利用实现汉字的目的识别参数的研究识别参数的优化使用定制第五章训练概述训练训练集的目的应对不同的字体词语以及常用词语的组合训练集的制作字体属性词组表常用词组训练图像及文件训练的流程细节解释制第五章训练概述训练训练集的目的应对不同的字体词语以及常用词语的组合训练集的制作字体属性词组表常用词组训练图像及文件训练的流程细节解释制作文件修正文件聚类合并训练的优化本章小结第六章识别的优化利用实现汉字的目的识别参数的研究识别参数的优化使用定制的训练集针优化训练过程定制性别的识别训练集定制民族的识别训练集定制地址的识别训练集本章小结总结与展望第章绪论研究背景及意义再当前的社交生活中存在这许多证件,二代身份证,机动车驾驶证,汽车行驶证,名片等等类似的用于证明身份的证件。 身份证件识别是光学字符识别,技术的个应用分支。 对的研究始于上世纪早期,由德国科学家首先提出并申请了专利,但这个研究也仅仅停留在理论层面上。 随着电子计算机的诞生,才得以真正将技术实现,此后这项技术得以快速的发展并逐渐发展到实际应用阶段。 目前,对该技术的功能已经趋于完善,对印刷体类的字符识别已发展的比较成熟,已有不少商业应用案例。 国内来说,虽然该技术的研究从上世纪七十年代起才兴起,但发展迅速,尤其是针对中文字符的识别技术达到或超过了世界领先水平。 随着技术的不断成熟,如何将这项技术更多的应用到我们的生活中成为项研究热点。 在当前移动互联网快速发展的大环境下,使用手机管理身份证件信息成为个比较热门而有价值的应用方向,将技术嵌入这类应用中,就能够实现自动识别证件信息,解决了身份证件录入复杂,管理不便的问题,从细微处解决了商务社交中的个非常头疼的问题。 目前证件字符的识别已成为个研究的热门分支。 国内外研究现状及发展方向虽然国内从上世纪七十年代起就开始了技术的研究,但是将其与身份证件管理相结合却是近年来才兴起的。 直到年才由汉王科技推出了首个中文身份证件识别系统,此后随着中文技术的发展,该系统也通过不断地更新以提高识别能力及应用功能。 在移动互联网时代,使用手机管理身份证件变成种非常方便的移动应用场景,很多研发系统的公司都看到了其中的商机并先后推出自己的身份证件识别系统,身份证件识别领域呈现百花齐放的状态。 直接拍摄身份证件,自动识别身份证件信息并保存到通讯录中,用户不再需要保存大量纸质身份证件即可轻松管理收到的大量身份证件。 基于这个应用场景,近几年国内出现了以汉王身份证件通身份证件全能王为代表的手机身份证件管理,他们集成了身份证件自动识别和身份证件管理功能,兼容多种语言的身份证件识别,可以将识别的身份证件直接导入到手机通讯录,极大的方便了商务名片的手机及整理工作。 同时,名片识别系统的应用也并不局限在手机终端完成,也可以服务器端完成。 在当前基于微信的公共平台应用越来越广泛的条件下,也出现了以微名片为代表的微信名片应用,这些应用主要是向服务器发送名片识别的请求,服务器端完成识别工作后返回电子名片,进而保存并管理电子名片。 这样的应用主要是开发服务器端的系统而无需手机,降低了应用的成本,也能够将接口有偿提供给第三方使用,方便其他公司在自己的应用中接入名片识别功能。 本文工作内容总结本文的主要工作是利用相关技术和方法开发了个基于开源的引擎的开放接口的身份证件识别系统,以下是实现这个系统所做的研究工作采用开源的技术,对识别的身份证件图片进行预处理。 首先对预处理需要所需的步骤进行了分析,逐介绍了这几个步骤的处理方法。 首先说明了图片的灰度化及二值化过程及方法,然后介绍了使用形态学的方法进行图像去噪的过程,最后使用了种顶点链编码的方法对二值化后的图像进行倾斜校正。 研究使用引擎进行字符识别的方法,为了提高对于中英文混合身份证件的文字识别率,对系统中所使用的中英文字库进行训练。 研究使用引擎识别出字符后,根据身份证件的语义特征,如何准确的确定身份证件中的字符语义并进行分类。 第章主要阐述身份证件识别的背景及意义,并简要介绍了身份证件识别系统的应用和发展。 通过对当前身份证件识别基本模型的概要分析和对字符识别引擎的简要介绍,引出了本文的主要研究工作和内容安排。 第二章给出了在基于微信的应用场景下的系统整体设计方案,并介绍了该系统详尽的环境搭建步骤,同时对该系统的扩展进行了规划。 第三章介绍了身份证件图像的预处理。 身份证件图像的预处理过程包括对彩色图像的灰度化以及灰度图像的二值化选用合适的二值化方法,基于数字形态学的身份证件图像去噪处理,倾斜身份证件图像的矫正。 第四章利用引擎识别经过预处理的身份证件图片,测试利的灰度值,然后依次取邻域循环上述处理方式,由此构成新的图像,。 取邻域中所有像素灰度值的平均值作为邻域中心的像素灰度值倾斜校正文档图像在不同程度上均会产生倾斜,本文的面图像产生倾斜主要有两种情况,种就是在印刷过程中导致的倾斜,从而在扫描时必然会发生倾斜,另种就是由于拍摄时的不当而造成的倾斜。 卷版面图像可能不是横平竖直的,而存在定的倾斜角度,尤其对于很小的倾斜角度,在图像录入过程中,是无法避免的。 特别小的倾斜角度,对后面的版面分割理解的影响不是很大,可以不考虑。 般来说,大多数的版面分割方法,在进行分割之前都要进行倾斜校正。 常见的倾斜校正方法有投影法,近邻聚集法,变换法。 投影校正采用投影迭代的方式
下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(1)
1 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(2)
2 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(3)
3 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(4)
4 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(5)
5 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(6)
6 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(7)
7 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(8)
8 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(9)
9 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(10)
10 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(11)
11 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(12)
12 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(13)
13 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(14)
14 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(15)
15 页 / 共 48
预览结束,还剩 33 页未读
阅读全文需用电脑访问
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档