帮帮文库

返回

(定稿)基于Tesseract 开源OCR引擎的类身份证对象识别v1.1 (定稿)基于Tesseract 开源OCR引擎的类身份证对象识别v1.1

格式:word 上传:2025-07-21 06:20:48
件自动识别和身份证件管理功能,兼容多种语言的身份证件识别,可以将识别的身份证件直接导入到手机通讯录,极大的方便了商务名片的手机及整理工作。 同时,名片识别系统的应用也并不局限在手机终端完成,也可以服务器端完成。 在当前基于微信的公共平台应用越来越广泛的条件下,也出现了以微名片为代表的微信名片应用,这些应用主要是向服务器发送名片识别的请求,服务器端完成识别工作后返回电子名片,进而保存并管理电子名片。 这样的应用主要是开发服务器端的系统而无需手机,降低了应用的成本,也能够将接口有偿提供给第三方使用,方便其他公司在自己的应用中接入名片识别功能。 本文工作内容总结本文的主要工作是利用相关技术和方法开发了个基于开源的引擎的开放接口的身份证件识别系统,以下是实现这个系统所做的研究工作采用开源的技术,对识别的身份证件图片进行预处理。 首先对预处理需要所需的步骤进行了分析,逐介绍了这几个步骤的处理方法。 首先说明了图片的灰度化及二值化过程及方法,然后介绍了使用形态学的方法进行图像去噪的过程,最后使用了种顶点链编码的方法对二值化后的图像进行倾斜校正。 研究使用引擎进行字符识别的方法,为了提高对于中英文混合身份证件的文字识别率,对系统中所使用的中英文字库进行训练。 研究使用引擎识别出字符后,根据身份证件的语义特征,如何准确的确定身份证件中的字符语义并进行分类。 第章主要阐述身份证件识别的背景及意义,并简要介绍了身份证件识别系统的应用和发展。 通过对当前身份证件识别基本模型的概要分析和对字符识别引擎的简要介绍,引出了本的基本步骤为采用水平投影方式,统计各行的目标像素的数目并记录预设几个角度,分别进行水平投影,记录对应的投影值对预设的几个角度得到的相应行的投影值进行对比,寻找其中投影值最大的,记录此时的角度作为整个文档的倾斜角度。 近邻法近邻法作为新的检测倾斜角度的算法,它主要针对连通区域进行操作。 该算法主要的算法步骤分以下几步遍历图像,进行连通区域的搜索根据提供的文档图像的个区域,确定该区域的连通区域对得到的连通区域进行筛选,选择相邻的连通区域,并计算出这些连通区域的中心点通过这些区域的中心点的连线,来计算该第五章训练概述训练训练集的目的应对不同的字体词语以及常用词语的组合训练集的制作字体属性词组表常用词组训练图像及文件训练的流程细节解释制作文件修正文件聚类合并训练的优化本章小结第六章识别的优化利用实现汉字的目的识别参数的研究识别参数的优化使用定制的训练集针优化训练过程定制性别的识别训练集定制民族的识别训练集定制地址的识别训练集本章小结总结与展望第章绪论研究背景及意义再当前的社交生活中存在这许多证件,二代身份证,机动车驾驶证,汽车行驶证,名片等等类似的用于证明身份的证件。 身份证件识别是光学字符识别,技术的个应用分支。 对的研究始于上世纪早期,由德国科学家首先提出并申请了专利,但这个研究也仅仅停留在理论层面上。 随着电子计算机的诞生,才得以真正将技术实现,此后这项技术得以快速的发展并逐渐发展到实际应用阶段。 目前,对该技术的功能已经趋于完善,对印刷体类的字符识别已发展的比较成熟,已有不少商业应用案例。 国内来说,虽然该技术的研究从上世纪七十年代起才兴起,但发展迅速,尤其是针对中文字符的识别技术达到或超过了世界领先水平。 随着技术的不断成熟,如何将这项技术更多的应用到我们的生活中成为项研究热点。 在当前移动互联网快速发展的大环境下,使用手机管理身份证件信息成为个比较热门而有价值的应用方向,将技术嵌入这类应用中,就能够实现自动识别证件信息,解决了身份证件录入复杂,管理不便的问题,从细微处解决了商务社交中的个非常头疼的问题。 目前证件字符的识别已成为个研究的热门分支。 国内外研究现状及发展方向虽然国内从上世纪七十年代起就开始了技术的研究,但是将其与身份证件管理相结合却是近年来才兴起的。 直到年才由汉王科技推出了首个中文身份证件识别系统,此后随着中文技术的发展,该系统也通过不断地更新以提高识别能力及应用功能。 在移动互联网时代要计算透视变换矩阵以及其拟矩阵设所需要计算
下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(1)
1 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(2)
2 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(3)
3 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(4)
4 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(5)
5 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(6)
6 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(7)
7 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(8)
8 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(9)
9 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(10)
10 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(11)
11 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(12)
12 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(13)
13 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(14)
14 页 / 共 48
基于Tesseract 开源OCR引擎的类身份证对象识别v1.1.doc预览图(15)
15 页 / 共 48
预览结束,还剩 33 页未读
阅读全文需用电脑访问
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档