研究现状和发展前景。社会生活的各个方面,从笔式电脑到办公自动化设备,从邮政信函的自动分拣到各种表格的自动录入,从证件识别到证券识别,从自动阅读机到智能视觉系统。而与汉字识别密切相关的笔迹鉴别设备将会广泛应用于银行保安等部门。汉字识别最直接的用途是汉字输入。针对我国汉字录入的现状,汉字识别技术能很好地满足不同层次的单位个人需要。对有大量汉字录入任务的单位如报社出版社印刷厂等,方面可以大备如手机的手写板中。近年来,随着模式识别技术及计算机科学技术的发展,汉字识别也取的了极大的进展。汉字识别的基本过程包括汉字输入预处理特征提取分类识别识别后处理五个大步骤。根据识别对象的不同,汉字识别分为手写体汉字识别和印刷体汉字识别两种,前者因为各人的书写习惯不同和手写汉字变化太大而显的比较困难,后者要相对容易些。在手写汉字识别这个范畴中,根据汉字输入方式不同又可以分为联机手写汉字识别和脱机手写汉字识别。通俗地讲,联机手写就是在书写的同时,根据笔划顺序等特征对汉字进行识别,该技术较多地应用在汉字输入设根据识别对象的不同,汉字识别分为手写体汉字识别和印刷体汉字识别两种,前者因为各人的书写习惯不同和手写汉字变化太大而显的比较困难,后者要相对容易些。部分内容简介所以汉字识别是难度较大的文字识别。近年来,随着模式识别技术及计算机科学技术的发展,汉字识别也取的了极大的进展。汉字识别的基本过程包括汉字输入预处理特征提取分类识别识别后处理五个大步骤。根据识别对象的不同,汉字识别分为手写体汉字识别和印刷体汉字识别两种,前者因为各人的书写习惯不同和手写汉字变化太大而显的比较困难,后者要相对容易些。在手写汉字识别这个范畴中,根据汉字输入方式不同又可以分为联机手写汉字识别和脱机手写汉字识别。通俗地讲,联机手写就是在书写的同时,根据笔划顺序等特征对汉字进行识别,该技术较多地应用在汉字输入设备如手机的手写板中。与联机手写汉字识别不同,脱机手写汉字识别主要是多副汉字图像进行分类识别,多用于签名识别,笔迹鉴别等领域。汉字识别应用在以下几个方面使汉字高速自动地输入计算机,以彻底解决汉字信息处理系统中手动输入效率底这个关键办公自动化和下代印刷技术的文字信息自动输入。做为新代计算机智能接口的重要组成部分重庆大学本科学生毕业设计论文绪论汉字文本高倍压缩存储和传输。下面讲述汉字识别的研究现状和发展前景。汉字识别研究始于世纪年代,当时大多数文字识别研究者都集中在英文印刷体文本识别,美国科学家和率先进行印刷体汉字识别的研究工作,并于年发表了第篇有关汉字识别的论文,随后在这个领域有了大量的研究,这些严重主要是在亚洲进行的,如日本中国大陆台湾等地。我国在年代末开始了汉字识别的研究工作,到现在关于这方面的研究非常活跃,有些产品已经进入市场。眼下印刷体汉字识别系统对实际文本的识别率般达,识别速度为字每秒联机手写汉字识别系统的识别率最高可大脱机非特定手写汉字识别率最高达,速度为字每秒脱机特定手写汉字的识别率,速度字每秒其中前两个已经达到实用化要求,台湾的研究水平与大陆相当,日本的研究水平比大陆稍高。从总体来说,汉字识别技术的广泛应用将产生个新的产业,而这个产业将覆盖社会生活的各个方面,从笔式电脑到办公自动化设备,从邮政信函的自动分拣到各种表格的自动录入,从证件识别到证券识别,从自动阅读机到智能视觉系统。而与汉字识别密切相关的笔迹鉴别设备将会广泛应用于银行保安等部门。汉字识别最直接的用途是汉字输入。针对我国汉字录入的现状,汉字识别技术能很好地满足不同层次的单位个人需要。对有大量汉字录入任务的单位如报社出版社印刷厂等,方面可以大幅度提高汉字输入的效率,建设汉字输入时间,另方面还能缩小庞大的录入员队伍及相应的设备。汉字识别的另大用途是在笔式电脑中。笔式电脑没有键盘,用笔进行输入和操作。该设备的个技术关键是联机手写字符识别技术。笔式电脑是计算机发展的个重要趋势。目前已经有多中英文笔式电脑产品。笔式电脑的市场前景很大,据预测,到年,英文笔式电脑的全球销售量将达到万台。中文笔式电脑的市场前景同样也是十分巨大的,所以汉字识别技术的研究十分重要。邮政信函的分拣也是汉字识别技术应用前景看好的领域,目前我国使用的邮政信函分拣机是依据邮政编码的,也就是手写数字识别。但是单纯基于邮政编码识别的正确分拣率只能达到左右,所以手写汉字识别技术将使邮政信函的分拣更加完善。表格信息自动录入也是汉字识别技术大有可为的方向。表格信息的自动录入需要印刷体汉字识别技术脱机手写汉字识别技术及手写数字识别技术。同样地汉字识别技术还将应用于证件识别和证券识别智能计算机的智能接口和视觉系统笔迹鉴别等,由于篇幅有限,不在细述。在本文的第部分我们将介绍汉字识别的般算法和原理,以便对汉字识别重庆大学本科学生毕业设计论文绪论实现算法形成初步认识第二部分主要讲述现在用的比较多的两个算法以及将它们改进结合形成的新的方法,第三和第四部分将对算法模拟工具和主要程序代码做必要讲解,第五部分为对结果的分析。重庆大学本科学生毕业设计论文汉字识别的原理及常用算法汉字识别的原理及常用算法汉字识别的原理和其他模式识别样,汉字识别的基本思想也是匹配判别。抽取代表未知汉字模式本质的表达形式如各种特征和预先存储在机器中的标准汉字模式表达形式的集合称为辞典逐匹配,用定的准则进行判别,并在机器存储的标准汉字模式表达形式的集合中,找出最接近输入文字的模式表达形式,该表达形式对应的字就是识别结果。汉字识别的原理框图见图。光电扫描纸面文字产生模拟电信号,经模数转换成为带灰度值的数字信号送至预处理环节。预处理的内容和要求取决于识别方法。般包括行字切分,二值化,细化和抽取轮廓,平滑,规范化等。预处理后,汉字模式成为规范化的二值数字点阵,其中代表笔画,代表文字的空白背景。预处理后即可对文字图像提取特征种类型的表达式,和存储在辞典里的已知标准汉字表达形式进行匹配判别,就可识别出输入的未知汉字。图汉字识别原理框图在上图中中间横线以下是系统的学习部分,学习是根据多个未知子样个文字的不同字样称为子样提取出的模式表达形式,自动构成或修改充实辞典,不断提高系统的识别率。汉字的模式表达式和相应的辞典形式有多种,每种形式可以选择不同的特征或基元,每种特征又有不同的提取方法。这些造成了判别方法和准则以及所用的,重庆大学本科学生毕业设计论文识别算法对应的代码,识别算法识别函数重庆大学本科学生毕业设计论文识别算法对应的代码无法识别,书写不规范或字库中无次字。重庆大学本科学生毕业设计论文算法实现结果和分析算法实现结果和分析模拟结果介绍支持界面操作,在平台上建立文件,根据系统提示建立对话框后拖入需要的控件按扭文本框等,在控件的消息响应里写如响应代码,按此步骤程序运行结果如下图程序运行界面其中中间的白色区域是模拟手写板,用鼠标可以在里面进行写字操作,右边四个按扭的功能分别为识别对写如的汉字图像进行识别清除清除手写板中内容以重新书写学习若想要往字库中添加字符,可先写如要添加的汉字然后点击此键退出结束软件运行下面演示手写汉字的识别操作,首先写入汉字重庆大学本科学生毕业设计论文算法实现结果和分析图汉字的写入点击识别按扭进行识别操作图系统识别写入的汉字图像汉字被成功识别。若字库中没有写如的汉字,可以点击学习按扭向字库中添加此字。如下图所示图通过学习过程向字库添加汉字特征结果分析通过前面几章的讲述,至此基于多特征提前的联机手写汉字识别算法及起计算机实现都已完成,下面是部分实验的识别效果和对算法的分析。在实验中能识别的汉字图像如重庆大学本科学生毕业设计论文算法实现结果和分析图能够识别的汉字图像示例图不能识别的汉字图像示例算法对书写规范性不同的汉字图像的识别率见下表汉字书写的规范性样本容量能识别数量不能识别数量识别率很规范较规范不规范表对不同程度规范汉字图像的识别率其中,规范性主要是指笔划的标准程度,比如说横的歪曲度等。下表给出了该算法对不同结构的汉字的识别效果汉字结构类型样本容量能识别数量不能识别数量识别率上下结构左右结构半包围全包围复合表对不同结构汉字的识别率很规范重庆大学本科学生毕业设计论文算法实现结果和分析从上表可以看出,该算法对半包围和复合结构的汉字识别效果不太理想,主要因为这两种结构的汉字书写起来难度较大,用鼠标很难把每笔划写得标准,这就直接导致了识别率的降低从以上实验结果,我们可以得出结论基于多特征提取的识别算法通过两级识别机制,弥补了单纯基于笔划特征算法和单纯基于统计特征算法的不足,同时在计算量上也没有增大太多,多写的比较规范的汉字能识别以上,在实际应用中取得了比较好的效果,但有实现该算法有两点必须注意基于笔划特征提取算法强调书写每个字时都要遵循定的笔顺此处的笔顺是广义的,即第次向字库中读入该字时的书写顺序,不然将无法识别,现在字库中的常用字都是严格按笔顺写入的,如使用者的书写习惯不同,可在第次使用时向字库中添加。此外还有点,书写汉字时不能有连笔现象,这样将无法识别或得到结果。由于手写体和印刷体差别很大,欲使通常应用于印刷体汉字识别的基于统计特征的算法在手写体汉字识别中取的较好效果,汉字的书写就必须强调规范工整,不然可能无法正确识别。上述两点注意事项其实可以看做是本算法的不足,目前基于汉字特征点的识别算法和小波分析算法可以对以上不足做出比较好的补充,具体请查阅参考书目。重庆大学本科学生毕业设计论文总结和展望总结和展望论文总结论文选题是在第七学期后期确定的,之后发放了任务书。第八学期至三周通过相关资料的查询,综合考虑了算法耗时识别效果耗费资源等因素,初步拟订将基于结构特征
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
第 1 页 / 共 31 页
第 2 页 / 共 31 页
第 3 页 / 共 31 页
第 4 页 / 共 31 页
第 5 页 / 共 31 页
第 6 页 / 共 31 页
第 7 页 / 共 31 页
第 8 页 / 共 31 页
第 9 页 / 共 31 页
第 10 页 / 共 31 页
第 11 页 / 共 31 页
第 12 页 / 共 31 页
第 13 页 / 共 31 页
第 14 页 / 共 31 页
第 15 页 / 共 31 页
预览结束,还剩
16 页未读
阅读全文需用电脑访问
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。
1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。