点,分别用反正切公式计算前四点和后四点的近似直线的角度,考察这两个直线的夹角是否大于所设定的阈值来判定中间点是否为拐点。作者提出的角度公式如下式图数字细化图像中北大学届毕业设计说明书第页共页其中,和分别表示第个像素的坐标值。但是,由于上述方法在阈值的选择上需要依靠经验设定,对于不同大小规范化的样本,都需要重新确定次阈值。因此本文采用文献提出的种简单的检测拐点的方法。该方法的基本思想是先按定顺序扫描细化图像中的每个点,若点的链码方向从水平垂直方向变换为垂直水平方向,则认为该点位拐点。扫描顺序和链码方向如图所示。图给出了本文采用的特殊点检测算法检测数字上的端点拐点和交叉点的示意图。穿越密度特征穿越密度次数特征已被广泛的应用于字符识别的研究中。穿线法是取得笔划密度的个通用算法,其基本思想是用组或几组与水平成度度度或者度等的平行线,贯穿字符,提取字符与平行线的交点信息作为识别的依据。图左边为像素扫描顺序,右边为链码方向编码图数字细化图像上检测到的特殊点的示意图中北大学届毕业设计说明书第页共页该算法由于涉及字符拓扑结构方面的信息,所以对字符旋转缩放和变形有较强的容忍度。文献提出的种径向贯穿字符的穿线法,该方法以字符重心为坐标原点,分别从坐标原点以度方向引出条线穿越字符,以各个方向穿越字符的次数组成向量作为该字符的径向笔划密度特征。但是,当书写风格引起统字符的之心位置不同时,该方法提取的特征准确性差。本文采用的是整体贯穿法,该方法就是间隔定距离从垂直和水平方向上进行整体穿越,由于本文通过归化处理后的图像的大小是的,因此本文采用方法是间隔个像素进行从水平和垂直方向进行穿越,从而得到行列上共个的穿越次数统计,将之作为特征向量。投影特征如图所示,将个字符点阵划分为四个象限区域,共有十二个边线。将个字符点阵中的每个黑点向最近的四条边线沿水平和垂直方向进行投影,用十二条边线上的投影长度作为投影特征,共有十二个特征。之所以选用投影特征作为手写体数字识别的特征,主要是因为投影特征计算简单,能够反应字符的内部结构和笔划的分布情况,唯性好,可区别性好,是比较有代表性的特征,不同数字之间的个投影特征的各个分量差异比较明显,可以考虑作为分类的细特征。图投影特征示意图中北大学届毕业设计说明书第页共页手写体数字识别中的统计特征提取统计特征分为全局统计特征和局部统计特征,全局统计特征是需要在整幅图像上获取的特征信息。传统的全局特征主要包括全局变换特征不变矩特征全局笔划方向特征等。常用的局部统计特征有局部笔划方向特征特征等。统计特征对微小的畸变不敏感,但区分相似的能力较差。接下来将详细描述本文采用的种统计特征值的提取方法。重心矩特征由于不同字符的笔划不同,其像素点的分布不同,所造成不同字符的四个象限中四个不同区域的重心位置与字符重心位置的距离不同由于在图像预处理中,图像的重心已经和中心对齐了。也就是说令,表示字符的重心,那么可以近似的有式其中为图像的标准平面的边长。那么下面定义重心矩如下,式其中,。这样就可以得到四个重心矩特征,,他们分别反映了四个象限中的像素偏离重心位置的整体特征。粗网格特征粗网格特征是组注重字符图像的整体的分布特征,此种特征对噪声具有极强的抑制能力。般来说,虽然手写体数字的书写风格千变万化,但是数字笔划的分布是有定的规律的。由于个字符的笔划具有比较固定的总体分布状况,从特征选择的质量来讲,不同数字的特征向量在特征空间中的分布是比较分散的,即特征空间中不同类的类间距离是比较大的。如图所示,本文采用的粗网格特征提取的方法是把数字点阵分成几个局部小区域,并把每个小区域上的点阵密度作为描述特征,即统计每个小区域中图像的像素的个数作为特征数据。本文对原始图像进行归化处理后的图像是中北大学届毕业设计说明书第页共页的点阵,将之划分为大小的小区域,共计个,因此得出个十六维的粗网格特征。由于粗网格特征反映的是图像局部特征,而图像局部的形变或噪声对应数字点阵就是局部元素和的值互换,所以如果图像带有局部的形变或噪声,与没有形变和噪声的原图像相比,像素的变化不大。也就是说,这个相对值对与数字图片局部笔划的形变或弧的噪声点带来的影响不敏感。因此,以粗网格特征进行数字识别,具有较好的抗噪声能力。水平垂直投影特征投影密度常用来描述字符笔划的宽度,同时它也可以反映字符定程度上的笔划结构信息。由于投影的能够很好的反映字符图像的高宽,以及字符的笔划密度。如图所示,该图显示了字符的水平投影和垂直投影,通过该投影我们可以看出对于数字的水平投影有其特有的波形形状。而如果字符含有少量噪声的话,该波形形状基本不发生任何改变。因此本文采用水平垂直投影特征作为特征值。本文提取水平垂直投影特征的详细算法是首先分别扫描生成水平投影和垂直投影,然后每间隔个像素提取个特征值该值是该个中的最大值,因此这样就可以提取个特征值。图粗网格特征提取示意图图字符的水平和垂直投影中北大学届毕业设计说明书第页共页环凸凹特征环凸凹特征够准确描述字符的大体轮廓信息,例如对与数字,无论何种写法,其不会包含环形,而对于数字,则应该存在环形。然而环形和凸凹特征是受到书写方法如图数字的两种不同写法,左边的数字不包含环形,右边的数字的写法包含环形和断笔等影响,因此虽然环凸凹特征能有效的区分些数字之间的区别,但是由于其对书写方法有定要求而且要求必须没有断笔现象,因此如果直接采用此方法来进行识别数字,会影响识别率。本文提出将提取的数字图像中环个数和凸凹区域的个数作为描述字符的特性的个特征值,由于神经网络具有定的抽象能力,即使由于少数字符因断笔等造成环凸凹不准确,但其能更具其他特征值进行整体分析,具有定的容忍能力,因此有效的解决断笔可能导致环凸凹特性不准确的问题。本文使用的环凸凹区域检测的方法采用的是龚才春等人提出种通过计算字符图像赋值背景,从中提取凹凸特性的简单快速方法。该方法的步骤如下计算赋值背景。所谓背景赋值,既是从字符图像的所有背景点出发,向右右下下左下左左上上右八个方向发出八条射线,判断射线是否与字符相交,有几条射线相交,则将该背景点的值赋值为几。提取环凸凹特性。这里提取字符的凸凹特性主要描述为更具赋值背景来寻找字符图像的环和凹凸区域。环的识别很简单,如果字符的四连通区域都是并且周围是被包围的话,那么认为该区域是个环。凹凸区域同理,当所有的字符的四连通区域中都是,并且连通区域的个数大于阀值本文中取,则认为该区域是个凹区域。上述连通区域的检测,可以采用深度优先算法进行遍历完成具体深度优先算法的实现可以参考相关资料,本文不做详细描述。通过上面的算法,就很容易的将字符图形的环的个数,凹凸区域的个数进行检测并统计出来,将之作为环凹凸特征值。图数字的两种不同书写方法中北大学届毕业设计说明书第页共页全局边缘方向特征本文使用的全局边缘方向特征是基于边缘强度又称梯度的提取,通过分区密度统计来得到组特征向量。边缘算子定义了个非线性边缘测量算子式其中,并且,上式中,为像素,的边缘强度或梯度,为像素,的八个相邻单元。图为它们的位置关系图。式式分别描述了像素,水平边缘强度,垂直边缘强度,右对角线边缘强度和左对角线边缘强度式式式式为了方便计算机处理,在上四式对个方向的边缘强度水平垂直左对角右对角可以定义组个卷积模板运算,如图所示。,图八个相邻单元位置示意图中北大学届毕业设计说明书第页共页采用上述模板,分别对个规范化的输入图像二值化图像,通过上面组方向算子计算出幅边缘或称梯度矩阵。对于本文的数字图像大小为的图像来说,将会产生个的矩阵。为了减少数据,本文对该组矩阵数据进行压缩,采取的压缩方法是将的矩阵分割成个的正方形,然后将的图形进行累加求和。因此这样将的矩阵压缩到的矩阵,这样的矩阵共个,累计个特征值。水平方向垂直方向右对角方向左对角方向图算子模板中北大学届毕业设计说明书第页共页人工神经网络分类器人工神经网络概述人工神经自从世纪年代首次将单层感知器应用于模式分类学习以来,已经有了几十年的研究历史。但是,由于和指出单层系统的局限性,并表达了对多层系统的悲观看法,在世纪年代,对的研究兴趣减弱。直到年代中期等重新阐述了反传训练方法,使得在领域的理论和应用研究开始在世界范围内重新兴起。是种按照人脑的组织和活动原来而构造的种数据驱动型非线性映射模型,它具有强大的并行处理自适应自组织联想记忆容错鲁棒以及逼近任意非线性等特性,在预测评估模式识别信号处理组合优化及知识工程等领域具有广泛的应用。近年来,已有多种模型被提出并得以深入研究。其中,的人工神经网络模型采用前馈反向传播网络,简称网络。人工神经网络源于人脑神经系统的类模型,是模拟人工智能的条重要途径,具有模拟人的部分形象思维的能力。它是由简单信息处理单元人工神经元互联组成的网络,能接受处理信息,网络的信息处理由处理单元统计表系统测试表系统测试中北大学届毕业设计说明书第页共页结束语本文的讨论内容是脱机手写体数字识别的问题。脱机手写体数字识别是字符识别中的个特殊的个问题,在实际生活中,手写体数字识别尤其脱机手写体数字识别的应用比较广泛,例如银行票据认证成绩自动录入等等。本文从建立个完整的脱机手写体数字识别系统的目的出发,对识别系统的重要几个环
            
            
         
        
        
            温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
 
            
                
                
                第  1  页 / 共 59 页
                
                
                第  2  页 / 共 59 页
                
                
                第  3  页 / 共 59 页
                
                
                第  4  页 / 共 59 页
                
                
                第  5  页 / 共 59 页
                
                
                第  6  页 / 共 59 页
                
                
                第  7  页 / 共 59 页
                
                
                第  8  页 / 共 59 页
                
                
                第  9  页 / 共 59 页
                
                
                第  10  页 / 共 59 页
                
                
                第  11  页 / 共 59 页
                
                
                第  12  页 / 共 59 页
                
                
                第  13  页 / 共 59 页
                
                
                第  14  页 / 共 59 页
                
                
                第  15  页 / 共 59 页
                
             
            
            
                
                预览结束,还剩 
44 页未读
                
阅读全文需用电脑访问
                
             
            
            
                
                
                    1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
                    2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
                    3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。
                 
             
            
                
                1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
                
                2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
                3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
                4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
                5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。