帮帮文库

返回

连续语音识别中半连续HMM的研究及实现硕士学位论文 连续语音识别中半连续HMM的研究及实现硕士学位论文

格式:word 上传:2022-06-24 19:07:08
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(1)
1 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(2)
2 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(3)
3 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(4)
4 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(5)
5 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(6)
6 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(7)
7 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(8)
8 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(9)
9 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(10)
10 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(11)
11 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(12)
12 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(13)
13 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(14)
14 页 / 共 71
连续语音识别中半连续HMM的研究及实现硕士学位论文.doc预览图(15)
15 页 / 共 71

1、因此忽略那些贡献小的码本不会对识别精度造成大的影响。我们可以简单地设定每个状态只采用个码本表示,对于有个码本的状态,设权重系数为,,首先我们对码本系数进行排序,假设排序结果为二〇〇二年五月七日星期二,抛弃的那些码本,为了保证剩余的个码本系数是归化的,我们再对这个码本系数做归化处理。即ˆ经过这样的处理后,每个状态的码本组合数由原来的减少到,大大减少了计算量,通常可以为的。表码本剪枝的实验码本数耗时秒识别率表是码本剪枝策略的测试结果。实验的系统全部码本数为,这个码本被系统的所有模型和所有状态共享,实验中我们把码本的共享数从降到。从实验数据可以看出,采用不同的码本组合数,所花费的计算代价显著不同,当状态的码本数从个码本降到个码本时,搜索速度提高了。

2、己习惯的自然方式输入语音。语音完全口语化语音可以随意地连续停顿和快慢变化,可以有无关的内容如咂嘴的声音嗯„„等,可以有重复和修改如他住在四三,噢,四四房间,语法上没有书面语那样较严格的限制。自然口语识别是语音识别的最高阶段,也是现在的个研究热点。尽管这四种语音输入方式有或多或少的区别,但实际系统常常包含了许多相同或相似的模块和算法。如语音信号预处理部分有时可以通用于这四种系统,这四种系统可以使用相同的声学模型,连续语音系统和自然口语系统也可以共享些语言后处理的算法,等等。按词汇量大小小词汇量识别可识别词数少于个中词汇量识别可识别词数大于但小于个大词汇量识别可识别词数大于个。随着词汇量的增加,在特征空间中相邻词的距离减小了,而词与词交叉重叠的机会增大,。

3、票系统,普通用户可以通过电话进行语音订票或预定旅馆房间另外还出现了带有对话系统的天气查询系统,用户同样可以通过普通电话进行语音查询。对话系统可以在任何时候被大负荷的访问,不象人样会疲劳,总能给用户亲切快捷的服务。预计语音识别在这方面的应用还要进步扩大。口语翻译系统随着人们的交流日益频繁,对口语翻译的需求越来越大。为此很多机构在二〇〇二年五月七日星期二研究自动口语翻译系统。口语翻译的第步就是要听清用户在说什么,这部分的工作离不开语音识别系统。计算机辅助教学在常规的课堂教学中,老师和学生之间经常要进行交流,以提高教学的质量,解前状态贡献最大的前个码本按权重系数从大到小的排序,可以看出,这些码本的权重系数同表些码本相比是很大的,在指数域上相差几十到上百的数量级,。

4、,人们常常从不同的角度对识别系统进行分类按说话方式及语言规则孤立词识别被识别的基本单位的语音之间有明显的停顿间隔。这种系统的识别正确率最高,但输入语音速度较慢,而且使用者常常感到语音输入方式不自然连接词识别被识别的基本单位的语音可连续输入而不必停顿,同时对输入的基本单位的顺序没有限制。如象电话号码这样的数字串就可用连接词识别法。它的缺点是应用范围不广,而且识别正确率较低。连续语音识别被识别的基本单位的语音可连续输入而不必停顿,同时对输入的基本单位的顺序有语法语义上的限制。连续语音的输入方式比较接近自然,输入语音速度较快,但识别正确率远远低于对孤立词和连接词的识别。二〇〇二年五月七日星期二自然口语识别可以看作种更高级的连续语音输入方式。说话者完全用自。

5、是为了方便,比如现在的掌上电脑体积很小,用普通电脑的按键方式使用很困难还有时是特殊环境的要求,比如我们在黑暗的场所操纵诸多开关按钮时,会发现并不容易。而语音在这些方面却不受限制,我们可以用语音识别进行拨号,进行掌上机的输入,进行开关的控制。语音控制可以解放我们的双手,帮助我们克服各种操作的困难,还可以使我们的生活工作更方便和舒适。比如在联网的智能家电中装上语音识别模块,我们就可以从办公室打电话了解家里的情况,并控制家电的工作。另外,对残疾人来说,语音控制可能会使他们能像健康人样地自理生活。总之,语音控制的应用前景非常广阔。对话系统订票系统,天气查询等将语音识别自然语言理解对话控制语言生成语音合成数据库等技术综合起来可以构成对话系统。对话系统现在已开始用于订。

6、接近十倍,而识别率却没有降低。这说明码本剪枝策略对提高搜索速度的贡献是相当大的。剪枝策略在搜索过程中,为了找到基于最大似然得分的状态序列,在当前时刻,要计算状态空间中所有状态对当前帧产生的似然值。实际上,有些状态从前时刻获得的累计似然得分很小,它们在后续时间里是没有竞争力的,因此对这些状态的当前似然值可以不做计算,从而减少状态计算的数量,提高搜索速度。图是搜索的示意图,它是无跨越由左向右的,图中只给出了部分跳转情况,我们分析当时状态的跳转及剪枝的可能。对于的每个状态,它的累计似然得分只能来自时刻的两个状态,个是来自于它自身的状态例如,另外个如果该状态是模型的首状态,似然得分可能来自其它模型的末状态例如,如果该状态不是模型的首状态,它的似然得分可能来自自身模。

7、所以识别也越困难。按被识别人范围特定人识别语音识别系统专门为特定人定制,当对这个人进行语音识别时,系统可达到定令人满意的识别正确率非特定人识别系统可以对所有人的语音产生较好的识别结果。实际上,许多非特定人的识别系统都具有自适应功能,可以用个使用者的输入对系统参数继续进行训练,以对这个人达到更好的识别效果,这样非特定人似乎就变成了特定人识别系统。所以非特定人系统和特定人系统往往没有个绝对的界限。语音识别的应用价值语音识别有极其巨大的应用价值,这主要表现在以下几方面种非常自然的文字输入方法二〇〇二年五月七日星期二人类希望将自己的语言记录下来,传统上可以通过书写等物理手段进行具体的保留。现在,更准确可靠和容易加工的手段是输入计算机以抽象数据编码的形式进行记录。

8、风险很大,它是在算法基础上形成的个更次优算法,如果的宽度设置不合适,些最优或次优的路径有可能在搜索的早期即被截断,且无法补救。因此在采用剪枝时,宽度不宜选得过小。对我们的系统而言,宽度选在之间是合适的。由于不同系统实现的方法可能不同,计算出的似然得分也不尽相同,这个宽度只具有参考价值。降低精度策略由于连续语音训练的复杂性及容易溢出,同时也为了使训练模型的参数更加精确,在训练阶段,我们全面地采用了双精度型参与运算,模型参数也用双精度型来表示。它的缺点是显而易见的,双精度型使得硬盘存储及内存消耗成倍地增加,同时表示精度的提高意味着需要更多的计算代价,在训练阶段,这个矛盾并不突出,但在识别阶段,由于需要实时响应,这个计算代价就值得考虑。更高的精度是否真正有利于提。

9、。最常用的方式是用键盘输入,这要求使用者必须经过专门的训练,而对普通用户又不太现实。尤其对于使用汉语的中国人的来说,困难就更大,因为汉字是象形文字,不象英语等拼音文字那样每个字母都有键盘按键直接对应。虽然现在汉语已有五笔字型等高效输入编码方式,但对于般人来说很难熟练掌握。另方面,口语是人类生存的个重要手段,虽然它不是与生俱来的,但个健康人在他的早年即已习得,可以认为口语是绝大部分人最自然的交流方式。有时,书写也可以作为人们的交流方式,不幸的是书写速度还是比普通的说话速度慢,所以口语应该成为最自然快速的文字输入方式。语音控制在很多场合下,人们希望有手动控制以外的控制方式。有时是为了安全,比如在驾驶车辆时,司机为了使用移动电话,分散精力用手拨号就是很危险的有时。

10、度耗时秒识别率表是剪枝的实验结果,的宽度由降到,可以看出当的宽度大于时,花费的时间基本相当,说明没有剪枝或剪枝很少,当的宽度小于时,剪枝的作用有所表现。随着宽度的减少,所花费的时间也在降低,但降低的幅度不大。究其原因,方面是我们采用了与上下文无关的无调音节作为识别基元,它的模型数和状态空间相对较小,能够剪枝的状态帧数图二〇〇二年五月七日星期二范围有限,因此剪枝的作用表现不明显。另方面,我们的系统是基于的,它的码本是全局共享的,即使对个状态进行了剪枝,属于该状态每个码本的当前似然值也必须计算,因为这些码本还用于其它的状态。实际上,在中,剪枝的作用仅仅是节省了码本线性组合时的些乘加计算,由于已经采用了码本剪枝的策略,相应地削弱了剪枝的作用。同时我们注意到剪枝的。

11、高模型的识别率呢从实际观察和统计中发现,在连续语音识别中,产生的似然值是相当小的,在对数域也达到了几百甚至几千,精度的提高并不会对似然值产生明显的影响,也就是说高精度并不能有效地提高模型的识别率,相反却使搜索速度减慢。由于在识别阶段速度是关键因素之,因此降低模型的表示精度就成为了种简单有效的提高搜索速度的方法。表和类型对照表类型字节数有效位数有效范围表是双精度型和浮点型的对照表,从表中可以看出,在计算机的内存表示中,浮点型比双精度型少用了半的字节数,它的有效位数也是双精度型的半。因此在识别阶段,采用比双精度型精度更低的浮点型来表示模型参数并进行运算,在内存消耗和搜索速度方面必然比双精度型有更好的性能。二〇〇二年五月七日星期二表是双精度型和浮点型计算代价比较。

12、型的上个状态例如,最终的得分是取这两个似然得分最大的个作为本状态从前时刻继承来的累计得分。如果这二〇〇二年五月七日星期二个得分足够小,那么就没有必要计算当前帧在当前状态的概率,因为这个状态是没有竞争力的,也就是说它是最佳路径的可能性很小,因而可以抛弃。我们知道计算状态概率的过程是搜索过程中主要的计算代价之,由于减少了状态概率的计算,相应地提高了搜索的速度。得分足够小的标准是相对而言的,对于时刻我们可以计算出所有状态从前状态继承来的似然得分,表示状态空间所有状态,从中选择最大者作为基准,设为,另外定义个阈值,如果成立,则抛弃状态。不计算它在当前帧的概率,否则计算它在当前帧的概率并和时刻继承来的得分相乘在对数域是相加作为本状态新的似然得分。表剪枝的实验宽。

参考资料:

[1]连续小波变换的开关电流滤波器实现(第55页,发表于2022-06-24)

[2]连杆盖的工艺和工装毕业设计说明书(第17页,发表于2022-06-24)

[3]连杆盖工艺加工和钻2-M12底孔夹具毕业设计说明书(第17页,发表于2022-06-24)

[4]连杆盖工艺加工和车φ81孔夹具毕业设计说明书(第17页,发表于2022-06-24)

[5]连杆的机械加工工艺规程及Φ25孔加工的工艺设备毕业设计说明书(第18页,发表于2022-06-24)

[6]连杆孔加工工艺与夹具设计(第33页,发表于2022-06-24)

[7]连杆大小头孔中心线平行度检测装置设计(第36页,发表于2022-06-24)

[8]远洋船舶轮机模拟器是运用于轮机系统仿真的典型的分布式控制系统硕士学位论文(第75页,发表于2022-06-24)

[9]近代物理与普通物理的关系(第11页,发表于2022-06-24)

[10]运送铝活塞毛坯件机械手设计(第34页,发表于2022-06-24)

[11]运输车辆盘式制动器设计(第31页,发表于2022-06-24)

[12]运行中的汽轮机系统真空下降原因的分析(第25页,发表于2022-06-24)

[13]过程控制系统实验装置开发毕业设计说明书(第63页,发表于2022-06-24)

[14]过桥齿轮轴工艺及铣槽夹具毕业设计说明书(第17页,发表于2022-06-24)

[15]输电线路的防雷设计(第32页,发表于2022-06-24)

[16]输油管接头注射模具设计(全套含图纸)(第35页,发表于2022-06-24)

[17]输气管线阴极防腐保护工程初步设计(第35页,发表于2022-06-24)

[18]输出轴的机械加工工艺规程及夹具设计(第20页,发表于2022-06-24)

[19]输出轴加工工艺及钻10-φ20孔夹具设计[A型](第15页,发表于2022-06-24)

[20]轿车机械式变速器设计(第64页,发表于2022-06-24)

预览结束,还剩 56 页未读
阅读全文需用电脑访问
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。

2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。

3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。

4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。

5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。

连续语音识别中半连续HMM的研究及实现硕士学位论文
帮帮文库
页面跳转中,请稍等....
帮帮文库

搜索

客服

足迹

下载文档