识别的基本单位的语音可连续输入而不必停顿,同时对输入的基本单位的顺序有语法语义上的限制。
连续语音的输入方式比较接近自然,输入语音速度较快,但识别正确率远远低于对孤立词和连接词的识别。
二〇〇二年五月七日星期二自然口语识别可以看作种更高级的连续语音输入方式。
说话者完全用自己习惯的自然方式输入语音。
语音完全口语化语音可以随意地连续停顿和快慢变化,可以有无关的内容如咂嘴的声音嗯„„等,可以有重复和修改如他住在四三,噢,四四房间,语法上没有书面语那样较严格的限制。
自然口语识别是语音识别的最高阶段,也是现在的个研究热点。
尽管这四种语音输入方式有或多或少的区别,但实际系统常常包含了许多相同或相似的模块和算法。
如语音信号预处理部分有时可以通用于这四种系统,这四种系统可以使用相同的声学模型,连续语音系统和自然口语系统也可以共享些语言后处理的算法,等等。
按词汇量大小小词汇量识别可识别词数少于个中词汇量识别可识别词数大于但小于个大词汇量识别可识别词数大于个。
随着词汇量的增加,在特征空间中相邻词的距离减小了,而词与词交叉重叠的机会增大,所以识别也越困难。
按被识别人范围特定人识别语音识别系统专门为特定人定制,当对这个人进行语音识别时,系统可达到定令人满意的识别正确率非特定人识别系统可以对所有人的语音产生较好的识别结果。
实际上,许多非特定人的识别系统都具有自适应功能,可以用个使用者的输入对系统参数继续进行训练,以对这个人达到更好的识别效果,这样非特定人似乎就变成了特定人识别系统。
所以非特定人系统和特定人系统往往没有个绝对的界限。
语音识别的应用价值语音识别有极其巨大的应用价值,这主要表现在以下几方面种非常自然的文字输入方法二〇〇二年五月七日星期二人类希望将自己的语言记录下来,传统上可以通过书写等物理手段进行具体的保留。
现在,更准确可靠和容易加工的手段是输入计算机以抽象数据编码的形式进行记录。
最常用的方式是用键盘输入,这要求使用者必须经过专门的训练,而对普通用户又不太现实。
尤其对于使用汉语的中国人的来说,困难就更大,因为汉字是象形文字,不象英语等拼音文字那样每个字母都有键盘按键直接对应。
虽然现在汉语已有五笔字型等高效输入编码方式,但对于般人来说很难熟练掌握。
另方面,口语是人类生存的个重要手段,虽然它不是与生俱来的,但个健康人在他的早年即已习得,可以认为口语是绝大部分人最自然的交流方式。
有时,书写也可以作为人们的交流方式,不幸的是书写速度还是比普通的说话速度慢,所以口语应该成为最自然快速的文字输入方式。
语音控制在很多场合下,人们希望有手动控制以外的控制方式。
有时是为了安全,比如在驾驶车辆时,司机为了使用移动电话,分散精力用手拨号就是很危险的有时是为了方便,比如现在的掌上电脑体积很小,用普通电脑的按键方式使用很困难还有时是特殊环境的要求,比如我们在黑暗的场所操纵诸多开关按钮时,会发现并不容易。
而语音在这些方面却不受限制,我们可以用语音识别进行拨号,进行掌上机的输入,进行开关的控制。
语音控制可以解放我们的双手,帮助我们克服各种操作的困难,还可以使我们的生活工作更方便和舒适。
比如在联网的智能家电中装上语音识别模块,我们就可以从办公室打电话了解家里的情况,并控制家电的工作。
另外,对残疾人来说,语音控制可能会使他们能像健康人样地自理生活。
总之,语音控制的应用前景非常广阔。
对话系统订票系统,天气查询等将语音识别自然语言理解对话控制语言生成语音合成数据库等技术综合起来可以构成对话系统。
对话系统现在已开始用于订票系统,普通用户可以通过电话进行语音订票或预定旅馆房间另外还出现了带有对话系统的天气查询系统,用户同样可以通过普通电话进行语音查询。
对话系统可以在任何时候被大负荷的访问,不象人样会疲劳,总能给用户亲切快捷的服务。
预计语音识别在这方面的应用还要进步扩大。
口语翻译系统随着人们的交流日益频繁,对口语翻译的需求越来越大。
为此很多机构在二〇〇二年五月七日星期二研究自动口语翻译系统。
口语翻译的第步就是要听清用户在说什么,这部分的工作离不开语音识别系统。
计算机辅助教学在常规的课堂教学中,老师和学生之间经常要进行交流,以提高教学的质量,解决学生的疑问。
在计算机辅助教学领域,人们也希望人机之间有相似的交流和反馈。
目前,语音识别已开始进入这领域,比如有些英语学习软件就通过语音识别来判断学生发音的准确性。
由于交流的重要性,可以断言,未来大部分计算机辅助教学系统都离不开语音识别。
身份确认现在进行自动身份确认的方式很多,比如键盘输入密码指纹掌纹人脸虹膜视网膜图像等等,而语音常常是个非常好的方式。
人们可以口述密码回答特殊的问题,还可以与目前的说话人确认技术结合,形成种自然方便和可靠的确认系统。
它可以广泛地用于楼宇安全系统,以及电子商务等领域。
以上只是目前可以预见到的些应用,尽管这样,已经让我们对未来充满了憧憬。
语音识别将与其它各种技术熔合在起,渗透到社会的各个角落,相信有天,人们会发现自己的生存已离不开语音识别。
语音识别的理论意义语音识别也有很强的理论二〇〇二年五月七日星期二朱凌云责任编辑语音识别个人电脑,俞铁成通用实时主意识别系统物理学报,计天颖种汉语连续主意识别的算法及其实现博士学位论文北京清华大学无线电系,徐波非特定人听写机系统模块研究。
第四届全国人机语音通讯学术会议李国杰主编第五届全国汉字识别语音识别与合成系统及自然语言处理系统评测结果智能机研究动态,二〇〇二年五月七日星期二王东口语对话系统的研究学士学位论文北京清华大学计算机系,二〇〇二年五月七日星期二个人简历姓名李军性别男出生日年月日职称工程师经历年月于大庆石油学院计算机与控制系计算机应用专业本科毕业,并获工学学士学位,年月至今在清华大学计算机科学与技术系攻读硕士学位作者在攻读硕士学位期间发表的学术论文李军,朱小燕,王东半连续码本生成算法的研究计算机工程,已录用二〇〇二年五月七日星期二致谢值此论文完成之际,谨向曾关心和帮助我的老师同学以及亲友并表示衷心的感谢,首先感谢我的导师朱小燕教授,是她引导我走进了语音识别的领域,并使我的知识扩展到了个新天地。
朱小燕教授渊博的学识,严谨求实的治学精神,乐观积极的人生态度,使我受益匪浅,并终身难忘。
是她的关心和支持使得我能够专心从事研究并完成此文。
感谢我的小师兄戴海生,在我对语音领域茫然无知的时候,是他经常地,耐心地帮助,使我很快进入这个领域,小师兄宽广的知识面,高尚的人品,值得我学习感谢王东同学,他对语音识别有着深刻的理解,阅读他编写的程序让我学到很多东西,和他的探讨使我思路开阔,王东无私的帮助和他所做的大量基础工作是我能进步研究的前提。
感谢严斌峰郝宇吴大雷郭锐黄民烈张显包塔等各位同学在学习和工作各方面所给予的帮助感谢未曾谋面的各位师兄师姐,你们留下的卓有成效的工作成果和思想深刻的论文对我帮助很大。
感谢我的同事邢川生高级工程师,是他的鼓励和支持使我有机会走入大学校园并从事研究工作,邢川生同志高尚的品格和良好的做人原则,对我起到了很好的示范作用。
感谢本人妻子崔旭的全力支持。
在我千里求学的过程中,她在家乡承担工作和家庭的双重压力,付出了远大于我的代价,如果说本人成功,毫无疑问有她的半还有我的儿子,是我艰难求学中的巨大精神支柱。
感谢我的父母,他们不仅支持我继续求学,提高自己,而且在生活上和精神上给了我很大的帮助。
感谢所有帮助和关心我的人们,二〇〇二年五月七日星期二连续语音识别中半连续的研究及实现申请清华大学工学硕士学位论文密级内部二〇〇二年五月七日星期二独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。
尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得清华大学或其它教育机构的学位或证书而使用过的材料。
与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。
签名日期关于论文使用授权的说明本人完全了解清华大学有关保留使用学位论文的规定,即学校有权保留送交论文的复印件,允许论文被查阅和借阅学校可以公布论文的全部或部分内容,可以采用影印缩印或其他复制手段保存论文。
签名导师签名日期二〇〇二年五月七日星期二摘要作为种有效的语音识别技术,它充分地吸收了离散和连续的优点,具有识别精度高搜索速度快等特点。
特别是它的码本绑定策略,由于从全局的角度来共享和调整码本,所生成的码本性能更好,能够有效地反映语音空间的特征,因此只要少量的码本就能使系统达到较好的性能,大大减轻了码本计算的复杂性,提高了系统识别的速度。
研究内容包括如下几个方面在初始码本生成中引入了随机松弛算法,的初始码本生成是个矢量量化的问题,量化的困难是量化结果通常会陷入局部最优,采用随机松弛算法能够比较好地克服这个缺点。
在连续语音训练中,通过减去句子单元信息,克服了算法训练不同类型句子时发生数据奇异的缺陷。
改进了的搜索算法,通过对码本进行剪枝,剪枝等措施,在保证定识别率的前提下,大大减少了搜索在时间和空间上的消耗,加快了搜索的速度。
实现了个基于的连续语音训练和识别系统。
关键词语音识别,半连续,码本,随机松弛,搜索二〇〇二年五月七日星期二二〇〇二年五月七日星期二目录第章概述语音识别语音识别的应用价值语音识别的理论意义国内外发展状况本文主要工作本文内容安排第二章语音识别的基本模型语音识别的基本结构及方法的基本结构的三个基本问题的分类离散连续半连续第三章的训练方法初始码本生成聚类的基本原理及方法译码器扰动简化随机松弛聚类算法小结的训练基于的前后项训练方法溢出的分析及解决句子单元信息第四章的连续语音搜索方法连续语音的解码算法搜索算法二〇〇二年五月七日星期二静音处理方法基于时域的端点检测方法基于的音节间检测方法提高搜索速度的几种方法码本剪枝策略剪枝策略降低精度策略第五章系统与实验数据库的建立系统的实现训练程序识别程序实验和分析码本数对识别结果的影响状态数对识别结果的影响帧长对识别结果的影响系统的性能和评价第六章总结参考文献个人简历致谢二〇〇二年五月七日星期二第章概述语音识别






























1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。
