录的带噪语音信号中分离出有用的语音信号。语音激活检测是各种语音处理中必需的个重要环节,精确地确定输入语音的起点和终点将保证语音处理系统良好的性能。对于语音激活检测在语音增强中的应用,为了得到更多的关于背景噪声特性,语音端点检测更注重于如何准确的检测出无音段。般的语音激活检测是根据语音帧来进行的,语音帧的长度在不等。语音端点检测的方法可以综述为从输入信号中提取个或系列的对比特征参数,然后将其和个或系列的门限阈值进行比较,如图所示。如果超过门限则表示当前为有音段,否则就表示当前为无音段。图语音激活因录音时是立体声,故取其中的第通道的音频数据对进行点傅里叶变换原始信号波形原始信号频谱原始信号幅值原始信号相位其仿真图如图所示。前面读取的语音信号声音比较清晰,信噪比较高,用这样的信号实验对比效果不太明显。因此在进行消除噪声实验之前我们要人为的给原始信号添加随机白高斯噪声,降低语音信号的信噪比。下面是加入噪声的源代码因录音时是立体声,故取其中的第通道的音频数据设定噪声的频率为设置噪声的长度跟原语音信样长产生幅度为频率为的正弦波作为噪声将原语音信号跟噪声相加,为带有噪声的语音信号将带有噪声的语音信号转换为声音,中将有噪声下面是加噪后音频的仿真源代码因录音时是立体声,故取其中的第通道的音频数据对进行点傅里叶变换加噪后信号检测框图目前语音端点检测所采取的方法大体可以分为两类加窗分帧特征提取与阀值比较判断有无语音带噪语音第类是噪声环境下基于模型的语音信号端点检测的方法,该方法要求背景噪声保持平稳且信噪比较高。第二类方法是基于信号的短时能量进行检测的算法,它通过对背景噪声能量的统计,定出能量门限,利用能量门限来确定语音信号起始点。在这里运用语音端点检测采用了第二类方法,即基于信号的短时能量进行检测的算法。基于信号的短时能量检测具体算法如下计算每帧的语音能量式中为帧长,为帧的编号,为每帧中的各点,,为帧数然而它有个缺陷,即它对高电平非常敏感信号的二次方计算。为此,定义短时平均幅度函数来表征帧语音信号的能量大小,定义计算前帧平均噪声能量求能量最大值和能量最小值根据式确定门限本教程,并且到网上找些相关的信息。还好我有点语言的基础,学起由于基本假定是噪声信号与语音信号是加性的,和独立,所以和也独立。故。所以对个分析帧内得短时平稳过程,有因为噪声是局部平稳的,故可以认为没有语音信息是的噪声与有语音信息时的噪声功率谱是相同的,因而可以利用发语音前的寂静帧来估计噪声。由式可以得到原始语音的估计值式中,下标表示加窗信号,表示估值,则表示无语音信号时的均值。如果式中结果出现负值,则将其改为或改变符号,因为功率谱不能为负数。由式可得原始语音估值根据人耳对语音的相位变化不敏感这特点,我们可以用原带噪语音信号的相位来代替估计之后的语音信号的相位,将估计后的频域信号进行逆傅,应用谱相减法实现语音增强基本原理是通过对带噪语音谱减去噪声谱得到语音谱,因此,语音激活检测这环节非常重要,准确地确定语音的起始点和终止点对噪声谱估计有着重要的作用。改进型语音降噪处理运用端点检测技术,用仿真,可明显显示出其优越性。用仿真的流程如下对输入的语音信号进行预滤波对滤波后的语音信号进行预加重将语音信号按每帧个信号点进行分帧,帧移为对信波形加噪后信号频谱加噪后信号幅值加噪后信号相位其仿真图如图二所示。下面是噪声的仿真的源代码读取文件并返回和的值。截取语音信息前点作为噪声信号对噪声信号进行傅里叶变换取噪声功率谱绝对值取噪声相位噪声信号波形噪声信号频谱噪声信号幅值噪声信号相位其仿真的图形如图三所示。下面是利用基本谱减法降噪处理源代码,下面是利用改进的谱减法降噪处理的源代码相对更容易点,但也有不小的难度。处理宽带噪声的最通用技术是谱相减法,即从带噪语音估值中减去噪声频谱估值,从而得到纯净语音的频谱。谱相减方法是基于人的感觉特性,即语音信号的短时幅度比短时相位更容易对人的听觉系统产生影响,从而对语音短时幅度谱进行估计,适用于受加性噪声污染的语音。在这里我要感谢老师的悉心的指导,同学们的帮助,还有网上技术论坛的朋友们,没有你们我很难完成这次课程设计,我在你们身上也学到了很多东西,让我生受益。设定和的值增强后语音以为文件名保存其降噪后的仿真图形如图四所示。设计结果和仿真波形图图二图三图四参考文献程佩青数字信号处理教程清华大学出版社吴镇扬数字信号处理高等教育出版社胡广书数字信号处理导论清华大学出版社易克初田斌付强语音信号处理国防工业出版社刘保柱苏彦华张宏林从入门到精通人民邮电出版社罗军辉罗勇江在数字信号处理中的应用机械工业出版社周辉董正宏数字信号处理基础及实现北京希望电子出版社设计心得体会经过两周的数字信号处理课程设计,让我学到了很多东西。其实我刚开始看到老师给的任务要求时我很茫然,不知道该干嘛,就连选题都不知道怎么选,虽然我学了数字信号处理这门课,但也只是理论上了解点,在脑海中还是没有个实质的概念。不会做我就只有上网去找相关的资料,参考别人做的报告,看看别人是如何做的,有点启发,但还是不知道自己改选什么题目。后来我又到图书馆借阅相关书籍,也进入了图书馆的电子资源各个网站,看到了关于谱减法的相关的资料,关于降噪的相关的技术现在应该普遍在应用。我看到了,感觉比较感兴趣,于是就选了这个题目。题目选好了,但真正难的是做。这个题目是基于软件的,虽然用过,但很不熟悉,对于的编程时基本不懂,只有重新学了,又到图书馆借了里叶变换得到降噪后的语音时域信号。基本谱减法的原理图如图所示带噪语音相位增强插入相位噪声方差图基本谱减法的原理示意图改进谱减法消除噪声的原理传统的噪声估计方法是基于最优平滑和最小统计的噪声估计,还有种采用改进的算法基于语音活性检测的噪声估计算法。语音激活检测指从段包含语音信号中确定出语音的起始点和终点,又称端点检测。语音端点检测的目的就是从连续记号帧再沿度到度每隔度作变换,然后利用函数来重构骨架图像。通过图像对比可以知道,重构后的图像和原图像十分接近。,不同物质的射线人体的衰减系数分布,就能重建其断层或,图膨胀边界图又称为骨架提取,寻找二值图像的细化结构是图像处理的个基本问题。在图像识别和图像压缩中要经常用到这样的细化结构。例如,在识别字符之前,往往要对字符做细化处理,求出字符的细化结构。图边界提取以上各种操作都是形态学图像处理经常要用到的些基本操作,他们对于形态学重构有着重要的作用。所谓形态学重构就是根据幅图像的特征对另幅图像进行重复膨胀或腐蚀等操作,直到该图像的像素值不再变化为止,用来强调图像中与掩模图像中指定对象相致的部分,同时忽略图像中的其他对象。这在医学影像领域有着极其重要的作用。图像类型转换模块的实现要对幅索引图像滤波,首先必须将它转换成真色彩图像,否则要的作用。图像类型转换模块的实现在许多图像处理工作中,都对图像类型有特定的要求,比如结果是毫无意义的。在中,各种图像类型之间的转换关系如图所示图图像转换关系的图像处理工具箱提供了许多图像类型转换函数,来实现各种图像类型的转换。例如函数,该函数的功能是通过颜色抖动来增加输出图像的颜色分辨率,从而实现转换图像。该函数的调用格式如下,表示将真色彩图像按照指定的颜色映抖动成索引图像像表抖动成索引图像。表示将灰度图像抖动成二值图像。例,图二值处理因此在对图像的处理的过程中图像类型的转换变得尤为重要。该模块以索引图像灰度图像和真色彩图像之间的相互转换为例,具体实现代码如下该函数的功能是通过设置亮度阈值将真色彩索引灰度图像转换成二值图。该函数的调用格式如下分别表示将灰度图像索引图像和真色彩图像转换成二值图像,是归化的阈值,取值在,之间。本系统所采用的是第种调用格式,具体程序如下图灰度到二值转换将图像转换成索引图像,图真色彩至索引转换正交变换在图像处理技术中,图像的正交变换技术有着广泛的应用,是图像处理的重要工具。通过是在显示灰度图像时,仍然在后台使用系统预定义的默认的灰度颜色映射表。二值图像与灰度图像相同,二值图像只需要个数据矩阵,每个像素只取两个灰度值。二值图像可以采用和类型存储,工具箱中以二值图像作为返回结果的函数都使用类型。图像图像,即真彩色图像,在中存储为的数据矩阵。数组中的元素定义了图像中每个像素的红绿蓝颜色值。需要指出的是,图像不使用颜色映射表。像素的颜色保存在像素位置上的红绿蓝的强度值的组合来确定。图像文件格式把图像存储为位的图像,红绿蓝分别占位。这样可以有约万种颜色图像序列的图像处理工具箱中还支持将多帧图像连接成图像序列。图像序列是个四维的数组,图像帧的序号在图像的长宽颜色深度之后构成第四维。在中,各种图像类型之间的转换关系如图所示图图像类型间的转换第三章图像处理系统的详细设计用对图像进行处理是当前科技领域的个重要的课题,它采用的是用组有序的灰度或彩色数据元素构成图像,数组的每个元素对应于图像的个像素值。这样就可以利用其强大的矩阵计录的带噪语音信号中分离出有用的语音信号。语音激活检测是各种语音处理中必需的个重要环节,精确地确定输入语音的起点和终点将保证语音处理系统良好的性能。对于语音激活检测在语音增强中的应用,为了得到更多的关于背景噪声特性,语音端点检测更注重于如何准确的检测出无音段。般的语音激活检测是根据语音帧来进行的,语音帧的长度在不等。语音端点检测的方法可以综述为从输入信号中提取个或系列的对比特征参数,然后将其和个或系列的门限阈值进行比较,如图所示。如果超过门限则表示当前为有音段,否则就表示当前为无音段。图语音激活因录音时是立体声,故取其中的第通道的音频数据对进行点傅里叶变换原始信号波形原始信号频谱原始信号幅值原始信号相位其仿真图如图所示。前面读取的语音信号声音比较清晰,信噪比较高,用这样的信号实验对比效果不太明显。因此在进行消除噪声实验之前我们要人为的给原始信号添加随机白高斯噪声,降低语音信号的信噪比。下面是加入噪声的源代码因录音时是立体声,故取其中的第通道的音频数据设定噪声的频率为设置噪声的长度跟原语音信样长产生幅度为频率为的正弦波作为噪声将原语音信号跟噪声相加,为带有噪声的语音信号将带有噪声的语音信号转换为声音,中将有噪声下面是加噪后音频的仿真源代码因录音时是立体声,故取其中的第通道的音频数据对进行点傅里叶变换加噪后信号检测框图目前语音端点检测所采取的方法大体可以分为两类加窗分帧特征提取与阀值比较判断有无语音带噪语音第类是噪声环境下基于模型的语音信号端点检测的方法,该方法要求背景噪声保持平稳且信噪比较高。第二类方法是基于信号的短时能量进行检测的算法,它通过对背景噪声能量的统计,定出能量门限,利用能量门限来确定语音信号起始点。在这里运用语音端点检测采用了第二类方法,即基于信号的短时能量进行检测的算法。基于信号的短时能量检测具体算法如下计算每帧的语音能量式中为帧长,为帧的编号,为每帧中的各点,,为帧数然而它有个缺陷,即它对高电平非常敏感信号的二次方计算。为此,定义短时平均幅度函数来表征帧语音信号的能量大小,定义计算前帧平均噪声能量求能量最大值和能量最小值根据式确定门限本教程,并且到网上找些相关的信息。还好我有点语言的基础,学起由于基本假定是噪声信号与语音信号是加性的,和独立,所以和也独立。故。所以对个分析帧内得短时平稳过程,有因为噪声是局部平稳的,故可以认为没有语音信息是的噪声与有语音信息时的噪声功率谱是相同的,因而可以利用发语音前的寂静帧来估计噪声。由式可以得到原始语音的估计值式中,下标表示加窗信号,表示估值,则表示无语音信号时的均值。如果式中结果出现负值,则将其改为或改变符号,因为功率谱不能为负数。由式可得原始语音估值根据人耳对语音的相位变化不敏感这特点,我们可以用原带噪语音信号的相位来代替估计之后的语音信号的相位,将估计后的频域信号进行逆傅
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
第 1 页 / 共 64 页
第 2 页 / 共 64 页
第 3 页 / 共 64 页
第 4 页 / 共 64 页
第 5 页 / 共 64 页
第 6 页 / 共 64 页
第 7 页 / 共 64 页
第 8 页 / 共 64 页
第 9 页 / 共 64 页
第 10 页 / 共 64 页
第 11 页 / 共 64 页
第 12 页 / 共 64 页
第 13 页 / 共 64 页
第 14 页 / 共 64 页
第 15 页 / 共 64 页
预览结束,还剩
49 页未读
阅读全文需用电脑访问
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。
1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。