基于语音识别的特征参数提取研究（最终版）

第 1 页 / 共 37 页

第 2 页 / 共 37 页

第 3 页 / 共 37 页

第 4 页 / 共 37 页

第 5 页 / 共 37 页

第 6 页 / 共 37 页

第 7 页 / 共 37 页

第 8 页 / 共 37 页

第 9 页 / 共 37 页

第 10 页 / 共 37 页

第 11 页 / 共 37 页

第 12 页 / 共 37 页

第 13 页 / 共 37 页

第 14 页 / 共 37 页

第 15 页 / 共 37 页

1、的感受并不是线性的，根据这原理，人们定义了些新的频率单位。新的频率单位的划分应该考虑到人耳听觉系统的非线性特性，而不同于物理学对频率的描述。物理上的频率以为单位，符合入耳听觉特性的频率则以为单位。新的符合人耳的听觉特性的频率分布是按临界频率分布的，临界带宽是划分频率刻度的重要依据。临界带宽的引入是为了描述窄带噪声对纯音的隐蔽效应。个纯音可以被以该纯音的频率为中心频率并且具有定频带宽度的噪声所隐蔽，这种窄带噪声对纯音的隐蔽量当加宽噪声带宽时最初是隐蔽量增大，但超过带宽后就不再增大，这带宽称为临界带宽。因此，频率又称为感知频域，是着眼于入耳听觉机理，依据听觉实验的结果来分析语音的频谱，它比其它语音特征参数更加符合人耳对频率高低的非线性心。

2、幅度语音预加重用导入波形文件后运行该文件原始语音信号样点数幅度经预加重后的语音信号样点数幅度，原始语音信号频谱频率幅度预加重语音信号频谱频率幅度求取短时能量前要先对语音信号进行加窗处理，然后再求取短时能量。程序的调用方法，原始语音波形，，加点矩形窗加点矩形窗加点矩形窗加点矩形窗，加点窗加点窗加点窗加点窗短时平均过零率的求取原始语音，求短时能量短时平均能量求出每相邻两点符号的差值的绝对值每次移动半个窗短时平均过零率短时平均过零率参数，将参数通过矢量量化神经网络进行训练，建立起了对每个单词的特征参考模板库。对测试样本经过动态时间弯折算法与参考模板匹配，统计的识别结果由表给出。样本正确数数识别率单词单词单词单词单词单词单词单词单词单词单词。

3、特点，或者说语音识别相对于其他识别，对象是结构复杂内容极其丰富的人类语音信息，因此任务更具有困难性和挑战性。我们期待着新的模型的提出来实现语音识别突破。近年来不断有对人工神经网络在语音识别中作深入研究，论文并未对这方法及。神经网络的独特优点及强大的分类能力和输入输出映射能力在语音识别领域很有吸引力，其具有自学联想对比推理和概括能力这些是隐马尔可夫模型所不具备。但训练和识别实现起来较为复杂，目前该算法仍处于实验室研究阶段。论文的语音识别工作也是刚刚起步，很多问题和结论的给出还是非常的粗糙，有的还甚至有缺陷。对后继工作的开展，方面有必要大量查阅学习资料和与他人交流，吸收已有的成果来完善自己的研究，方面对待具体问题可以进行细化，提出自己有。

4、，也提高了自身的科研能力。下面简要总结下论文的工作情况首先去找各种相关书籍上网查找资料初步了解所做课题的内容。从孤立词语音识别入手，对语音识别基础理论和体系作详细的学习和研究，特别是总结和概括了对语音识别模型的理解，从层次的角度分解了语音识别的不同应用结构无论是对语音识别的学习还是以后系统的构建，都有定的实践意义。语音识别中的前端信号预处理和特征提取工作，大部分都是参考比较成功的结论和范例，这些基础的理论对以后进步的研究和学习做到很好的铺垫。统观全文，书上的作者在对语音识别设计的结果度量方面并未给出任何结论，但是论文研究的目的并不在于对于要求识别率提高对语音识别的细节上的苛求，而是在于对语音识别理论的掌握和学习二是由于时间和实验室条。

5、近。在个准则下，使实际语音抽样和线性预测之间的差值最小来确定组预测系数。这个准则通常可以采用最小均方误差准则。那么，语音信号的线性预测是指语音信号的每个抽样值，可以用它过去的若干个抽样值的加权和来表示这个加权系数的确定原则就是使得预测误差的均方值最小。阶线性预测就是根据信号过去的个抽样值，的加权和来预测信号的当前抽样值。在语音识别系统中，系数是线性预测分析的基本参数，很少直接使用系数，而是另种由系数推导出的另种参数线性预测倒谱系数。研究表明，求倒谱可以提高参数的稳定性，它可以将语音产生模型中激励信号与声道响应信号很好的分离。它是利用同态处理法，对语音信号求离散傅立叶变换后取对数，再求反变换就能够得到。实验表明，使用倒谱参数可以提高特。

6、词单词单词单词单词单词单词单词单词平均识别率基于的语音识别图通过实验证明，参数是根据人的发声原理，从人的声音提取出能量分布谱，从中获得声纹的独特特征，它能比较彻底地去掉语音产生过程中的激励信息，主要能够反映声道静态特性，并且只需要十几个倒谱系数就能较好地描述语音的共振峰特性，计算量小，但是它对噪声的影响非常敏感，因此，影响了它对语音特征的描述。结论本次课题我做的是基于语音识别的特征参数提取研究。开始我觉得很茫然，但在老师的耐心指导下自己终于有了点眉目然后慢慢知道了要怎么去做。首先，我们去图书馆里借了很多的参考书，认真看了很多书上的内容才慢慢了解这课题。论文从开展以来，已有段时间。这段时间通过对语音识别的研究涉及，学习到了许多新的知识。

7、理感觉。实验发现，在以下，感知能力与频率成线性关系，但在以上时，主观心理感知能力与频率成对数关系，这符合人的听觉系统的频率划分应该在低频上有较高的分辨率，在高频上有较低的分辨率的特点。参数提取参数的提取分为预处理采样量化数字滤波预加重处理加窗和特征提取包含求倒谱。其过程如下图所示图参数提取过程其算法流程为原始语音采样后信号经过预加重分帧加窗等处理，得到每个帧的短时时域信号将后补若干个以形成长为般可取为的序列，再将其进行离散傅立叶变换得到线性频谱。，将上述线性频谱通过滤波器组得到频谱，并通过对数能量处理，得到对数频谱。根据前述滤波器的组成，可得到总的传递函数关系式为，将经过离散余弦变换变换到倒频谱域，即得。

8、参数。，式中为三角滤波器个数，为三角滤波器组输出的对数能量，为的阶数，即为所求的参数标准的只反映了语音参数的静态特性，而人耳对语音的动态特征更为敏感，可以用它们的差分参数来描述这种动态特性，通常将组合起作为参数。差分公式为实验仿真结果与分析实验中，对个语音信号样本取其阶的参数，仿真如图所示。横轴是各阶参数，纵轴是各阶参数对应的取值，图中显示的是对个样本进行预处理，分帧，滤波后，求取的前帧参数的情况。由图中可以看出，这几帧的特征参数的曲线在些点上非常的相似，比如第阶时。特征参数相似，在训练和识别时，就越容易将不同类别的参数分成不同的类，有利于识别结果。但是，图中也能看到有些参数并不理想，比如第阶等，参数特。

9、用的加权系数。这种能够线性预测分析最早用于语音编码中，因此常被简称为线性预测倒谱分析年，维纳首次提出了线性预测，这名词，并且在年，板仓等人将该技术应用在语音分析和合成中，开辟了语音识别技术的新思路。线性预测分析是从人的发声机理入手，通过对声道的短管级联模型的研究，认为系统的传递函数符合全极点数字滤波器的形式，时刻的信号可以用若干时刻的信号的线性组合来估计。由声学理论可知，除鼻音和摩擦音外，般声道系统可用全极点模型来模拟其中为预测器阶数，为非负实数，用于控制系统输出序列的幅度大小称为逆滤波器，其物理意义是进行反向线性预测。线性预测分析的基本思想是利用语音抽样点之间的相关性，个语音的抽样能用过去若干个语音抽样的线性组合来逼。

10、征参数的稳定性。倒谱系数倒谱系数的提出是基于人的听觉模型，是音高单位，音高是种主观心理量，是人类听觉系统对声音频率的感觉，近似公式可以表述为根据生理学的研究结果，人耳对不同频率的声波有不同的听觉灵敏度，从到之间的语音信号对语音的清晰度影响最大。低音掩蔽高音容易，反之则难，在低频处的声音掩蔽的临界带宽较高频端要小，当两个频率相近的音调同时发出时，人只能听到个音调，临界带宽就是这样种令人的主观感觉发生突变的带宽边界，刻度是对这临界带宽的度量方法之。据此，人们从低频到高频这段频带内按临界带宽的大小由密到稀安排组带通滤波器对输入信号进行滤波。将每个带通滤波器输出的信号能量作为信号的基本特征。频率对人的听觉系统的生理研究表明，人耳对声音音。

11、的原因，无法完成大量的语音采集和前期处理工作，识别结果统计缺乏客观和有效性三是目前现有汉语语音识别的语音数据库并不完整，对识别系统结果的度量缺乏统标准。实际上大多数汉语语音识别系统的训练测试语料在数据规模采样格式测试环境任务内容存在很大差异，这也是汉语语音识别所面临的难点和挑战。在这段时间对语音识别的接触，深深感受到语音识别充满的乐趣和广博。语音识别的学习是对知识应用的扩展，客观角度上，语音信号处理各种方法和理论息息相关，更多都是基于相同的模型和算法。识别的问题着眼于语音信号处理领域，既可以深入到语音理解层次，也可以平行扩展到说话人识别和语种识别，当然也可以细化到情感或状态分析等方面。而语音识别作为模式识别的个领域，鲜明的具有自身的。

12、征曲线变化较大，如果用这样的参数去训练和识别，并不利于达到好的识别效果。参数提取仿真图论文中，对组不同单词多个语音信号样本进行处理，对每个单词每人发音遍，其中遍用来做训练样本，遍用来做待识别的测试语音样本，将训练样本预加重滤波，用提取方法提取它的阶吉林大学，，吴莉莉，刘益成线性预测及其实现电声技术于明，袁玉倩，董浩，等种基于和的文本相关说话人识别方法计算机应用刘幺和，宋庭新语音识别与控制应用技术北京科学出版社，何强，何英扩展编程北京清华大学出版社张仁志，崔慧娟基于短时能量的语音端点检测算法研究电声技术附录高通滤波器幅频与相频图高通滤波器的幅频特性频率幅度，高通滤波器的相频特性频率角度窗，汉明窗时域波形样点数幅度汉明窗幅频特性归化频率。

参考资料：

[1]换热器温度控制系统课程设计（第19页，发表于2022-06-25 15:51）

[2]化工厂车间变电所及低压配电系统设计（第23页，发表于2022-06-25 15:51）

[3]滑块厚度综合检测平台控制系统硬件部分设计（最终版）（第37页，发表于2022-06-25 15:51）

[4]互联网环境下的人力资源管理研究（第33页，发表于2022-06-25 15:51）

[5]红外线遥控电灯开关设计制作（最终版）（第30页，发表于2022-06-25 15:51）

[6]横排地漏封水筒注射模设计（最终版）（第30页，发表于2022-06-25 15:50）

[7]恒温控制系统设计（最终版）（第20页，发表于2022-06-25 15:50）

[8]盒盖的塑料成型与模具设计（最终版）（第36页，发表于2022-06-25 15:50）

[9]合成三乙酸甘油酯（第27页，发表于2022-06-25 15:50）

[10]合成工艺对聚苯胺导电性能的影响（第18页，发表于2022-06-25 15:50）

[11]合成氨工艺设计（第35页，发表于2022-06-25 15:50）