帮帮文库

返回

基于语音识别的特征参数提取研究 基于语音识别的特征参数提取研究

格式:word 上传:2022-06-25 20:19:11

《基于语音识别的特征参数提取研究》修改意见稿

1、“.....这种能够线性预测分析最早用于语音编码中,因此常被简称为线性预测倒谱分析年,维纳首次提出了线性预测,这名词,并且在年,板仓等人将该技术应用在语音分析和合成中,开辟了语音识别技术的新思路。线性预测分析是从人的发声机理入手,通过对声道的短管级联模型的研究,认为系统的传递函数符合全极点数字滤波器的形式,时刻的信号可以用若干时刻的信号的线性组合来估计。由声学理论可知,除鼻音和摩擦音外,般声道系统可用全极点模型来模拟其中为预测器阶数,为非负实数......”

2、“.....其物理意义是进行反向线性预测。线性预测分析的基本思想是利用语音抽样点之间的相关性,个语音的抽样能用过去若干个语音抽样的线性组合来逼近。在个准则下,使实际语音抽样和线性预测之间的差值最小来确定组预测系数。这个准则通常可以采用最小均方误差准则。那么,语音信号的线性预测是指语音信号的每个抽样值,可以用它过去的若干个抽样值的加权和来表示这个加权系数的确定原则就是使得预测误差的均方值最小。阶线性预测就是根据信号过去的个抽样值......”

3、“.....系数是线性预测分析的基本参数,很少直接使用系数,而是另种由系数推导出的另种参数线性预测倒谱系数。研究表明,求倒谱可以提高参数的稳定性,它可以将语音产生模型中激励信号与声道响应信号很好的分离。它是利用同态处理法,对语音信号求离散傅立叶变换后取对数,再求反变换就能够得到。实验表明,使用倒谱参数可以提高特征参数的稳定性。倒谱系数倒谱系数的提出是基于人的听觉模型,是音高单位,音高是种主观心理量,是人类听觉系统对声音频率的感觉......”

4、“.....人耳对不同频率的声波有不同的听觉灵敏度,从到之间的语音信号对语音的清晰度影响最大。低音掩蔽高音容易,反之则难,在低频处的声音掩蔽的临界带宽较高频端要小,当两个频率相近的音调同时发出时,人只能听到个音调,临界带宽就是这样种令人的主观感觉发生突变的带宽边界,刻度是对这临界带宽的度量方法之。据此,人们从低频到高频这段频带内按临界带宽的大小由密到稀安排组带通滤波器对输入信号进行滤波。将每个带通滤波器输出的信号能量作为信号的基本特征。频率对人的听觉系统的生理研究表明......”

5、“.....根据这原理,人们定义了些新的频率单位。新的频率单位的划分应该考虑到人耳听觉系统的非线性特性,而不同于物理学对频率的描述。物理上的频率以为单位,符合入耳听觉特性的频率则以为单位。新的符合人耳的听觉特性的频率分布是按临界频率分布的,临界带宽是划分频率刻度的重要依据。临界带宽的引入是为了描述窄带噪声对纯音的隐蔽效应。个纯音可以被以该纯音的频率为中心频率并且具有定频带宽度的噪声所隐蔽,这种窄带噪声对纯音的隐蔽量当加宽噪声带宽时最初是隐蔽量增大......”

6、“.....因此,频率又称为感知频域,是着眼于入耳听觉机理,依据听觉实验的结果来分析语音的频谱,它比其它语音特征参数更加符合人耳对频率高低的非线性心理感觉。实验发现,在以下,感知能力与频率成线性关系,但在以上时,主观心理感知能力与频率成对数关系,这符合人的听觉系统的频率划分应该在低频上有较高的分辨率,在高频上有较低的分辨率的特点。参数提取参数的提取分为预处理采样量化数字滤波预加重处理加窗和特征提取包含求倒谱......”

7、“.....得到每个帧的短时时域信号将后补若干个以形成长为般可取为的序列,再将其进行离散傅立叶变换得到线性频谱。,将上述线性频谱通过滤波器组得到频谱,并通过对数能量处理,得到对数频谱。根据前述滤波器的组成,可得到总的传递函数关系式为,将经过离散余弦变换变换到倒频谱域,即得到参数。,式中为三角滤波器个数,为三角滤波器组输出的对数能量,为的阶数,即为所求的参数标准的只反映了语音参数的静态特性......”

8、“.....可以用它们的差分参数来描述这种动态特性,通常将组合起作为参数。差分公式为实验仿真结果与分析实验中,对个语音信号样本取其阶的参数,仿真如图所示。横轴是各阶参数,纵轴是各阶参数对应的取值,图中显示的是对个样本进行预处理,分帧,滤波后,求取的前帧参数的情况。由图中可以看出,这几帧的特征参数的曲线在些点上非常的相似,比如第阶时。特征参数相似,在训练和识别时,就越容易将不同类别的参数分成不同的类,有利于识别结果。但是,图中也能看到有些参数并不理想,比如第阶等......”

9、“.....如果用这样的参数去训练和识别,并不利于达到好的识别效果。参数提取仿真图论文中,对组不同单词多个语音信号样本进行处理,对每个单词每人发音遍,其中遍用来做训练样本,遍用来做待识别的测试语音样本,将训练样本预加重滤波,用提取方法提取它的阶吉林大学,,吴莉莉,刘益成线性预测及其实现电声技术于明,袁玉倩,董浩,等种基于和的文本相关说话人识别方法计算机应用刘幺和,宋庭新语音识别与控制应用技术北京科学出版社,何强,何英扩展编程北京清华大学出版社张仁志......”

下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
基于语音识别的特征参数提取研究.doc预览图(1)
1 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(2)
2 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(3)
3 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(4)
4 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(5)
5 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(6)
6 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(7)
7 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(8)
8 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(9)
9 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(10)
10 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(11)
11 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(12)
12 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(13)
13 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(14)
14 页 / 共 37
基于语音识别的特征参数提取研究.doc预览图(15)
15 页 / 共 37
预览结束,还剩 22 页未读
阅读全文需用电脑访问
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档