您现在的位置：毕业论文 >> 论文 >> 正文

基于子带结构带宽可伸缩语音编码器的研究第4页

更新时间：2008-3-4: 来源：毕业论文

线性预测分析的基本原理是语音信号的每个取样值能够用过去若干个取样值的线性组合（预测值）来逼近^[3][4]。当实际语音样本值和线性预测样本值之间差值的平方和达到最小值(即按照最小均方误差法进行逼近)时，就能够唯一地确定一组预测参数，即线性组合中所用的加权系数。

线性预测分析采用线性预测误差滤波器来实现，线性预测误差滤波器的传递函数为：

A(z)=1- （2-3）

其中p为预测系数， i=1,…p，为线性预测器系数。

线性预测误差滤波如图2.5所示：若图片无法显示请联系QQ752018766

图2.5 线性预测误差滤波

e(n)=s(n)- (n)=s(n)- （2-4）

其中， (n)= 称作s(n)的预测值，输出e(n)是真值s(n)和线性预测值 (n)之差，称为线性预测误差。线性预测分析实质上是设计一上预测误差滤波器，就是求解预测系数使得预测误差e(n)在某个预定的准则下最小。一般理论上是采用均方误差最小准则。为了实际计算的方便，一般用求时间平均代替计算中的求集合平均，这时如公式(2-5)。

＝ (2-5)

对于一个特定的语音序列，取决于p和各个系数。设最佳预测阶数为 =p，最佳预测系数应为 =a_i。i=1~p₀按照全极点模型s(n)如公式(2-6)。

S(n)= +Ge(n) (2-6)

则如公式(2-7)所示。

＝＝ (2-7)

其中：f(n)= g(n)=Ge(n)。

这样，可以得到如公式(2-8)所示。

(2-8)

考虑e(n)是白噪声的情况，这时序列e(n)的各个样点值相互统计独立。由此不难导出f(n)和g(n)相互统计独立，因此＝0。是不随预测阶数p’和预测系数a_i变化的。 0的情况。而实现这一点的充分必要条件是下列两项中的任意一项成立。(1) =p, =a_i,i=1~p (2) >p, =a_i,i=1~p, =0,i=(p+1)~ 当s(n)由非理想模型产生，而用一个全极点模型来估计其参数时，只能说是用此理想模型来逼近实际的模型。在此情况下无所谓远产生模型的实际结束p应等于何值，此时提高p值总可以改善逼近效果。但是在实际运算中, P 值增加到一定程度以后, 的降低就很微弱了。进一步增加P 值不但大大增加运算量, 而且由于有限字长的影响, 参数估计效果反而变坏。在语音信号处理时, 模型阶数P 一般选在8～ 12 之间, 预测阶数 = P。在给定预测阶数 =p的条件下，由式(2-2)和式(2-3)，求一组最佳系数，i=1~p,使达到最小。首先，可以写成如公式(2-9)。

＝

＋ (2-9)

式(2-9)右侧有p个变量：a₁~a_p,令对这p个变量的偏导数为0，可以得到p个方程，所得到的p个解就是使达到极小的一组最佳预测系数 ~ ,求对a_k的偏导数就可以得到这p个方程如式(2-10)所示。

＝0，k=1,2,...p (2-10)

导出：2{ }

可以将这p个方程写成如公式(2-11)形式：

(2-11)

这称为一组LPC正则方程，其中是由输入语音序列决定的。因此求的问题可以归结为对一组p个线性联立方程求解的问题。可以采用自相关法、协方差法等方法进行求解。

2.5语音信号的矢量量化

矢量量化编码是近年来图像语音信号编码技术中流行的一种新型量化编码方法。它按照每组K个数据对处理数据序列分组，这样每组数据构成一个K文矢量，然后以K文矢量为单位进行量化，因此称为矢量量化。它与标量量化每次仅处理一个采样数据有着很大的区别。

矢量量化^[4][5]（Vector Quantization, VQ）是20世纪70年代后期发展起来的一种数据压缩技术，也可以说是仙农信息论在信源编码理论方面的新发展。矢量量化是将若干个幅度连续取值的时域采样信号分成组，构成矢量，然后用若干个离散的数字值来表示各种矢量。矢量量化之所以能压缩数据，是由于它能去掉冗余度，且能有效地利用矢量各分量间的四种相关的性质：线性依赖性，非线性依赖性，概率密度函数的形状及矢量文数。

2.5.1矢量量化的基本原理

矢量量化^[3]是一种限失真编码，其原理仍可用信息论中的率失真函数理论来分析。而率失真理论指出，即使对无记忆信源，矢量量化编码也总是优于标量量化。利用矢量量化，编码性能可任意接近速率-失真函数，其方法是增加矢量的文数k。在实际应用中，速率-失真函数常常作为一个理论下限与实际编码速率相比较，分析系统还有多大的改进余地。

矢量量化的基本过程是将语音信号波形的k个样点的每一帧或有k个参数的每个参数帧构成文欧氏空间的一个矢量，然后对此矢量“集体”量化。

量化的基本原理是将k文无限空间划分为M个区域边界，然后将输入信号的矢量与这些边界进行比较，并被量化为“距离”最小的区域边界的中心矢量值。而量化过程中产生的主要问题是：

（1）如何划分M个区域边界：需要用大量的输入信号矢量，经过统计实验才能确定，此过程称为训练或是建立码本。方法是将大量的信号波形帧矢量或参数帧矢量进行统计划分，进一步确定这些边界对应的中心矢量值得到的码本。

（2）如何确定两矢量比较时的测度：此测度是两矢量间的距离，或以其中的某个矢量为基准的失真度。失真测度是指输入矢量用码本所对应的矢量表征时所付出的代价。

语音信号矢量量化的原理如图2.6所示。每输入一个含有N个样本的语音帧（或含有N个参数的参数帧）构成的N文输入矢量X，就输出一个与之对应的K文Y_jmin是X的重构矢量。K可以等于N，也可以不等于N，最简单的情况是K=N。当Y_jmin是对一帧语音进行各种变换或分析后得到的矢量，这K往往远远小于N。

图2.6 矢量量化原理框图若图片无法显示请联系QQ752018766

2.6语音编码技术分类

语音编码主要有三大类，分别为波形编码、参数编码和混合编码。波形编码直接对语音信号的波形进行编码，一般码率较高，语音重构质量佳，但它随着码率的降低语音质量将严重下降。

2.6.1波形编码

波形编码方式的最简单形式是均匀脉冲编码调制(Pulse code modulation ),简称PCM)。它是用同等的量化级数进行量化的，即采用均匀量化这种方式将语音变换成与其幅度成正比的二进制序列，而二进制数值往往用脉冲表示并用脉冲对采样幅度进行编码，故称为脉冲编码调制。这种方式完全没有利用语音的性质所以信号没有得到压缩。这种编码方式的特点是适应能力强、重建语音的质量高，例如PCM、 M、ADPCM和自适应预测编码(APC)、子带编码(SBC)及自适应变换编码(ATC)等均属于这一种。但这种方式所需的编码速率较高，在16kbit/s~64kbit/s速率范围能得到较高的重建质量，而当速率进一步降低时，语音重建质量就会急剧下降。

上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>

基于子带结构带宽可伸缩语音编码器的研究第4页下载如图片无法显示或论文不完整，请联系qq752018766

上一篇文章：单片机智能温度计设计

下一篇文章：智能数字控制系统

基于子带结构带宽可伸缩语音编码器的研究 第4页

2.5语音信号的矢量量化

2.5.1矢量量化的基本原理

2.6语音编码技术分类

2.6.1波形编码

基于子带结构带宽可伸缩语音编码器的研究第4页