Top Banner
5 5 5.1 第第第第第第第 5.2 5.2 限限限限限限限限限 限限限限限限限限限 5.3 5.3 限限限限限限 限限限限限限 5.4 第 第 第 第 5.5 第 第 第 第 5.6 第 第 第 5.7 第第第第第第 5.8 第 第 第 第
103

第5章 信 源 编 码

Mar 15, 2016

Download

Documents

rigg

第5章 信 源 编 码. 5.1 无失真信源编码 *5.2 限失真信源编码定理 *5.3 矢量量化编码 5.4 预 测 编 码 5.5 变 换 编 码 5.6 传 真 编 码 5.7 语音压缩编码 5.8 图 像 编 码. 5.1 无失真信源编码. 离散信源的无失真编码实质上是一种统计匹配编码。信息论指出信源中的统计多余度主要决定于以下两个主要因素:一是消息概率分布的非均匀性,另一个是消息间的相关性。对无记忆信源主要决定于概率分布的非均匀性,但是,对于有记忆信源,两者都起作用,且后者相关性更加重要。. - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 第5章  信  源  编  码

第第 55 章 信 源 编 码章 信 源 编 码5.1 无失真信源编码5.2 5.2 限失真信源编码定理限失真信源编码定理5.3 5.3 矢量量化编码矢量量化编码5.4 预 测 编 码5.5 变 换 编 码5.6 传 真 编 码5.7 语音压缩编码5.8 图 像 编 码

Page 2: 第5章  信  源  编  码

5.1 5.1 无失真信源编码无失真信源编码离散信源的无失真编码实质上是一种统计匹配编码。信息论指出信源中的统计多余度主要决定于以下两个主要因素:一是消息概率分布的非均匀性,另一个是消息间的相关性。对无记忆信源主要决定于概率分布的非均匀性,但是,对于有记忆信源,两者都起作用,且后者相关性更加重要。

Page 3: 第5章  信  源  编  码

统计匹配编码是根据信源的不同概率分布而选用与之相匹配的编码,以达到在系统中传信速率最小,且满足在信宿复制时无失真或低于某一允许的失真限定值。下面,我们首先研究这类离散、无失真、无记忆信源编码的一般模型,并研究在它基础上应如何编码,从而引出定长和变长两类编码方法。

Page 4: 第5章  信  源  编  码

5.1.1 5.1.1 等长编码定理等长编码定理很多学者深入地研究了离散、随机序列信源的统计特性,仙农 (1948) 首先发现,后来麦克米伦 (1953) 和沃尔夫兹 (196

1) 进一步严格证明,这类信源具有渐近等同分割性,或简称为 A.E.P(Asymptotic Equipatition Property) 。它的基本思想是,一个总数为 nL 种的消息序列信源随着消息序列长度 L 的增长且足够大时,越来越明显产生两极分化现象。

Page 5: 第5章  信  源  编  码

可见,在差错率 Pe 和编码效率要求并不十分苛刻的条件下,对这一简单信源就需要近一百万个信源符号进行联合编码,这显然是不现实的。因此,为了解决这一个问题,人们就很自然地转向于对变长编码的研究。

Page 6: 第5章  信  源  编  码

5.1.2 5.1.2 变长编码定理变长编码定理等长编码需要取很大数量的符号一起编码,显然不现实,倘若采用变长编码,情况就大不一样了。若仍用上述最简单的离散信源的例子,作变长编码如下,至于具体编码方法后面将进一步讨论。可见,若采用上述变长码,即使采用逐位编码 (L=1) 效率可达 100% ,这里虽然是一个特例,不过一般情况下效率都可达到很高。显然它大大优于等长编码。

Page 7: 第5章  信  源  编  码

一、 码树与码字一、 码树与码字 (( 组组 )) 可分离条件可分离条件这里,引入较直观的“码树”的概念,并仍结合表 5-1-1 中的码字 ( 组 ) 来进一步解释和说明。码树是图论中的一个分支,又称为树图。码树编码法是将编码方法形象化为一棵生成的树。树有树根、树枝、节点、端点、节数,并有满树与非满树之分。

Page 8: 第5章  信  源  编  码

从图 5-1-1 上看,要构造出在接收端可分离的变长码,只要满足被选用的码字必须为异前置码。在比较简单的信源,我们可以很方便地用这种码树的方法直接且直观地构造可分离码,但是,一当信源较复杂比如信源含有很多消息 ( 符号 ) ,直接画码树就比较复杂。

Page 9: 第5章  信  源  编  码

二、 变长编码定理二、 变长编码定理有了上述讨论的基础,我们下面给出指导构造变长码的不同类型信源的信源编码定理。它给出了变长码的平均码长应该满足的条件。首先讨论单个消息 ( 符号 ) 信源的变长编码定理,它是最简单也是最基本的变长编码定理。

Page 10: 第5章  信  源  编  码

定理 5-1-4 :对于平均消息 ( 符号 )熵为 H(U) 的离散、平稳、无记忆信源,必存在一种无失真编码方法,使平均每个消息 ( 符号 ) 的信息率 R 满足不等式:

H(U)≤R < H(U)+ε其中 ε 为任意正数。

Page 11: 第5章  信  源  编  码

5.1.3 5.1.3 最佳变长编码最佳变长编码—— 哈夫曼编码哈夫曼编码

1952年,哈夫曼给出一种编码方法,所得的码字是异前置的变长码,其平均码长最短,称它为最佳变长码,又称哈夫曼码。 1956年,戈罗伯对它进行了改进,使之更便于实用。

Page 12: 第5章  信  源  编  码

其具体编码方法如下:(1) 将信源消息 ( 符号 )按概率大小顺序排队;(2) 从最小概率的两个消息开始编码,并给予

一定的编码规则,如小概率的下支路编为 1( 或 0) ,大概率的上支路编为 0( 或 1) ,若两者概率相等,仍是下支路为 1 上支路为 0;

Page 13: 第5章  信  源  编  码

(3) 将已编码的两个消息对应概率合并,并重新按概率大小排队,重复步骤 (2);

(4) 重复步骤 (3) ,直至合并概率归一时为止;(5) 编成的变长码是按后出先编方式,即从概率归一

的树根沿编码路线逆行至对应的消息,如 u3 为“ 110” 。

Page 14: 第5章  信  源  编  码

首先是误差扩散问题,由于哈夫曼码是一类无失真信源最佳变长码,这就是说在研究这类无失真信源编码时认为信道传输是理想的,是不产生差错的,然而实际信道中总是存在噪声的,噪声引入后必然要破坏变长码的结构。同时由于变长码是不加同步的码,无法自动清洗所产生的影响,所以必然要产生误差的扩散,这就是说噪声所影响的不仅是被干扰的码元,而是一直要扩散下去影响后面的一系列码元。

Page 15: 第5章  信  源  编  码

以至在低信噪比下无法正常工作。目前对这类误差扩散还没有特别有效的克服方法,在工程上一般哈夫曼码只能适合于高信噪比的优质信道,比如误码率低于 10-6 以下,以减小误差扩散所带来的影响。同时工程上还常常采用定期清洗,比如在文件和报纸传真中就采用按行清洗的方式,以牺牲编码效率来达到限制误差扩散的目的。另一种方法是加检错纠错码。

Page 16: 第5章  信  源  编  码

其次是速率匹配问题,由于绝大多数信源其消息是不等概率的,因而编成的变长码长度也是不相等的,这必然导致信源输出速率是变化的,然而在实际信道中传送的信息率是固定不变化的。这就是说信源给出的是变速的,而信道传送的则是恒速的,因而信源与信道之间必然存在一个速率匹配问题。

Page 17: 第5章  信  源  编  码

解决这一矛盾的办法,在工程上一般是采用缓冲存储器的方法。这个缓存器起到类似于水库的作用,变速输入、恒速输出。但是这个缓存器的容量的选取显然与输入变速特性即信源统计特性和编码方法,以及输出速率密切相关。容量选大了浪费设备,容量选小了则可能产生由于输入大于输出且容量不够而出现溢出现象,或输入小于输出而出现取空现象。这是一个需要在实际的工程设计中进一步深入探讨的问题。

Page 18: 第5章  信  源  编  码

第 3 个问题是与信源统计特性相匹配的问题。变长码本身就是与信源统计特性相匹配的无失真信源编码,因此信源统计特性的变化对变长码影响很大,它主要体现在下面两点。(1) 与信源消息种类多少的关系:一般变长码更适合于大的消息集,而不大适合小且概率分布相差很大的集合。小消息集只有在很特殊情况下才能实现统计匹配。

Page 19: 第5章  信  源  编  码

(2) 变长码是在信源概率特性已知情况下,实现统计匹配的。如果信源统计特性不完全知道甚至完全不知道时,如何实现编码,这是属于通用编码所要研究的问题。

Page 20: 第5章  信  源  编  码

*5.1.4 *5.1.4 算术编码算术编码算术编码是近十多年来发展迅速的一种无失真信

源编码,它与最佳的哈夫曼码相比,理论性能稍加逊色,而实际压缩率和编码效率却往往还优于哈夫曼码,且实现简单,故很受工程上的重视。

Page 21: 第5章  信  源  编  码

首先将符号按对应概率大小由大至小排列。其次,再将信源序列按照对应概率大小排

序,由于对单个消息 ( 符号 ) 信源,一个序列中仅含有一个符号,因此序列排序即为上述符号排序。

Page 22: 第5章  信  源  编  码

算术码的译码可以通过对上述编码后的数值大小的比较来进行。即判断码字 C(S)

落在哪 一个区间就可以得出一个相应的符号序列。根据公式 (5-1-29)所决定的两个相反的递推过程就能译出相应的所有符号。

Page 23: 第5章  信  源  编  码

综上所述,译码后的总输出 S*=abda=S ,它与发端所发送的符号序列安全一致。在实用的算术编码中,由于实际信源不是简单的单符号信源,即信源每次输出的不是一个符号而是一个符号序列。

Page 24: 第5章  信  源  编  码

*5.2 *5.2 限失真信源编码定理限失真信源编码定理在本章一开始我们就分析了在

很多实际信源中,特别在模拟的连续信源中,无失真要求是完全没有必要的,而且也是达不到的。所以在实际中限失真信源是具有现实意义的。

Page 25: 第5章  信  源  编  码

D(c’)≤ED(c) < D+d0e-LE(R)=D+ε

这就是我们所需要证明的结论。下面,我们简要地讨论函数 E(R) 的性质,由于 E(R)

函数主要决定于函数 E(β , P) 的性质。

Page 26: 第5章  信  源  编  码

定理 5-2-1 :若有一离散、无记忆、平稳信源其率失真函数为 R(D) ,则当通信系统的传信率 R > R(D)时,只要信源序列 L 足够长,则一定存在一种编码方式 c 使译码后失真小于或等于 D+ε ,而 ε 是任意小的正数,且当 L→∞ 时, ε→0 。反之,若 R < R(D) ,则无论用什么编码方式其译码失真必大于 D 。

Page 27: 第5章  信  源  编  码

*5.3 *5.3 矢量量化编码矢量量化编码*5.3.1 *5.3.1 最佳标量量化编码最佳标量量化编码所谓一维标量量化编码是指对单个取样值进行

独立的量化编码。即将一个连续的实数样值,分割为可进行数字化表示的有限的整数值集合。若用 Q1

表示一维标量量化编码,则有

Page 28: 第5章  信  源  编  码

Q1: R1 { vi},

其中 vi=0 , ±1 , ±2 …, , ±2m

Llyod 和 Max 在 50年代末 60年代初分别独自研究这类量化特性,并给出了在均方误差准则下的最佳量化的必要条件及相应设计方法。

Page 29: 第5章  信  源  编  码

Llyod 和 Max 是利用数学上的变分法求得上述结果的,它解决了在均方误差失真准则下当信源概率密度 p(u)已知时的一维最佳量化器的设计问题。 Llyod 在提出上述变分法求值设计的同时,又提出了很有实用价值的用实验凑试的迭代法。这种方法,在采用其他失真准则以及信源统计特性未知或是已知但很难用解析表达时,特别有用。

Page 30: 第5章  信  源  编  码

因此,一维标量最佳量化器迭代法设计步骤如下。1.设有一组起始恢复电平{ vi},同时假设初始平

均失真为 D 。输入训练数据,数据量为 NT ,将输入数据围绕{ vi}以一定失真准则作最近相邻准则群聚。

2. 计算总平均失真。

Page 31: 第5章  信  源  编  码

3. 计算各群的质心,并用它来更新恢复电平的{ vi}值。4.当{ vi}用各群的质心更新后,输入训练数据重新围

绕新的质心群聚。

Page 32: 第5章  信  源  编  码

*5.3.2 *5.3.2 矢量量化编码矢量量化编码矢量量化编码是上述一维标量量化编码的自然发展,它是 70年代末以来,随着数字技术和语音低速率编码的迫切需要而迅速发展起来,并在量化领域取得突破性进展的一项新技术,其中最有实际价值的是类似于标量量化,用实验方法基本解决了多维矢量最佳量化的设计问题,同时还不断提出很多快速搜索实现算法。

Page 33: 第5章  信  源  编  码

一、矢量量化最基本问题是计算失一、矢量量化最基本问题是计算失真度量的量化误差与设计最佳量化器真度量的量化误差与设计最佳量化器

首先讨论失真的度量,它是限失真编码的核心问题,选择失真度量是既要满足主、客观评价的要求又要在数学上易于运算与处理。

Page 34: 第5章  信  源  编  码

二、 最佳矢量量化器特性二、 最佳矢量量化器特性一个最佳的矢量量化器包括两大部分,一是通过试验迭代的群聚法形成的码本,另一个是在码本作用下的矢量量化器的

量化过程。

Page 35: 第5章  信  源  编  码

三、 最后讨论算法三、 最后讨论算法无论是码本的建立,还是具体的量化过程的实现,主要的技术实现问题在于计算量与存储量过大。一般我们称计算量的大小为时间复杂度,称存储量大小为空间复杂度,这两种复杂度一般是相互矛盾的。前者的减少往往导致后者的增大。算法研究就是提出如何减少复杂度的一些措施。

Page 36: 第5章  信  源  编  码

1. 1. 基于全搜索的快速算法研究基于全搜索的快速算法研究可以用不同方法来加快搜索速度,比如投影法、超立方体法、最小最大法等,均可以加快搜索到编码的码字,若原来的码本是最佳的,就可以得到失真最小的连续信源编码。

2. 2. 准最佳码本结构的快速算法准最佳码本结构的快速算法属于这一类型的有树型结构法、分维量化、分级量化和乘积量化等方法。

Page 37: 第5章  信  源  编  码

5.4 5.4 预 测 编 码预 测 编 码5.4.1 5.4.1 预测编码的基本原理预测编码的基本原理

对于有记忆信源,信源输出的各个分量之间是有统计关联的,这种统计关联性可以加以充分利用,预测编码就是基于这一思想。它不是直接对信源输出的信号进行编码,而是将信源输出信号通过预测变换后再对信源输出与被预测值的差值进行编码,其原理图见图 5-4-1 。

Page 38: 第5章  信  源  编  码

图 5-4-1 预测编码原理图

Page 39: 第5章  信  源  编  码

进一步,若变换是线性的则预测变换器可按下列原理进行分解,得如图 5-4-2所示原理图。

图 5-4-2预测编码原理方框图

Page 40: 第5章  信  源  编  码

从上述预测编码原理可以看出,实现预测编码要进一步考虑下列 3 个方面的问题:

(1) 预测误差准则的选取;(2) 预测函数的选取;(3) 预测器输入数据的选取。

Page 41: 第5章  信  源  编  码

关于预测误差准则的选取,它是指预测误差所依据的标准,目前大致可采用下列 4 种类型准则:

最小均方误差 (MMSE)准则;功率包络匹配 (PSEM)准则;预测系数不变性 (PCIV)准则;最大误差 (ME)准则。

Page 42: 第5章  信  源  编  码

5.4.2 5.4.2 预测编码的基本类型预测编码的基本类型预测编码特别是线性预测编码已在信息与通信系统的信息处理中被广泛地采用,其中最常用的有下列几种。

一、 一、 DPCMDPCM 型型DPCM 即差分脉码调制,其工作原理如图 5-4-3所示。

Page 43: 第5章  信  源  编  码

图 5-4-3 DPCM 型原理图

Page 44: 第5章  信  源  编  码

二、 二、 ΔPCMΔPCM 型型ΔPCM 的工作原理图如图 5-4-5所示。

图 5-4-5 ΔPCM 型原理图

Page 45: 第5章  信  源  编  码

三、 噪声反馈编码三、 噪声反馈编码 ((NFC)NFC) 型型它是 ΔPCM 的改进型,其原理如图 5-4-6所示。既然 ΔPCM 型中由于量化器位于反馈环外,

量化误差不能像 DPCM那样进行反馈压减,那就不妨在 ΔPCM 型基础上加以改进。

Page 46: 第5章  信  源  编  码

图 5-4-6 噪声反馈编码型原理图

Page 47: 第5章  信  源  编  码

四、 预测误差门限型四、 预测误差门限型预测原理可以引用图 5-4-7 说明。

图 5-4-7 零阶预测误差门限

Page 48: 第5章  信  源  编  码

5.5 5.5 变 换 编 码变 换 编 码众所周知,信源序列往往具有很强的相关性,

要提高信源的效率首先要解除信源的相关性,解除相关行可以在时域上进行,这就是上节中介绍的预测编码,也可以在频域,甚至于广义频域 ( 或空域 )内进行,这就是要在本节中介绍的域变换编码。

Page 49: 第5章  信  源  编  码

5.5.1 5.5.1 正交变换的基本数学知识正交变换的基本数学知识5.5.2 5.5.2 几种主要变换编码几种主要变换编码

下面,我们首先寻求最佳的正交变换。众所周知,所谓最佳是指在一定的条件即准则下的最佳,而这些准则有客观的也有主观的,我们这里是按照客观的统计上最小均方误差准则 (MMSE)寻求最佳的正交变换。

Page 50: 第5章  信  源  编  码

K-L 变换虽然在均方误差准则下是最佳的正交变换,但是由于以下两个主要原因,实际中很少采用。首先,在 K-L 变换中,特征矢量与信源统计特性密切相关,即对不同的信源统计特性 Φu ,应有不同的 ai 值,才能达到最佳化,这显然是不大现实的。其次, K-L 变换运算很复杂,而且目前尚无快速算法。所以很少实际应用,通常仅作为理论上参考。

Page 51: 第5章  信  源  编  码

所谓准最佳变换是指变换后的协方差矩阵是近似对角线矩阵。由线性代数的相似变换理论,任何矩阵都可相似于约旦 (Jordan)标准型所构成的矩阵。若 U 表示信源的消息矩阵, X 表示变换后的信号矩阵,在一般情况下有:正变换: X=AUBT逆变换: U=ATXB

Page 52: 第5章  信  源  编  码

1.1. 离散付氏变换离散付氏变换 ((DFT)DFT)2.2. 离散沃尔什离散沃尔什

——哈达玛变换哈达玛变换 ((WHT)WHT)由于沃尔什 (Walsh) 与哈达玛 (Hardmard)矩阵有很多类似之处,比如,首先它们都是仅有 1 与 -1 作为元素的方阵,其次变换运算只有加、减,没有乘、除运算。而且这两类矩阵之间的关系是个简单的矩阵初等变换关系。

Page 53: 第5章  信  源  编  码

3. 离散哈尔 (Haar) 变换,简记为 HrT 。它是一类非正弦型离散正交变换。4.斜 (Slant) 变换,简记为 ST 。斜变换是专门针对电视信号编码设计的,考虑到亮度逐渐改变,希望能引入一个斜基矢量作为正交矢量系的一个矢量。这里的斜基矢量是由均匀阶梯梯降分量构成。

Page 54: 第5章  信  源  编  码

5.5. 离散余弦变换离散余弦变换 ((DCT)DCT)前面离散傅氏变换中引入了复数,这给运算带来了一些不方便,离散余弦变换 (DCT)正是针对这一缺点作出的进一步改进。根据 DFT的公式 (5-5-40) 、 (5-5-41) ,只需将信源的数据长度扩展两倍,并保证对称性就可求得DCT 。

Page 55: 第5章  信  源  编  码

*5.5.3 *5.5.3 小波变换编码小波变换编码小波变换编码方法具有如下特点。(1) 由于小波变换编码可以充分利用小波分析的良好时 (空 )频局域性,具有与人眼主观视觉特性相匹配的多分辨率分析能力,分解后的各系数分布相对平稳,且具有天然增式数据结构的特点,很容易获得高效率的压缩。

Page 56: 第5章  信  源  编  码

(2) 在小波变换编码中图像是作为一个整体被传送的,而不像传统的 DCT 编码中将图像分解为 8×8像素块来处理与传送,因此不会产生方块效应。

(3) 小波变换编码、译码的计算复杂度相对较低且具有对称性,它可以用软件实时或准实时实现,实用性较强。

Page 57: 第5章  信  源  编  码

5.6 5.6 传 真 编 码传 真 编 码本节,首先从传真编码开始,而紧接着则分别讨论最常使用的语音编码与图像编码。传真按其所传送的内容可分为文字传真和图像传真,前者只有黑、白两个灰度级,例如文件、报纸、表格、手写体字、图纸和气象图等。后者则有比较丰富的灰度的图片、图像,例如相片、 X光底片、卫星遥感图像以及其他图像等。

Page 58: 第5章  信  源  编  码

5.6.1 5.6.1 文件传真的基本特性文件传真的基本特性一、 一般规定与统计特性一、 一般规定与统计特性国际电报电话咨询委员会 (CCITT) 从大量的国际文件

传真资料中精选出了 8 种试验用的标准文件样本,分别称为1 号至 8 号样张。其样张的选取是根据传送的内容、形式、字号以及文字的疏密等等条件。

Page 59: 第5章  信  源  编  码

二、 游程编码二、 游程编码 ((RLC)RLC)对于二值灰度的文件传真,每一行总是由若干个连“ 0”(白色像素长度 ) 、连“ 1”(黑色像素长度 )组成。它们分别称为白游程长和黑游程长,且两者是交替发生,不同的白游程长度有不同的对应概率,不同的黑游程长度有不同的对应概率,这些概率称为游程发生概率。

Page 60: 第5章  信  源  编  码

*5.6.2 *5.6.2 三、四类传真机的实三、四类传真机的实 用化压缩编用化压缩编码码一、 三类传真机的修正哈夫曼编码一、 三类传真机的修正哈夫曼编码二、 四类传真机的改进二、 四类传真机的改进 READREAD 码码三类传真机的修正哈夫曼码是属于一维编码,即只能允许利用文件传真一个扫描行内的统计特性而进行的最佳变长码。

Page 61: 第5章  信  源  编  码

三、 三、 JBIGJBIG 标准标准国际标准化组织 (ISO) 对于二值图像 ( 传真图像 ) 以及不具有灰度 值 的黑白图像制 定 了 JBIG标准 (Joint Bilevel Image

Group) 。JBIG 采用无失真信源编码压缩技术,其压缩比一般要比目前文件传真机采用三类 (G3)四类 (G4) 高, JBIG 的编码器可以分解为 D 个相同的差分编码器串联,其中最后一个称为底层编码器,称 D 为累进参数,可任意选择,一般 D=4 ~ 6 。

Page 62: 第5章  信  源  编  码

5.7 5.7 语音压缩编码语音压缩编码众所周知,语音压缩编码可划分为 3 大类型:波形编码、参量编码和混合编码。波形编码的目的是在接收端企图恢复发端原语音的波形,并以波形的保真度即自然度为主要度量指标。

Page 63: 第5章  信  源  编  码

参量编码不同于波形编码,它主要以跟踪波形产生的过程且仅传送反映波形产生的主要变化参量,并且这些参量在收端根据语音产生过程的机理以恢复语音。它又称为声码器,其主要度量指标是可懂度。混合编码则介于波形编码与参量编码之间,即在参量编码的基础上,引入了一定的波形编码的特征,以达到改善自然度的目的,所以它一般也称为软声码器。

Page 64: 第5章  信  源  编  码

表 5-7-1给出了语音质量 ( 信噪比 ) 与 R(D) 值以及压缩倍数之间的关系。它是理论上的最保守的估计值,原因有二:第一,上述计算是按正态分布计算的,信息论指出一切形式分布 (包括实际语音分布 ) 的实际R(D) 值均小于正态分布的 R(D) 值;第二,上述计算未计入主观因素,若进一步考虑到实际的主观因素,其R(D) 值还可以进一步减小。

Page 65: 第5章  信  源  编  码

下面简要介绍这 4 个参量。(1) 比特率 (bit/s) :它是度量信源压缩率和通信系统有效性的主要技术指标。(2) 话音质量:度量话音质量是一个非常困难的问题,目前国际上流行利用一种主观的综合评分 MOS 方法。(3) 复杂度:一般话音编码可采用数字信号处理器 DSP 或

FPGA 来实现。(4) 时延,时延对于实时通信的话音是一个很重要的技术指标。

Page 66: 第5章  信  源  编  码

5.7.1 5.7.1 波形编码波形编码 ADPCMADPCM 基本原理基本原理自适应差分脉码调制 (ADPCM) 是在差分脉码调制 (DPCM) 的基础上发展起来的。从图中可以看出,编码器的输入信号为 PCM 码 c

′(n) ,经过 PCM/线性码转换,将八位非线性 PCM 码变换成 12 位线性码 x(n) ,而 16电平自适应量化器把差值信号 d(n) 转化成 4 位二进制码 c(n) 。

Page 67: 第5章  信  源  编  码

5.7.2 5.7.2 参量编码的线性预测参量编码的线性预测编码器编码器 LPCLPC参量编码的出发点在于跟踪波形的产生过程,而不是传输波形本身,它传递的是反映那一过程变化的参量。

图 5-7-4 语音产生模型

Page 68: 第5章  信  源  编  码

图中 u(n) 是波形产生的激励参量, c(n)

是输出的语音。而线性时变滤波器的系数则可以通过线性预测等技术获得。

Page 69: 第5章  信  源  编  码

图 5-7-5 线性预测 LPC 编译码方框图

Page 70: 第5章  信  源  编  码

图中给出了 LPC 系统的基本结构以及提取LPC参量的方法,语音参量取得后就直接将它们量化编码传送出去,这种直接递归算法对于系数变化十分敏感,很容易造成系统不稳定。

Page 71: 第5章  信  源  编  码

5.7.3 5.7.3 混合编码的各类方法混合编码的各类方法一、 改善一、 改善 LPCLPC 声码器质量的声码器质量的 一般途一般途径径

从线性预测角度看,自适应预测编码 (APC)( 见图 5-7-6) 与 LPC声码器同属一类。但前者是波形编码,后者是参量编码。

Page 72: 第5章  信  源  编  码

图 5-7-6自适应预测编码 (APC)示意框图

Page 73: 第5章  信  源  编  码

二、 余数激励声码器二、 余数激励声码器 ((RELPCRELPC))RELPC 是将余数低频谱中的一小部分 ( 基带余数信

号 )所携带的激励信息传送给收端,它避免了清、浊音判决及基音提取,可见它是在 LPC声码器基础上发展起来的,它是一种混合编码的方法,在接收端,用高频再生技术来恢复完整的余数信号,其实现方框图见图 5-7-7 。

Page 74: 第5章  信  源  编  码

图 5-7-7 RELPC原理方框图

Page 75: 第5章  信  源  编  码

三、 多脉冲预测编码三、 多脉冲预测编码 MPLPCMPLPC

MPLPC 是在一般线性预测声码器基础上发展起来的,它是通过改善声码器中接收端激励信号来提高语音质量,如图 5-7-8所示。

Page 76: 第5章  信  源  编  码

图 5-7-8 MPLPC原理方框图

Page 77: 第5章  信  源  编  码

*5.7.4 *5.7.4 低延迟码激励线性低延迟码激励线性 预测预测((LD-CELPLD-CELP)) 编码器编码器

与常规 CELP 相比, LD-CELP 有如下重要改进:(1) 采用一个高阶 (50阶 ) 的 LPC预测器与

LPC 分析的反向自适应,并删除了基音预测器;

Page 78: 第5章  信  源  编  码

(2) 通过一个自适应对数增益预测器实现激励增益的反向自适应;(3) 采用新的混合加窗用于后向 LPC 分析;(4) 采用很小矢量长度和伪格雷码序号分配的闭环优化激励码本;(5) 调整感知加权滤波器和自适应后置滤波器以用于 3级非同步级联。

Page 79: 第5章  信  源  编  码

5.7.5 5.7.5 共轭结构——代数码共轭结构——代数码 激励线性预测激励线性预测编码器编码器CS—ACELP(Conjugate Structure-Algebraic CELP) 算法 ,

是 ITU-T(原为 CCITT)GF1995年批准的 8kbit/s语音编码标准(G729) 。 它 是 继 64kbit/s PCM (G711) 、 32kbit/s ADPCM(G721) , 后 修 订 为 G7.26 以 及 16kbit/s CD-CELP(G.728) 之后的又一个电话频段 (3.4kHz)语音编码国际标准。

Page 80: 第5章  信  源  编  码

CS—ACELP算法可用单个 DSP芯片实现,其复杂度为 20MIPS 。通过对 CS—ACELP 编码器的主观观测方式表明,其语音质量在无错和信道有错条件下都等价于 32kbit/s ADPCM 的质量。

Page 81: 第5章  信  源  编  码

5.7.6 5.7.6 第三代移动通信中的第三代移动通信中的 语音编码语音编码一、 增强型可变速率一、 增强型可变速率 EVRCEVRC 语音编码语音编码

EVRC(Enhanced Variable Rate Cocle) 是由美国电信工业协会 TIA 于 1996年提出用于宽带扩频,比如CDMA2000 系统语音编码。其算法已被 IS-127标准指定采用,它是一种可变速率语音编、译码算法。

Page 82: 第5章  信  源  编  码

EVRC算法它由高通滤波、噪声去除、模型参数( 主要是线性预测系数或称为共振峰参数 )估计、编码速率确定、参数编、译码 (包含 LSP参数量化 )5 个模块构成。

Page 83: 第5章  信  源  编  码

二、 自适应多速率语音编码(二、 自适应多速率语音编码( AMRAMR ))AMR 是第三代移动通信中 WCDMA 优选的语音编码方案。其基本思想是联合自适应调整信源和信道编码模式来适应当前信道条件和业务量大小。 AMR 编码自适应有两个方面:信道与信源,对于信道模式还有两种选择全速率( FR ): 22.8kbit/s 和半速率(HR ) 11.4kbit/s; 对于

FR 和 HR 信道模式分别各有 8 种和 6 种编码模式。

Page 84: 第5章  信  源  编  码

AMR 的 8 种编码速率都以自适应码本激励线性预测编码 ACELP技术为基础,采用 10阶线性预测短时合成滤波器来实现,下面我们给出 AMR原理框图,见图 5-7-12 。

Page 85: 第5章  信  源  编  码

图5-7-12 AM

R

实现原理框

Page 86: 第5章  信  源  编  码

5.8 5.8 图 像 编 码图 像 编 码图像的信息量远大于语音、文字、传

真,占用频带也最宽,这给传输、处理、存储都带来很多困难,所以图像编码既非常必要又非常困难。

Page 87: 第5章  信  源  编  码

根据用户对数字图像业务的不同要求,图像编码大致可划分为静止型和活动型两大类。对于活动型图像编码目前已有下列不同类型业务的需求,其中有些已正式产品商业化。· 可视电话: 19.2~ 28.8kbit/s ;·桌上视频: 56~ 128kbit/s ;·会议电视: 56~ 2Mbit/s ;·交互式广播电视: 1.5~ 15Mbit/s ;· 高清晰度电视 (HDTV) : 15 ~ 25Mbit/s 。

Page 88: 第5章  信  源  编  码

5.8.1 5.8.1 静止图像压缩编码及静止图像压缩编码及 其技术标其技术标准准 JPEGJPEG

在实际系统中,比如新闻图片、医疗图片、卫星图片以及图像文献资料等均属于静止图像,对这类静止图片进行压缩,对传输和存储都具有重要的应用价值。

Page 89: 第5章  信  源  编  码

(1) 压缩 100倍:即将 16bit/Pixel压缩到 0.15bit/Pixel ,对这类高压缩比,压缩后图像仍可识别, 并可满足某些应用;

(2) 压缩 64倍:即将 16bit/Pixel压缩到 0.25bit/Pixel ,对这类较高压缩比,压缩后图像质量较好,可选定多数应用;

Page 90: 第5章  信  源  编  码

(3) 压缩 20倍:即将 16bit/Pixel压缩到 0.75bit/Pixel ,对这类一般压缩比,压缩后图像质量很好,可满足大多数应用;

(4) 压缩 10倍:即将 16bit/Pixel 压缩到 1.5bit/Pixel ,对这类较低压缩比,压缩后图像质量已看不出与原始图像的差异。

Page 91: 第5章  信  源  编  码

一、 基于一、 基于 DPCMDPCM 的无失真编码系统的无失真编码系统无失真编码又称为可逆编码,是一种保持信息不产生失真的编码,其压缩比较低一般为 4倍左右。

二、 二、 DCTDCT 的限失真编码系统的限失真编码系统它属于不可逆压缩编码,是以离散余弦变换DCT 为基础,并辅以量化的熵编码。它可以用较少的比特数获得较好的图像质量 (正如前面所阐述的 4 类压缩与相应质量 ) ,它是 JPEG标准的主流和基础。

Page 92: 第5章  信  源  编  码

JPEG 基本系统编码器框图如图 5-8-2(a)所示,译码器框图如图 5-8-2(b)所示。在其系统框图中熵编码既可用哈夫曼码也可采用算术编码; DCT 的交直流分量编码方式是不同的;编译码器所采用量化表和码表必须一致;彩色图像应按亮度和色亮比例分量输入,然后对其压缩一起输出。

Page 93: 第5章  信  源  编  码

5.8.2 5.8.2 面向通信的视频压缩面向通信的视频压缩 编码编码及其技术标准及其技术标准 HH.261.261图中编码的关键步骤是 :(1) 通过运动估值器计算运动矢量进行运动补偿的帧间预测,以消除图像在时间域内的相关性;

Page 94: 第5章  信  源  编  码

(2) 将经帧间预测后的误差值进行 8×8像素的离散余弦变换DCT ,以消除图像在空间域内的相关性;(3) 然后对 DCT 系数进行自适应量化,以充分利用人眼视觉生理特性;(4) 再利用哈夫曼变长的熵编码,实现统计匹配编码;(5) 最后采用输出缓冲存储器,以实现平滑数码流,达到保持输出码率恒定的目的。

Page 95: 第5章  信  源  编  码

图像帧编码模式分为 3 类。I帧:采用帧内方式编码的图像帧;P帧:采用帧间方式编码的图像帧, P帧是由 I帧或前面的 P帧进行运动的估值补偿后,再对预测误差进行编码;B帧:是双向内插帧,它本身不经过编码传输,而是在译码端直接由 I帧或 P帧或者 P帧与 P帧插值得到。

Page 96: 第5章  信  源  编  码

H.261标准还对数据结构作了明确定义,以防止接收端译码时出现二义性。

H.263视频信源编码算法的基本结构来自 H.261 ,其目标就是提供比H.261 有很大改进的图像质量。

Page 97: 第5章  信  源  编  码

H.263 具有块运动补偿能力,以实现改进的帧间预测。块运动补偿的主要原理是,当预测块取自前一帧不同位置时,可以改进帧间预测。

H.263 信源编码器可用 5 种标准化格式工作,即 Sub-QCIF,QCIF,CIF,4CIF 和 16CIF ,其中后 3 种格式为可选择的。

Page 98: 第5章  信  源  编  码

5.8.3 5.8.3 活动图像压缩编码及活动图像压缩编码及 其技术标准其技术标准MPEGMPEG国际标准化组织 ISO 和图像电工委员会 IEC 于 1988年正式成立了 一 个 研 究活动图像的专家组 (Moving Picture Experts

Group,MPEG) 。 最初工作 是拟建立 1.5Mbit/s 、 10Mbit/s 和40Mbit/s , 3 种 码 率 的 国 际 标 准 , 又 称 为 :MPEGⅠ、 MPEGⅡ、 MPEGⅢ,后因为 MPEGⅢ的功能完全可由MPEGⅡ所涵盖,没有形成任何正式文件于 1992年被取消。

Page 99: 第5章  信  源  编  码

与 H.261标准相似, MPEGⅠ标准图像帧也分为 3 类:I帧:即帧内编码帧,与 H.261帧编码方框相同;P帧:即前向预测编码帧,亦以 H.261帧编码方法相同;B帧:即双向预测编码帧, B帧插于 I帧和 P帧或 P帧

和 P帧之间, B帧由前后相邻部分 I帧和 P帧或 P帧和 P帧运动补偿后,再对其补偿误差进行 DCT 变换编码。

Page 100: 第5章  信  源  编  码

*5.8.4 *5.8.4 第二代视频编码第二代视频编码综上所述,以 MPEG-Ⅳ 为代表的第二代视频编码具有如下特点。( 1)图像处理对象由以像素块、像素帧为主体,变换成以音频 /视频( AV)组合内容的分解与合成为主体,比如背景、人脸、声乐、文字等。

Page 101: 第5章  信  源  编  码

( 2)视频编码基础以单一的信源统计特性,改变为既有统计特性,又有主观与瞬时特性。( 3)具有交互性、可编辑性、可选择性等一系列面向用户、面向对象的可操作特性。( 4)对不同对象可采用不同等级保护与容错措施,以提高图像总体容错能力。( 5)具有时间、空间可伸缩性(尺度变换),允许译码器以不同空、时精度重建图像。

Page 102: 第5章  信  源  编  码

基于分析编码方案,所谓分形是指用一种动态、全局观点考察图像信号的模型、比较适合于非线性的复杂图像模型也是这些年来异军突起的一类图像编码方法,它主要考虑了自然景物图像的自相似性。除了 3 类主要编码方案以外还有基于语义的编码方案等就不一一赘述。

Page 103: 第5章  信  源  编  码

从 MPEG-Ⅳ 的结构上看,其视频码流提供了对视频场景的分层描述,它至上而下大致可分为 5层:视频对象序列 VS 、视频对象 VO 、视频对象层VOL 、视频对象平面组 GOV 和视频对象平面 VOP 。其中 VOP 是基本单元,一个普通的视频帧可以用矩形 VOP 表征,它是一个具有任意大小的二维对象。一幅图像可以由许多VOP叠加组成,每一个 VOP 是一个独立可操作的单元。