1.2.10 数据压缩技术
数据压缩技术可对数据进行重新编码,减少其占用的存储空间,以便于数据传输。数据压缩是可逆的,它的逆过程称为解压缩。数据之所以能被压缩,是因为数据中存在冗余。
例如,图像数据的冗余主要表现为:图像中相邻像素间的相关性引起的空间冗余;图像序列中不同帧之间存在相关性引起的时间冗余;不同彩色平面或频谱带的相关性引起的频谱冗余。如图1-22所示,①和②两个区域中颜色相同,存在数据冗余。数据压缩的目的就是通过去除这些数据冗余来减少表示数据所需的比特数。

图1-22 图像的冗余
1. 压缩的指标
评价一种数据压缩技术的指标共有3个,即压缩比、压缩质量、压缩和解压缩的速度。
(1)压缩比。压缩比是在压缩过程中输入数据量和输出数据量之比,是衡量压缩技术性能的重要指标。
(2)压缩质量。压缩质量是指压缩后的数据在解压缩后与原始数据相比的真实程度。
(3)压缩和解压缩的速度。压缩和解压缩的速度越快越好。例如,为了保证视频的连贯性,对压缩和解压缩的速度有严格的要求,如果压缩和解压缩速度过低,视频会产生跳动感,用户难以接受。而对于静态图像,因为不需要保证其连贯性,压缩和解压缩的速度要求并不高。
2. 压缩的分类
根据压缩后数据与原始数据的一致性,压缩方法可分为有损压缩和无损压缩。
(1)有损压缩。有损压缩的解码数据和原始数据存在一定的差别,允许有一定程度的失真。有损压缩会在压缩过程中丢失一些不敏感的信息,这些丢失的信息将不能恢复,这种压缩方法不可逆。
人们观看图像、视频或听声音时,经常无法感觉到细微差别。所以,图像、视频或者音频等经常使用有损压缩方法进行数据压缩,其压缩比可以从几倍到上百倍。
(2)无损压缩。无损压缩的解码数据和原始数据完全相同,没有任何失真。
无损压缩利用了数据的统计特性进行数据压缩。它对数据进行概率统计,对出现概率大的数据采用相对较短的编码,而对出现概率小的数据采用较长的编码,从而减少数据冗余。
无损压缩的压缩比一般为2:1~5:1,主要用于文本数据、程序代码和特殊应用场合的图像数据(如指纹图像、医学图像等)。
3. 图像和音频的压缩
JPEG(Joint Photographic Experts Group,联合图像专家组)是静态图像压缩编码的国际标准,主要用于静止图像压缩,是彩色或灰度图像的压缩标准。JPEG压缩是有损压缩,适用于那些不太复杂或取自真实景象的图像压缩。它的性能依赖于图像复杂度,一般压缩比为10:1~30:1。图1-23(a)所示为压缩前的BMP文件,其大小为338KB;图1-23(b)所示为JPEG文件,其大小仅为9KB。虽然图像压缩在质量上有一定损失,但是可以缩短传输时间、节省存储空间。

图1-23 BMP文件和JPEG文件
提示
将现实世界的各种信息进行二进制的数字化编码后存储、计算和处理,将具有冗余信息的数据压缩后存储、处理和传输,是计算系统的基本思维。