视频压缩
编辑视频压缩用于降低数字化视频信号的数据速率,使其更易于存储或传输。 可实现的压缩率通常在 1:5 到 1:500 之间。
视频压缩起源于静止图像压缩。 MJPEG 等更简单的方法可以独立压缩视频中的各个图像。 可实现的压缩率约为 1:10。进一步开发的方法还使用各个部分图像之间的相似性进行编码。 今天可以用它实现的压缩率超过 1:100,而质量几乎没有任何降低。
基础知识
编辑压缩算法基于
- 视频信号的冗余和
- 人类视觉的不足和生理影响。
减少冗余和减少不相关性这两个术语来自信息论,描述了在传输信息时减少数据量的两种不同方法。 使用一种模型,其中信息从源传输到汇。 转移到视频编码的具体案例中,源对应于原始摄像机中出现的视频图像序列,接收器对应于观看者的眼睛。
减少冗余
冗余减少使用源数据的属性来减少要传输的数据量。 在视频编码的情况下,使用图像信号的统计特性以及时间和空间相邻像素之间的相似性(相关性),以实现尽可能紧凑的表示。 可以实现从 1:2 到 1:5 的压缩系数。 由于没有信息丢失,所以称为无损编码。
帧间编码方法从已经传输的单个图像中推断估计值,因此只有估计误差仍然需要传输,用于利用时间相关性。存在空间相关性的帧内编码方法,它使用与空间周围点的估计值的差异对像素进行编码,或者识别像素跨越图像模式并更紧凑地描述它们。使用所谓的→熵编码利用统计冗余。
减少不相关
减少不相关性的目的是在传输过程中省略与信宿无关的信息。 它考虑到人类视觉感知的生理特性,并故意丢弃信息,使由此产生的干扰对人类观察者来说尽可能不显眼。 这意味着通常可以进一步压缩 1:2 到 1:50,具体取决于过程和所需的质量。 由于信息被丢弃,因此称为有损编码。
具体来说,在视频编码的情况下,这意味着只有部分图像数据通过量化传输。
由于由于眼睛的解剖结构,颜色感知的空间分辨率比亮度差异的分辨率差,因此可以降低颜色信息的分辨率,而不会在很大程度上感知到差异。 这称为颜色欠采样。 在大多数情况下,在编码之前转换为相应的颜色模型,这通常会降低 50% 的数据率。
可以利用的视觉系统的另一个属性是频率依赖性。 像声音一样,图像也可以表示为二维振动的叠加。 低图像频率导致图像结构粗糙,高图像频率导致精细细节。 不同频率范围内的干扰被感知到的程度不同,这可以用一个简单的测试图像清楚地说明。
这种频率依赖性在经过适当的转换后作为量化中的心理视觉因素被用于 MPEG 家族的所有视频压缩方法中。
基本技术
编辑视频压缩程序由几个子程序组成,即所谓的压缩工具,它们利用不同类型的冗余。 帧内预测(像素外推)的方法基于空间相邻像素之间的相关性和差分编码)和变换编码,在所谓的帧间编码中使用时间依赖性,例如运动补偿和差分编码(DPCM),最后通过熵编码减少统计冗余。
变频
在基于块的变换编码(例如使用离散余弦变换 DCT)的情况下,帧被分成正方形块,并根据它们的复杂性对其进行评估。 此步骤是必要的,以便编解码器“知道”它需要大量存储空间的(复杂)图像块以及对于哪些(简单)块,更少的位就足够了。 这是减少无关紧要的前提。
差分编码
差分脉冲编码调制 (DPCM) 通常用于利用相邻像素之间或单个图像之间的相似性:仅存储与已传输的单个图像或像素的差异。 在帧间编码的情况下,该过程由运动校正来补充。
运动校正
另一种减少数据量的方法是运动补偿。 搜索比最后一帧移动得更远的匹配图像部分。 为这些保存了一个运动矢量,非移动的矢量只是从最后一帧接管。
熵编码
使用具有可变字长的代码可以去除值序列中的统计冗余。 不是用一个恒定的码字长度对所有要传输的符号进行编码,而是将出现频率更高或出现概率更大的符号用比稀有符号更短的码字编码,算术编码方法在这里得到了xxx的传播。 然而,在某些情况下,较旧的霍夫曼编码或不太复杂的行程编码的变体仍在使用。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/341895/