多视角分布式视频编码在对视频信号进行压缩(编码)时,遵循的是经典的Shannon /Nyquist定理。而最近将稀疏重建应用于视频信号的压缩过程,取得了远远优于Nyquist采样定理的性能,相关技术代表了目前的发展方向。事实上,信号的稀疏重建是通过求解一个特征值问题来重建信号,以实现对稀疏三角多项式非零幅度及其频率的计算。B.F.Logan 的研究工作表明,只要信号的稀疏程度足够大,采用L1 范数最小化即可对稀疏信号进行有效的重建。基于这个原理,Candes提出了压缩感知理论,该理论已证明: 对变换域中的稀疏的视频信号,完全可以通过结合观测数据及其对应的优化方法即可对该稀疏信号重建[15]。从而可以在采样速率远低于奈奎斯特(Nyquist)采样定理的情况下完成视频信号的重建,显著提高解码效率。
10.1.2.1 观测矩阵的设计
一般来讲,稀疏重建方法的本质不过是将信号转换为与稀疏矩阵非一致的观测数据。因此,在近年的研究工作中,观测矩阵的设计与选择成为一个首要的问题。对此,文献[16]研究了观测矩阵求取方法,并将其分为随机观测矩阵和有结构的观测矩阵两类。常见的随机观测矩阵有高斯矩阵(Gauss)与Bernoulli矩阵。相对而言,Bernoulli矩阵重建视频信号的精度较低,但对传感器节点性能要求也低。而有结构的观测矩阵最有代表性的是Scrambed Hadamard 矩阵,其结构为Φ=QMWPN,其中W为块对角矩阵(N×N阶)。一般而言,高斯矩阵所能达到的采样精度较为理想,且有利于并行计算。然而,采用该矩阵时对传感器节点的运算与存储能力要求非常高。
进一步分析,在观测矩阵给定的情况下,视频信号重建质量的高低取决于稀疏表示能力。对此,文献[17]提出并比较了几种稀疏表示模型,如基于梯度的稀疏表示模型、基于回归模型的稀疏表示模型、基于正交变换的稀疏表示模型、合成(Synthesis)模型等。上述模型中,除了合成模型,其他几种模型需要利用到边信息,其复杂度虽然较高,但视频重建的性能也较好。(www.xing528.com)
10.1.2.2 Synthesis模型
文献[17]用K个基元 来表示稀疏矩阵,而 通过变换而求得(稀疏字典)。文献[18]分析了稀疏字典的两种形式,即解析的稀疏字典与非解析的稀疏字典(通过学习求得)。解析的稀疏字典中,有代表性是基于多空间冗余基的稀疏字典,其求解方法简单,在小样本的情况下,重建效率较高。
从重建精度的角度衡量,非解析的稀疏字典由于能通过大样本的学习与训练得到,其重建精度显著高于解析的稀疏字典,且计算复杂度也可接受,是目前的一个主要研究方向。文献[19]提出了几种非解析的稀疏字典,如基于K均值聚类的字典、基于稀疏编码的字典等。相对而言,基于稀疏编码的字典性能较为突出,然而在构建方法及求解对应的优化问题时,还缺乏有效的方法。文献[20]采用爬山算法及贪心算法等解决该问题,但在很多情况下未能求得全局最优解。文献[21]采用迭代及函数逼近的方法,虽然精度较高,但复杂度过高,不适合实际应用。因此,寻求良好的稀疏字典构建方法和信号压缩方法,是目前面临的一个主要问题。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。