【摘要】:在第七章中介绍了典型相关性分析方法的理论基础,并从图像和音频数据集中提取视觉特征矩阵和听觉特征矩阵,计算和分析了典型相关性变换前后的总复相关系数。典型相关性分析是一种传统的线性分析方法,有效地解决了跨媒体检索中的特征异构性问题,挖掘了不同特征间的潜在统计关系,可以说是跨媒体语义关系的“依托”和“反映”。当数据类型包括三种或多种时,在本书中就称之为复杂数据关系。
本书在第三部分介绍了如何从图像和音频数据入手,挖掘不同类型多媒体数据在特征层次上的潜在统计关系,进而找到语义上的相关性。在第七章中介绍了典型相关性分析方法的理论基础,并从图像和音频数据集中提取视觉特征矩阵和听觉特征矩阵,计算和分析了典型相关性变换前后的总复相关系数。
在此基础上,第八章介绍了多媒体数据的统一表达和跨媒体检索算法,且仍然是以图像和音频数据为研究对象。典型相关性分析是一种传统的线性分析方法,有效地解决了跨媒体检索中的特征异构性问题,挖掘了不同特征间的潜在统计关系,可以说是跨媒体语义关系的“依托”和“反映”。
当数据类型包括三种或多种时,在本书中就称之为复杂数据关系。在第九章中,将针对三种或三种以上不同类型的多媒体数据之间的复杂数据关系,进一步介绍如何挖掘跨媒体的非线性关联。当多媒体数据类型从两种扩展到三种或多种时,如果直接使用典型相关性分析方法进行两两分析,则很可能会丢失完整的跨媒体语义,具体分析如下:(www.xing528.com)
假设数据库中包含A,B,C三种类型的多媒体数据,首先,分析A,B对应的两个特征矩阵之间的典型相关性,通过第八章中的线性映射方法得到维数为m的子空间S1;然后,采用同样的方法得到A,C对应的m维子空间S2,以及B,C对应的m维子空间S3。虽然,学习结果使得A,B,C三种类型的多媒体数据都可以用m维的向量表达,进而可以使用第八章中的检索算法,进行跨媒体检索和相关反馈,但是,这种做法只是从局部意义上学习了两两之间的统计关系,丢失了全局范围内三种多媒体数据之间的潜在关系。例如:分析A,B之间的数据关系时,忽略了C对A,B之间间接关系的影响。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。