【摘要】:图8-6没有相关反馈时的跨媒体检索结果上图中CMFSS方法在检索性能上优于传统的CCA、ICA和PLS方法,也就是说,在选择相同的视觉和听觉特征作为输入条件,算法挖掘了图像和音频之间的潜在相关性,并且CMFSS子空间保留了这种数据关系,得到的检索结果较好。而传统的CCA、ICA和PLS方法,虽然已被证明在分析单一类型的多媒体特征时较为有效,但难以挖掘两种不同类型的特征矩阵之间的统计关系。
采用Matlab工具处理图像的视觉特征矩阵和音频的听觉特征矩阵,求解得到降维后的子空间坐标,根据本章理论部分介绍的距离公式,在VC 6.0环境下编写一个简单的跨媒体检索系统,计算跨媒体检索的平均查准率。实验对比了其他几种传统的特征分析方法,即:PCA(Principal Component Analysis)、ICA(Independent Component Analysis)和PLS(Partial Least Squares)方法。分别采用这三种方法进行降维映射,在得到同构的子空间中进行跨媒体检索,过程如下:
(1)计算视觉特征矩阵的子空间基向量,映射得到子空间S1;
(2)同样将听觉特征向量都映射到与S1相同维数的子空间中S2;
(3)根据图像和音频在S1,S2中的坐标计算两者间的欧氏距离,作为跨媒体相关性的度量标准。(www.xing528.com)
图8-6列出了在没有相关反馈的情况下,采用上述几种方法进行跨媒体检索,得到的平均查准率,图中的结果是以图像为查询例子检索音频和以音频为查询例子检索图像得到的平均值。
图8-6 没有相关反馈时的跨媒体检索结果
上图中CMFSS方法在检索性能上优于传统的CCA、ICA和PLS方法,也就是说,在选择相同的视觉和听觉特征作为输入条件,算法挖掘了图像和音频之间的潜在相关性,并且CMFSS子空间保留了这种数据关系,得到的检索结果较好。而传统的CCA、ICA和PLS方法,虽然已被证明在分析单一类型的多媒体特征时较为有效,但难以挖掘两种不同类型的特征矩阵之间的统计关系。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。