在本书第八章中,介绍了图像的视觉和音频的听觉特征之间的典型相关性方法(Canonical Correlation Analysis,CCA),属于线性的特征分析方法,并在相关反馈过程中“被动地”修正了相关性排序值。在这一章中介绍的隐性语义索引方法也是一种线性特征分析方法,为了与本章的方法相对比,将第八章中的方法简称为CCA-Passive。
由于本章是以视觉和听觉特征的隐性语义索引为基础展开的,并且与CCA-Passive不同的是,在相关反馈过程中采用了主动学习策略,因此,将本章的方法简称为LSI-Active。
表9-1是CCA-Passive和LSI-Active两种方法进行跨媒体检索,经过两轮相关反馈后得到的查准率对比,包括查询例子在数据库中和查询例子不在数据库中两种情况,其中LSI-Active是指采用主动学习规则3得到的结果。从表9-1可以看到,当查询例子在数据库中时,CCA-Passive方法和LSI-Active方法都得到了较高的检索性能,前者得到的查准率略高于后者。这是因为CCA-Passive在训练过程中需要分别对每个语义类别进行典型相关性分析和相关性保持映射,而后者是对整个数据集中所有语义类别的训练数据集中分析特征共生关系,也就是说,CCA-Passive是分析局部的跨媒体典型相关性,而LSI-Active研究了全局的特征共生关系。当查询例子不在数据库中时,LSI-Active明显优于CCA-Passive方法,而当返回结果为20个时,LSI-Active比CCA-Passive得到的查准率高出48%。(www.xing528.com)
表9-1 CCA-Passive和LSI-Active的跨媒体检索性能对比
可见,虽然LSI-Active和CCA-Passive都是以监督式的机器学习为基础的,两者对训练数据集的跨媒体检索性能都较好,而在处理数据库之外的新媒体数据时,LSI-Active方法比CCA-Passive方法更具一般性和可扩展性。这是因为本章的LSI-Active方法在相关反馈中结合了主动学习策略,充分挖掘了用户标记样本之外未标记样本的数据关系。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。