【摘要】:在实验中将提出的算法与TSVMOAL,TSVMRandom,TSVM,和SVM[161]进行对比分析。TSVM算法是在标记样本和无标记样本集上训练一个分类器,该方法利用样本间的聚类结构,并且将其看作学习任务的先验知识。SVM算法仅仅利用有标签的样本进行训练,该算法在标记样本足够多的情况下,可达到很好的性能,反之,其分类性能将会下降。TSVMAL+Graph算法不仅利用数据间的流形结构来提高分类的性能,而且也采用主动学习的策略来选择信息量最大的无标记样本进行标记。
在实验中将提出的算法与TSVMOAL,TSVMRandom,TSVM,和SVM[161]进行对比分析。TSVMAL算法是TSVMAL+Graph算法不带流形正则项的版本。SVMOAL算法迭代的询问无标签样本的标签,也就是距离当前分类超平面最近的无标签样本的标签。该算法主动学习策略选择样本的度量是利用当前分类超平面预测的类标签,而不是先前标注的相邻样本的类标签。并且该算法每标记一个样本就启动一次模型的训练,而不是标记一定数量的样本后才开始重新训练。TSVM算法是在标记样本和无标记样本集上训练一个分类器,该方法利用样本间的聚类结构,并且将其看作学习任务的先验知识。SVM算法仅仅利用有标签的样本进行训练,该算法在标记样本足够多的情况下,可达到很好的性能,反之,其分类性能将会下降。TSVMAL+Graph算法不仅利用数据间的流形结构来提高分类的性能,而且也采用主动学习的策略来选择信息量最大的无标记样本进行标记。
为体现提出算法性能的优越性,将TSVM,TSVMAL,TSVMRandom和SVM作为比较基准。SVM算法求解是采用现有的matlab工具包[161];TSVMAL采用matlab编码并实现;TSVM求解方法采用Collobert等人提出的凹凸求解算法。在SVM训练分类器时,仅采用初始的已标记样本;而TSVM同时采用了有标签样本和无标签样本;SVMAL先对最初的有标签的样本进行训练,并得到一个初始分类器,然后采用主动学习策略对无标签样本进行查询并提交领域专家进行标记;本章提出的TSVMAL+Graph算法求解过程见6.3.1节。(www.xing528.com)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。