本研究中提出的改进的马尔科夫毯属性选择方法及融合信息增益和多分类器的属性选择方法都是在Weka(全名为怀卡托智能分析环境,Waikato Environment for Knowledge Analysis)平台下进行实现的。该平台是新西兰卡托大学的研究者们于1999 年开发的,旨在将机器学习领域的理论模型转化为实际应用。经过不断的改进和完善,目前许多经典的机器学习算法都已经内嵌至该软件中。此外,Weka 平台具有较好的兼容性,支持C++,Java等多种编程语言,有利于研究者们进行二次开发。平台的运行界面如图5-6所示。
图5-6 Weka 平台运行界面
目前,Weka 平台的主要功能和开放应用主要包括数据预处理(Preprocess)、属性选择(Select Attributes)、聚类(Cluster)、分类(Classify)和关联规则(Associate)。其中,各功能中已开放的方法如下:
(1)数据预处理方法:包括监督过滤和非监督过滤两类,主要的数据处理功能有修改数据格式、数据离散化、缺失数据补充、数据类型转化(如将String 转化为Nominal 型等)、实例集规范化(Normalize)。(www.xing528.com)
(2)属性选择方法:主要包括属性评估方法和搜索算法两类。其中,属性评估方法包括 CfsSubsetEval ( 根据关联性进行评估)、ChiSquaredAttributeEval(根据卡方值进行评估)、ConsistencySubsetEval(根据一致性进行评估)、InfoGainAttributeEval(根据信息增益进行评估)、ReliefFAttributeEval(根据实例进行评估)、PrincipalComponents(主成分评估)、WrapperSubsetEval(根据一种学习模式进行评估)等。而搜索方法则包括 BestFirst(可回溯的贪婪搜索扩张)、ExhaustiveSearch(穷举搜索)、FCBFSearch(相关性匹配搜索)、RankSearch(排序搜索)、RandomSearch(随机搜索)等。
(3)分类方法:主要包括朴素贝叶斯、K2 贝叶斯网络、RBF 神经网络、ID3 决策树、KNN 和SVM 等。
(4)聚类方法:包括K-means 聚类、DBSCAN 聚类、CLOPE 聚类等。
(5)关联规则:包括Apriori 算法、FilteredAssociator 算法等[93]。
本研究中提出的改进的马尔科夫毯方法通过Java 实现并在Weka 中生成相应的可执行文件。而融合信息增益和多分类器的属性选择方法是采用Weka中内嵌的信息增益(InfoGainAttributeEval)方法和多分类器(NB、KNN 和SVM)进行融合完成的,所以本研究通过调用这些算法完成运算。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。