首页 理论教育 面向动态数据高效属性约简算法的成果

面向动态数据高效属性约简算法的成果

时间:2023-11-01 理论教育 版权反馈
【摘要】:粗糙集理论中属性约简的作用就是删除决策信息系统中的冗余属性、降低数据维度.针对特征维度高的数据,属性约简可以有效解决其计算的准确性和复杂性问题,对于提高数据挖掘效率和减少数据计算时间与占用空间具有非常重要的作用,是信息预处理中的一个关键环节.国内外许多学者对它进行了深入研究和探讨且取得了一定成绩.在差别矩阵属性约简算法研究方面,Skowron 等介绍了决策信息系统中差别函数和差别矩阵的概念,讨论了

面向动态数据高效属性约简算法的成果

粗糙集理论中属性约简的作用就是删除决策信息系统中的冗余属性、降低数据维度.针对特征维度高的数据,属性约简可以有效解决其计算的准确性和复杂性问题,对于提高数据挖掘效率和减少数据计算时间与占用空间具有非常重要的作用,是信息预处理中的一个关键环节.国内外许多学者对它进行了深入研究和探讨且取得了一定成绩.

在差别矩阵属性约简算法研究方面,Skowron 等介绍了决策信息系统中差别函数和差别矩阵的概念,讨论了它们的相关性质,提出了属性核计算方法及属性约简算法[74].Wang 等给出了差别矩阵的概念,提出了一种完备属性约简算法,其属性约简的质量取决于预先定义的属性顺序[75].Zhang等[76]和Wang 等[77]分别对这种完备算法做了一些改进,使该属性约简算法同样适用于没有给出属性顺序的情况,提高了属性约简质量.Chen 等针对覆盖决策信息系统,给出了覆盖决策信息系统差别矩阵表示形式,提出了覆盖决策信息系统完备属性约简算法[78].周献中等给出了不同目标下的广义属性约简算法和一般意义下的差别矩阵定义[79].张颖淳等利用差别矩阵设计了启发式属性约简算法,并将其应用到数据挖掘中[80].Miao 等给出了一致和不一致决策信息系统差别矩阵的定义,并将其应用到基于粗糙集理论属性的约简算法中[81].

在正区域属性约简算法研究方面,刘少辉等设计了一种能够快速计算决策信息系统的正区域算法[82].徐章艳等提出了一种基于基数排序计算的决策信息系统正区域算法[83].刘勇等分析了决策信息系统中的不一致度性质,提出了基于二次Hash 表的正区域属性约简算法[84].冯林等针对不一致决策信息系统中计算正区域扩展方法存在着缺陷问题,提出了一种改进的正区域属性约简算法[85].我们也给出了决策信息系统中布尔矩阵的表示形式,并将其应用于基于正区域的属性约简算法中[86].

在信息表示属性约简算法研究方面,苗夺谦等把信息论中的信息熵概念引入到粗糙集理论中,从互信息知识出发,在互信息量的基础上提出了一种新的属性约简算法[87].王国胤等利用条件信息熵对粗糙集中的一些基本概念、性质及运算进行了探讨,并把条件信息熵运用到启发式属性约简算法中[88].陈杰等利用扩展信息熵重新定义属性重要性的概念,并把它运用到扩展信息熵属性约简算法中[89].杨明给出了决策信息系统条件信息熵近似约简的概念,设计了相应的属性约简算法[90].商琳等针对大部分属性约简算法只能处理离散值的属性问题,提出了一种可以处理连续值的属性约简算法[91].黄兵等从信息熵的观点出发,在不完备信息系统下,给出了粗集粗糙性及粗集覆盖知识约简的定义,提出了新的度量方法[92].徐久成等重新定义条件熵的概念,并将它们应用于基于信息熵的启发式属性约简中[93].陈媛等把信息熵和粗糙集理论相结合,从信息熵角度讨论决策信息系统中的一些基本概念和性质,设计了基于信息熵的属性约简算法,该算法能够加快决策信息系统的运行速度[95].(www.xing528.com)

关于属性约简算法优化方面的研究,王国胤等将“分而治之”和并行策略运用到粗糙集属性约简算法中,可以有效解决大数据属性约简的问题[97,98].Chen 等首先给出了优势邻域粗糙集属性约简的性质,然后设计了一种基于优势邻域粗糙集的并行约简算法,为大数据属性约简问题提供了一种新的思路[160].冯林等针对大部分属性约简算法只能处理离散值问题,设计了一种新的属性约简算法,它能够快速获得具有连续值的属性约简[100],并把关系数据库中SQL 语言操作引入到粗糙集理论中,设计了相应的属性约简算法[101].Yang 等重新定义了覆盖广义粗糙集模型下近似空间和属性约简的概念,并把它应用到覆盖广义粗糙集属性约简算法中[104].钱宇华等提出一种能够加速启发式属性约简算法的正区域加速器,可以有效解决传统属性约简算法在计算属性约简耗时过大问题[105].黄兵等把模糊粗糙集引入到优势粗糙集中,构建了优势模糊粗糙集模型,并在该模型下设计了相应的属性约简算法,并将该算法应用到审计风险评估中[110].Liang 等提出了一种更有效的属性约简算法,该算法将一个大的决策信息系统分成多个子决策信息系统,首先利用信息熵知识计算所有子决策信息系统属性约简,然后合并所有子决策信息系统属性约简,最后得到整个决策信息系统的近似属性约简[113].桑妍丽等把分布约简概念引入到悲观多粒度粗糙集模型中,选择合适粒度,提出了悲观多粒度粗糙集分布约简算法[114].

关于属性约简算法设计方面的研究,张文修等给出了不协调目标决策信息系统中最大分布约简的概念,提出了基于不协调目标决策信息系统的属性约简算法[96].胡清华等建立了邻域决策信息系统模型并讨论了其相关性质,构造了数值型属性选择算法,并将其用于知识约简中[99].段洁等将粗糙集理论引入到多标记数据特征选择中,在领域粗糙集模型下,给出了依赖度和下近似集的计算方法,提出了基于多标记分类的属性约简算法[102].Zhao 等提出了决策粗糙集模型下的一种属性约简算法[103].Kusunoki 等建立了变精度优势粗糙集模型并分析了其相关性质,提出了一种适用于变精度优势粗糙集模型的属性约简算法[106].Wu 等基于证据理论提出了一种适用于不完整信息系统或决策系统的属性约简算法[107].Yang 等设计了一种属性约简算法,它可用来处理区间值决策信息系统属性约简问题[108].Hu等构造了基于软模糊粗糙集模型下的依赖函数,并将其用于特征选取与知识约简算法中[109].

此外,于洪等针对经典粗糙集中基于正区域的约简算法缺陷,给出了概率粗糙集模型下属性重要型和风险最小化的概念,设计了基于风险最小化的特征选择方法[111].许韦等把相似关系、可变精度与多粒度粗糙集有机地结合在一起,提出了一种基于相似关系的变精度多粒度粗糙集的近似分布约简方法[112].Qian 等介绍了多粒度粗糙集模型下近似属性约简的概念,设计了多粒度粗糙集近似约简方法,最后通过多粒度约简获取决策规则[115].李顺勇等把粒度计算引入到粗糙集理论中,建立了多粒度粗糙集属性约简模型,并在该模型下设计了相应的属性约简算法[116].Liu 等提出了多粒度粗糙集模型下规则提取框架,在该框架基础上可以得到“OR”的决策规则[117].Lin 等提出了邻域多粒度粗糙集特征选择方法[118].

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈