首页 理论教育 Apriori算法在网络安全、高校管理和移动通信领域的应用及技术优化

Apriori算法在网络安全、高校管理和移动通信领域的应用及技术优化

时间:2023-05-18 理论教育 版权反馈
【摘要】:Apriori算法应用于网络安全领域,比如时候入侵检测技术中。Apriori算法应用于高校管理中。实验结果表明,改进后的Apriori算法在运行效率上有了很大的提升,挖掘出的规则也可以有效地辅助学校管理部门有针对性地开展贫困助学工作。Apriori算法被广泛应用于移动通信领域。针对这种趋势,在关联规则数据挖掘中广泛应用的Apriori算法被很多公司采用。

Apriori算法在网络安全、高校管理和移动通信领域的应用及技术优化

Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集,也是最有影响的关联规则挖掘算法,最早由Agrawal等人提出。设Ck表示候选k-项集,Lk表示Ck中出现频率大于或等于最小支持度阈值事务总数的乘积的k-项集,即k-频繁项集或者是k-大项集(Han,Kamber,2001)。

1.Apriori算法的性质和基本过程

Apriori算法具有以下性质:任何非频繁的(k-1)-项集都不可能是频繁k-项集的子集。这是因为:如果含有(k-1)-项集的事务占事务总数的百分比不大于最小支持度阈值,那么含有该(k-1)-项集与另外一项构成的k-项集的事务占事务总数的百分比就更不可能大于或等于最小支持度阈值了。如果用概念来概括的话,含有k-项集的事务构成的概念的内涵比含有(k-1)-项集事务所构成的概念的内涵增加了,那么它的外延必然会减小,所包含的事务数也必然减小。因此,根据这个性质可以再生成k-项集之前先将(k-1)-项集中的非频繁项集删除,通过删除候选(k-1)-项集中的非频繁项集得到(k-1)-频繁项集。该算法的基本过程如下:

①计算所有的C1

②扫描数据库,删除其中的非频繁子集,生成L1(1-频繁项集);

③将L1于自己连接生成C2(候选2-项集);

④扫描数据库,删除C2中的非频繁子集,生成L2(2-频繁项集);

⑤依此类推,通过Lk-1((k-1)-频繁项集)与自己连接生成Ck(候选k-项集),然后扫描数据库,生成Lk(频繁k-项集),直到不再有频繁项集产生为止。

在连接的过程中,为了连接的方便,将项集(项目的集合)中的项按照辞典序排列。执行Lk与Lk的连接时,如果某两个元素的前k-1项相同,则认为二者是可连接的,否则认为二者是不可连接的,不作处理。

2.Apriori算法的应用领域

经典的关联规则数据挖掘算法Apriori算法广泛应用于各种领域,通过对数据的关联性进行了分析和挖掘,挖掘出的这些信息在决策制定过程中具有重要的参考价值。(www.xing528.com)

Apriori算法广泛应用于商业中,尤其是消费市场价格分析中,它能够很快地求出各种产品之间的价格关系和它们之间的影响。通过数据挖掘,市场商人可以瞄准目标客户,采用个人股票行市、最新信息、特殊的市场推广活动或其他一些特殊的信息手段,从而极大地减少广告预算和增加收入。百货商场、超市和一些零售店也在进行数据挖掘,以便猜测这些年来顾客的消费习惯。

Apriori算法应用于网络安全领域,比如时候入侵检测技术中。早期中大型的电脑系统中都收集审计信息来建立跟踪档,这些审计跟踪的目的多是为了性能测试或计费,因此对攻击检测提供的有用信息比较少。它通过模式的学习和训练可以发现网络用户的异常行为模式。采用作用度的Apriori算法削弱了Apriori算法的挖掘结果规则,是网络入侵检测系统可以快速的发现用户的行为模式,能够快速的锁定攻击者,提高了基于关联规则的入侵检测系统的检测性。

Apriori算法应用于高校管理中。随着高校贫困生人数的不断增加,学校管理部门资助工作难度也越加增大。针对这一现象,提出一种基于数据挖掘算法的解决方法。将关联规则的Apriori算法应用到贫困助学体系中,并且针对经典Apriori挖掘算法存在的不足进行改进,先将事务数据库映射为一个布尔矩阵,用一种逐层递增的思想来动态的分配内存进行存储,再利用向量求“与”运算,寻找频繁项集。实验结果表明,改进后的Apriori算法在运行效率上有了很大的提升,挖掘出的规则也可以有效地辅助学校管理部门有针对性地开展贫困助学工作。

Apriori算法被广泛应用于移动通信领域。移动增值业务逐渐成为移动通信市场上最有活力、最具潜力、最受瞩目的业务。随着产业的复苏,越来越多的增值业务表现出强劲的发展势头,呈现出应用多元化、营销品牌化、管理集中化、合作纵深化的特点。针对这种趋势,在关联规则数据挖掘中广泛应用的Apriori算法被很多公司采用。依托某电信运营商正在建设的增值业务Web数据仓库平台,对来自移动增值业务方面的调查数据进行了相关的挖掘处理,从而获得了关于用户行为特征和需求的间接反映市场动态的有用信息,这些信息在指导运营商的业务运营和辅助业务提供商的决策制定等方面具有十分重要的参考价值。

3.Apriori算法优缺点分析

Apriori算法能够有效地发现大数据中的关联规则,并且算法很容易理解,因此仍然被很多数据挖掘的研究者所采用。但是该算法存在以下缺点:

①在由k-候选项集生成k-频繁项集的过程中,需要对数据库重新扫描一次,这样需要多次扫描数据库,如果数据库很大,该算法将十分费时。

②在根据频繁项集生成关联规则的时候,需要计算频繁项集的所有子集,这个过程也是比较费时的。

③生成的规则太多,有很多的规则是冗余规则。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈