首页 理论教育 相似客体聚合信息级别推演成果

相似客体聚合信息级别推演成果

时间:2023-10-26 理论教育 版权反馈
【摘要】:(二)相似客体聚合信息级别推测公式相似客体推导出更高安全级别信息的可能性为相似客体属性集合Ω的各个子集在高于相似客体最大安全级别的模糊集上的可能性测度。若Pro≥T,且fci=pro,则认为由相似客体聚合信息能够推出安全级别为Ci信息。,|xk|},则称φ为相似客体被读取的阈值。实验评估的指标为算法执行效率、聚类质量、高级别信息推导准确率等。

相似客体聚合信息级别推演成果

在依据上述算法对客体进行有效分类之后,笔者通过属性级别模糊集可能性测度对同类客体推导出更高安全级别信息的可能性进行了评估。其基本思想为:在空间A×N上定义属性安全级别模糊集Fc={fc1,fc2,…,fck},其中c1<c2<…<ck,依据同类客体属性集子集在Fc上的可能性分布,模糊推演出同类客体推导更高安全级别信息的可能性,并给出相似客体访问的阈值

(一)属性级别模糊集可能性测度

为模糊推演出多个同类客体,是否能够推导高级别信息的可能性,本书引入了属性子集在不同安全级别上的可能性测度。

设 U 为一个属性域,U=A×N。Fc={fc1,fc2,…,fck}为论域 U 上的模糊集,fci代表不同的安全级别属性子集集合,令X为U上取值的变量,与X有关的可能性分布,记为Ⅱx,Ⅱx的可能性分布函数用πX,并在数值上定义等于 Fc的隶属度,即∀v∈U,πX(v)=Fc(v)。

设B为安全级别C(fci)的属性域U上的模糊集,πX是与变量X关联的可能性分布,X在U中取值,则B的可能测度定义为:

Poss(X is B)≈Vv∈U(B(u)∧πX(u))。

其中,B(v)为B的隶属函数;πX(v)为与X有关的可能性分布函数。

(二)相似客体聚合信息级别推测公式

相似客体推导出更高安全级别信息的可能性为相似客体属性集合Ω(Ω属性元素允许重复,重复的在子集划分时可视为一个元素)的各个子集在高于相似客体最大安全级别的模糊集上的可能性测度。

Pro=Poss(X is B|X⊆Ω,B∈Fc

C(B)>max[C(O1),C(O2),…,C(On)]

该公式表示了由相似客体聚合信息推导出更高安全级别信息的可能性,X为属性子集。

若Pro≥T,且fci(Y)=pro,则认为由相似客体聚合信息(由属性子集Y组成)能够推出安全级别为Ci信息。令Y(O)={x1,x2,…,xk}表示能够获取属性子集Y的相似客体子集的集合,xi为客体子集。令φ=min{|x1|,|x2|,…,|xk|},则称φ为相似客体被读取的阈值。

(三)相似客体聚合信息级别推演算法

相似客体聚合信息推导更高级别信息可能性推演算法LIAAI(Level Inference Algorithm of Aggregated Information)首先通过相似客体形成属性集Ω,将Ω划分为2n-n(n不包括重复的属性)个属性子集,并根据相似客体中最大安全级别L,分别计算属性子集在各个安全级别ci(ci>L)模糊集上的可能性proci,若由相似客体聚合信息推导ci级别信息的可能性非常大,则根据属性子集获取相应的相似客体子集,最终得到相似客体在级别ci上的最大访问数量。算法的时间复杂度为o(kn*lgn),k为安全级别的个数,n为客体的数量。

相似客体聚合信息推导更高级别信息可能性推演算法如下:

Input:O(similar objects set)

Output:pro;y

(1)Ω←O;//form attribute subset

(2)Ω={A1,A2,...,Ak};

(3)L=max(C(oi)|oi∈O);//maximum level

(4)for each ci∈C do;

(5)begin

(6)if ci>L then{(www.xing528.com)

(7)B=fo;//fuzzy set of ci

(8)proci=Poss(X is B|B=fci,X∈Ω);

(9)if proci≥Tcithen{

(10)Attr←{Ai|p(Ai|Ci)=proci};

(11)get siwhich can achieve Attr;

(12)φ=min(|s1|,|s2|,...,|sk|);

(13)output(proci,φ);

(14)}else{output(proci,∞)}//no exist

(15)}

(16)endfor

(四)仿真实验分析

为了说明本书所提出的推演方法的执行效果,笔者采用人工合成文件和实际文件作为仿真实验客体。人工合成文件的目的有两种:一是为了产生与实际文件内容相近的文件;二是将实际文件分割为不同的相近文件,实际文件来源于本单位科研性文档。实验环境为Visual C++6.0,Intel Pentium 4 CPU 3.00 GHz,2G内存;软件环境是MicrosoftWindows Server 2003 SP2。

在实验中,我们将客体划分为公开、内文、秘密、机密和绝密5个安全等级,并依据客体特征提取客体属性,对客体属性及属性值进行量化,构造了属性及属性子集在各个安全级别上的可能性分布。实验评估的指标为算法执行效率、聚类质量、高级别信息推导准确率等。

针对上述选取的客体文件,我们对该方法中的聚类算法和推演算法进行了性能评估。 设定客体个数 n分为400,800,1000,1200,1600,1800,2500个,客体相似度阈值σ=1,聚类因子阈值θ=0.75,噪声因子阈值ω=0.8,可推出高级别信息可能性阈值T={0.75,0.7,0.65,0.6}。通过实验,客体相似度阈值σ不断变化,满足聚类因子、噪声因子后,最终σ=2.95。σ迭代变化见表4-2。

表4-2 σ的迭代变化

在实验中,σ的初始值为1,依据聚类因子、噪声因子进行调整。在表4-2中,前三次迭代σ值的变化幅度较大(初始值为1),当σ=3时,聚类因子AG>θ,而噪声因子NG<ω,说明此时尽管分类比较合理,但是由于噪声较多,将会影响聚类的质量和算法的准确率。笔者采用中间取值法,最终得到客体相似度阈值σ=2.95时,聚类质量较好。

为了验证RCABC算法聚类质量的好坏,笔者依据聚类算法得出的分类与实验数据标准分类之间的差距占客体总数的百分比来进行考核。其中,实验数据标准分类由人工分析仿真实验客体获得,而差距为每个类内不同元素个数与噪声异同个数之和。

RCABC算法相对于层次聚类算法BIRCH与基于密度的聚类算法DBSCAN的聚类质量对比。在客体数量相同的情况下,RCABC算法的聚类质量优于BIRCH算法和DBSCAN算法。

通过实验,针对不同数量的客体,笔者对RCABC算法和LIAAI算法进行了执行效率评估。对于RCABC相似客体聚类算法来说,执行效率既与客体数量、属性空间大小有关,也与相似阈值σ的设定有关,因为σ值的设定是否合理决定着算法迭代的次数;对于LIAAI相似客体聚合信息级别的可能性推演算法来说,执行效率与客体数量、安全级别数量有关,因为需要找出获取高级别属性子集的所有客体子集。

此外,LIAAI算法推演的准确率与RCABC算法聚类质量、高级别信息可能性阈值T有关。为了验证LIAAI算法推演的合理性,笔者依据LIAAI算法推演的准确率(VR)、误差率(ER)和错误率(FR)进行衡量。其中,准确率(VR)是指LIAAI算法推导出的客体聚类问题数占实验数据标准客体聚类问题总数的百分比;误差率(ER)是指LIAAI算法未推导出的客体聚类问题数占实验数据标准客体聚类问题总数的百分比,ER=1-VR;错误率(FR)是指未包含在实验数据标准客体聚类问题中的LIAAI算法推导出的客体聚类问题数占实验数据标准客体聚类问题总数的百分比。

由于RCABC算法存在着聚类质量评估因子AG和NG,AG和NG越接近1,则聚类质量越好,且笔者通过聚类与噪声因子阈值调整客体相似度阈值σ,能够有效地保证聚类的质量。而阈值T设置得越合理,挖掘出相似客体聚类问题的准确率越高。若T越高,则放行的客体过多,准确率降低,从而导致泄密;若T越低,则使得冗余的客体较多,错误率高,将会影响访问控制系统的执行效率。因此,如何自动挖掘出合理的阈值是提高算法执行效率、准确率的关键,这是下一步研究的难点。

本书通过将同一安全域内的客体进行相似性挖掘,依据属性特征、属性级别模糊集可能性测度对相似客体间聚合后能否得出更高密级信息的可能性进行了推演。该方面的研究将改变多级网络环境中区域边界安全防护的基本原则,使其拓宽到等级化客体间的关系上来,以有效地控制多级网络中主体对客体的访问,从而进一步降低失泄密的风险。下一步,我们将针对关联客体聚合信息推导更高级别信息的可能性进行深入研究,以进一步解决由于等级化客体关系而存在的泄密问题。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈