根据上述基本概念,建立数据挖掘技术的链型风险元传递理论需要解决以下两个问题:
(1)对整个项目进行从前至后的状态划分,确定项目中的风险元。
(2)确定各风险元之间的风险元传递矩阵。
对于第一个问题,可以根据经验和实际情况或采用项目管理中的WBS方法解决。第一个问题解决之后,可以采用数据挖掘的相关算法解决第二个问题。
1.风险元传递矩阵的数据挖掘体系流程
借鉴数据挖掘的思想,可以构造如图5.13所示的数据挖掘流程体系,根据已有的数据来提取所需要的风险元传递矩阵。其挖掘的步骤如下所示:
图5.13 数据挖掘流程体系
(1)根据WBS分解出的风险元信息从历史数据库中提取相关信息进入集成数据仓库备用。
(2)对已提取出来的信息进行预处理,例如:去噪、过滤等操作。
(3)对预处理后的信息数据进行数据挖掘算法分析,得到风险元的传递矩阵。
2.风险元传递矩阵的数据挖掘算法分析(www.xing528.com)
根据上述定义,如果要从数据仓库中得到风险元传递矩阵,需要进行以下两个步骤:①对数据仓库中的风险元状态进行合理的划分;②确定风险元状态空间的各状态之间的转移概率。具体操作如下所述。
第1步 对于每个风险元Ri,假设其状态空间X=(Q1,Q2,…,Qn)。首先定义一个原型B={B1,B2,…,Bn},其中Bi表示状态空间的状态Qi的取值范围,用区间数[,]表示(≤),区间数的左端参数和右端参数可以由已知的知识或决策者关注的风险程度给出。
由于现实生活中确定的区间数形式很难得到,借鉴模糊数据挖掘的思想,采用模糊方法将状态空间的区间数扩展成的形式,其中和分别称为左端调整因子和右端调整因子,称为状态Qi的最大可能区间,而称为最明确区间。其函数图像如图5.14所示,其隶属度u(x)与x之间的关系见式(5.18)。
图5.14 模糊数据挖掘中所用的扩展区间数
对于每一个风险元Ri,根据式(5.18)可以得出一个对于其状态空间向量的隶属度向量u(Ri)=[u(Q1),u(Q2),…,u(Qn)]T。根据最大隶属度原则,可得该风险元所属的状态空间,其计算公式为:
第2步 根据第1步对数据仓库中历史数据的风险元状态划分,分析数据仓库中风险元Ri和Ri+1的历史数据,其方法如下:
for i=1 to n
对于风险元Ri属于的每一个状态空间扫描Ri+1状态空间出现的频数。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。