9.6.1.1 数据标准化
设y为预报对象,n个预报对象y 的历史数据组成的样本集向量为:
预报对象y 是由众多因子综合作用的结果,利用单因子分析法可以筛选出起主要作用的m个因子,则由m个因子组成的因子特征值矩阵为:
式中:n为样本容量;xij为第j 个样本第i 个预报因子的特征值。
由于m个预报因子特征值的物理量级、量纲可能不尽相同,又因预报因子特征和样本间呈现的关系有正相关和负相关之分,应对预报因子特征值进行标准化,即将预报因子特征值归一化至[0,1]区间之内的数。标准化方法很多,这里采用以下公式进行标准化:
(1)当预报因子与预报对象之间呈正相关时:
(2)当预报因子与预报对象之间呈负相关时:
式(9.39)和式(9.40)中,max{xi}和min{xi}分别表示第i 个因子的最大、最小特征值;rij表示第i 个因子第j 个样本的标准化值,0 ≤rij≤1。由式(9.39)和式(9.40)标准化后式(9.38)变为相对隶属度矩阵:
9.6.1.2 初始权重计算
水文现象是流域的气象、自然地理、植被覆盖等下垫面条件诸多因子综合作用的结果,而各因子对水文现象的影响不可能相同。为此,需要给各个因子确定一个影响权重,以便描述它们对水文现象的综合影响。
一般来讲,对水文现象影响显著的预报因子,预报对象与该因子特征值之间的关系比较明显,该因子的权重要大一些。因此,可将预报对象与预报因子特征值之间的相关系数绝对值的归一化数作为预报因子权重的初始值。设m个预报因子的权重向量为W =(w1,w2,…,wm),则
在模型率定过程中,若有需要,应对初始权重进行调整,以便获得最佳的因子权重,提高模型的预测精度。
9.6.1.3 预报因子模糊综合分析
为了应用模糊集分析理论将预报因子综合成一个指标来建立预测模型,需要引入优等样本与次等样本的概念。
则称Dgj、Dbj分别为样本j 与优等样本、次等样本的加权广义权距离。(www.xing528.com)
为了求解uj的最优解,建立样本j 与优等样本、次等样本的加权广义权距离平方和最小的目标函数,即
若p=1(使用中p 常取1 或2),式(9.48)简化为:
式中:Cj为线性加权综合合成指标;uj为多因子模糊综合分析合成指标。
由式(9.49)或式(9.50)计算得n 个样本预报因子的综合指标向量为U =(u1,u2,…,un)。
为了应用综合指标向量U 建立预测模型,有必要分析uj的数学特征。取p=1,并令z=uj,x=Cj,由式(9.50)得:
由以上分析可得出以下结论:
(1)函数z =f(x)在定义区间[0,1]为单调递增函数,即多因子模糊综合分析合成指标uj与线性加权综合合成指标Cj具有相同的排序。
9.6.1.4 预测模型建立
有了综合指标U 以后,预报对象Y 与多因子X 之间的预报问题就可以看成是综合指标U 与预报对象Y 之间的单因子预报问题。为了考查U 与Y 建立预报模型的可行性,需要计算两者之间的相关系数:
为了提高模型的预测精度,一般要求|ρ|≥0.9。若相关系数太小,可以通过以下两种办法进行调整:
(2)如果在预报因子权重抽样误差范围内,通过调整权重仍不能满足ρ≥0.9 的要求,说明挑选的因子代表性太差,应重新筛选预报因子,直至满足要求为止。
如果U 与Y 之间的相关性满足要求,就可以建立Y 与U 之间的线性或非线性方程。这里采用一元线性回归方程建立模型(详见2.1),于是有:
其中
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。