总体来讲,极值理论主要包括两种类型的模型。第一类是比较传统的区域(块)最大值模型(Block Maxima Method,BMM)。顾名思义,该模型是以某一区域范围内或者某一块的最大值作为新的极值数据的模型。这里的区域范围或者块一般通过对大量同分布样本数据按照某种特定的方法进行分组而获得。由于该模型是在数量很大的一组样本中只选取值最大的那一个样本来作为新的样本数据中的一个,这导致其对样本数据的极大浪费。因此,在实际研究中,它往往被另外一种类型的极值模型所代替,这种极值模型就是接下来要介绍的超阈值模型。超阈值模型(Threshold Exceedances,TE)顾名思义指的是给定一个阈值后,将超过这个阈值的所有样本数据作为新的极值数据的模型。该模型主要针对的是超过某一高水平阈值的那些数值比较大的样本数据,相对上面的模型来说,在实际研究中应用得更为广泛。不管是比较传统的区域(块)最大值模型还是比较“现代化”的超阈值模型,都是为了研究各种分布函数的尾部分布或者极值分布的,故均属于极值模型。由于极值理论中的超阈值模型在实际中的应用更为广泛,且本章节也是利用超阈值模型来对混业经营下商业银行操作风险的度量进行研究的,因此,下面主要介绍在极值理论中的超阈值模型下,总体样本数据的分布函数与其尾部分布函数之间的关系。
用F(x)表示变量X的分布函数,u表示阈值,则P(u<X≤u+y)=F(u+y)-F(u)(其中y≥0,P表示概率),P(X>u)=1-F(u)。因此,若用Fu(y)表示X>u的条件下,X介于u和u+y之间的条件概率,即Fu(y)=P(u<X≤u+y|X>u),则有
Fu(y)表示X>u的条件下,变量X超出阈值u的部分的累计概率分布函数,也即变量X的右尾部概率分布函数。令z=y+u(y≥0),则由上式可得,对于Z≥u有,
其中,y=z-u表示超阈值量。上式给出了变量X超过阈值部分的分布函数与其尾部分布函数之间的关系。由上式可以看出,若能得到分布函数F(x)在x=u处的值以及尾部分布函数Fu(y)的表达式,即可得到分布函数F(x)在x>u处的表达式,其中,对于大于u的x这里用z表示。有关极值理论的已有研究结果表明,对于大多数的分布函数F(x)来说,超过阈值的尾部分布函数Fu(y)都趋向于广义Pareto分布(GPD),即(www.xing528.com)
其中,β>0是分布的尺度参数,ξ是分布的形状参数。当ξ≥0时,y≥0,此时的广义Pareto分布为参数分别为α=1/ξ和κ=β/ξ的一般Pareto分布函数,该分布函数具有厚尾的特点;当ξ=0时,y>0,此时的广义Pareto分布为指数分布函数,该分布函数的尾部为正常尾部;当ξ<0时,0≤y≤-β/ξ,此时的广义Pareto分布为ParetoⅡ型分布函数,该分布函数的尾部较短。
根据上述变量分布函数与其尾部分布函数之间的关系以及尾部分布函数的形式,就可以利用历史数据对尾部分布的参数进行估计后,进而得到变量的分布函数及最终的风险值。但是,在这之前,首先要解决的是阈值u的选择问题,有关阈值选择或者估计的方法将在下面进行介绍。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。