首页 理论教育 复杂网络特征的统计度量方法

复杂网络特征的统计度量方法

时间:2023-06-26 理论教育 版权反馈
【摘要】:为了更好地描述复杂网络的结构和行为特征,人们提出了许多关于复杂网络的统计度量。集聚系数它衡量网络节点联系的紧密程度。复杂网络的集聚系数C是网络全部节点集聚系数的算术平均值,即,其中N为网络的节点总数。平均路径长度和直径反映了网络传输能力与效率,平均路径长度的计算公式为:度分布、集聚系数和平均路径长度反映了网络的基本结构属性。

复杂网络特征的统计度量方法

为了更好地描述复杂网络的结构和行为特征,人们提出了许多关于复杂网络的统计度量。

(1)度数和度分布

节点度数,即连接到该节点的边的数量[81]。这是最直接也是最容易计算的中心性指标。对于有向图,既包括从该节点指向其他节点的连接,也包括从邻接节点指向该节点的边,因此相应连边的数量也分别称为该节点的出度(Out degree)和入度(In degree)。度这个统计量虽然简单,但是意义非常明确,在复杂网络中,度数可以表示该节点的影响力和重要程度。度数越大的节点,其影响力就越大,反之亦然。度数是网络中心性的重要衡量指标,此外还有紧密度中心性、介数中心性、PageRank中心性、特征向量中心性等。度分布则表示节点度数的概率分布情况,比如用P(k)来表示节点度数为k(有k条连边)的概率。有两种度分布较为常见:一是泊松分布;另一种是幂律分布,即P(k)=k,其中γ称为度指数。另外,度分布还有其他形式,如规则网络的δ分布。

(2)集聚系数(Clustering Coefficient)

它衡量网络节点联系的紧密程度。以供应链网络为例,如果某节点上下游节点相互之间业务合作也很密切的话,它的集聚系数就高。节点i的集聚系数C i数学定义是:对于节点i,网络中与该节点直接相邻的节点之间边数之和与这些节点之间可能存在的最大可能边数之比,Ci=2ei/ki(ki-1),式中ki为节点i的度数,表明节点i有k i个邻接节点,因此这些节点之间最大可能连接数为ki(ki-1)/2,ei表示节点i的邻接点之间实际存在的边数。复杂网络的集聚系数C是网络全部节点集聚系数的算术平均值,即,其中N为网络的节点总数(网络阶数)。

(3)平均路径长度(Average Path Length,APL)

平均路径长度是网络中所有节点对之间最短距离的平均数。两个节点(i,j)之间边数最少的一条路径称为短程线或测地线。短程线的长度就是两节点间的最短距离d ij,而其中最长的短程线的边数称为网络直径(Diameter)。平均路径长度和直径反映了网络传输能力与效率,平均路径长度的计算公式为:(www.xing528.com)

度分布、集聚系数和平均路径长度反映了网络的基本结构属性。若某网络平均路径长度较小但是集聚系数较大,则称之具有“小世界效应”。

(4)度相关性(Degree Correlations)

度相关性描述的是不同节点之间的连接关系。若度数大的节点倾向于和度数大的节点相连接,则称网络是正相关的,反之网络则是负相关的。可通过计算顶点度数的皮尔逊相关系数r(-1≤r≤1)来描述网络的度相关性,计算公式为:

其中,ji,ki分别是第i条连边的两个顶点的度数j,k,M表示网络总的边数。-1≤r≤1,如果r>0,称网络正相关;若r<0,称网络为负相关;当r=0时,称网络不相关。

(5)模块度(Modularity)

实际的网络中往往存在一个个的社群,社群内部节点间高度连接,相互作用频繁;社群之间只有少数连接或甚至没有连接。网络中的社群识别与分析对于分析网络传播的影响范围是非常有意义的。为了衡量网络的社群结构强度,引入了模块化程度(模块度)指标,将模块度Q定义为其中,表示社群i内部的点所关联的所有边的数目与总边数的比例,eii指两个端点都在社区i中的边的比例[82]。Q值越大,网络社群结构越明显,社群划分越好。一般而言,如果Q值处于[0.3,0.7]之间,则表明该网络具有较强的社群结构。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈