在传统的主路径分析中,节点(文献)或弧(有向的引用关系)的重要性计算主要通过3种算法实现,即节点对投射值(NPPC,Node Pair Projection Count)、寻径链接计数(SPLC,Search Path Link Count)和寻径节点对计数(SPNP,Search Path Node Pair)[18]。在NPPC算法中,首先确定互联网络中相互联系的节点对的子图,并用矩阵的形式反映出来,相连节点在这个矩阵群上的投影即节点或边的计数值。但这种算法明显的缺陷在于无法适用于大规模网络,相对而言,SPLC和SPNP算法更适用于大规模网络中节点和边重要程度的计算,但都存在一些问题。SPLC算法的落脚点是所有的节点到网络中终点(即未被任何其他文献引用的最新文献)的路径,早期的文章由于无法确定能够处于连接到终点的路径上,因此SPLC算法会导致发表时间较早的文献重要性被低估的问题。SPNP算法的出发点是计算所有节点之间的链接数,即所有的节点既是起点又是终点,这就会导致处于中间位置的节点和边获得更高的重要性值。
Batagelj在以上三种遍历权重计算的基础上开发了第4种算法,即寻径计数(SPC,Search Path Count)[19]。SPC的基本思想是通过计算每个节点和边在整个网络中位于多少条从起点到终点的路径上来衡量节点和边的重要性。相对来看,SPC算法比较适合大规模的网络,运算效率较高,且不存在SPLC和SPNP的节点衡量不一致的问题。
图5-2给出了一个网络中节点与边的SPC计算的案例,其中,位于最左边的3个文献A、B、C是整个网络中的起点,这些节点都没有引用任何其他节点;位于最右边的3个节点H、I、J是这个网络中的终点,这些节点都没有被其他任何节点引用。表5-1中包含了图5-2中从起点到终点的所有路径,共11条。举例来说,节点G的遍历值为9,这是由于共有9条路径通过G。每一条边的遍历值计算与之类似,例如从A指向G的边遍历值为4。从图5-2中我们也可以发现,每个节点的遍历值等于指向它的所有边遍历值的总和。
(www.xing528.com)
图5-2 网络中节点与边的遍历权重计算
表5-1 网络中所有从起点到终点的路径
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。