主路径分析中涉及的两个主要问题分别是文献重要性的衡量和路径的抽取,基于节点文献在整个网络知识传递过程中所处位置的重要性,被称作遍历计数(Traversal Counts)或者遍历权重(Traversal Weights)。在第3章中,本研究曾介绍了从局部重要性到全局重要性的多种计算方法,特别是对于全局重要性的三种计算方法特征向量中心性及其典型代表PageRank算法和HITS算法,这几种算法可以从全局的角度测度网络结构中节点的重要性程度。在引文网络的环境下,这几种算法同样可行,但遍历权重具有更强的适用性。
相对来说,PageRank算法和HITS算法都是在网络环境下的信息检索过程中被提出来的,由于网页是动态的,因此许多链接关系事实上是可以发生改变的,例如,即使是先公布出来的网络,在其后的更新维护中,同样可以链向后公布出来的网页,也就是说,网络中是存在回路的。而引文网络则不同,一篇文献发表之后其参考文献就确定了,因此引文网络从总体上来看只会是一种严格遵守时间序列的结构,遍历权重就是针对这种严格按照时间结构的有向网络的一个指标。(www.xing528.com)
此外,遍历权重的方法在客观上解决了被引次数计数遇到的问题。相对于被引次数来说,在评价论文的重要性过程中可能更接近事实,即区分了施引文献的重要性。对于全局被引次数来说,遍历权重存在的另一个优势是可以区分出最新发表文献的重要性,由于被引在时间上是滞后的,对于许多最新的文献而言,往往没有被其他文献引用过,即被引次数为0,如何衡量这些文献的重要性是传统方法无法解决的问题。在主路径分析中,最新发表的文献也可能获得很高的遍历权重,这是由于遍历权重将文献对知识的汇集作用也考虑在其中,且遍历权重同时可以用来衡量具体引用关系权重,这是其他指标所不具备的功能。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。