首页 理论教育 关联网络数据的抽取方法与技巧

关联网络数据的抽取方法与技巧

时间:2023-07-08 理论教育 版权反馈
【摘要】:在实际的分析过程中,科学文献资源及其实体对象所构成的网络主要包括1模和2模两种网络类型[4],1模网络是指对同一个群体进行观测所建立的网络,而2模网络则测量两个行动者集合或者一个行动者集合与一个事件集的关系,一般对于2模网络的研究都是将2模网络转换为1模网络进行分析。图6-3构建关键词耦合和出版物耦合的中间矩阵抽取

关联网络数据的抽取方法与技巧

在实际的分析过程中,科学文献资源及其实体对象所构成的网络主要包括1模和2模两种网络类型[4],1模网络是指对同一个群体进行观测所建立的网络,而2模网络则测量两个行动者集合或者一个行动者集合与一个事件集的关系,一般对于2模网络的研究都是将2模网络转换为1模网络进行分析。对于作者来说,其首先形成的网络就是作者、知识资源或者文献所对应的2模网络,以资源为载体,作者之间进一步形成其他关联网络类型。本研究主要涉及作者之间的6种常见关系网络:作者合作网络、作者互引网络、作者共被引网络、作者文献耦合网络、基于关键词的作者耦合网络和基于出版物的作者耦合网络。其构建都可以通过2模网络向1模网络转化的过程实现。

对于合作网络和互引网络,首先建立两个最基础的发生矩阵,一个是作者和文献的发生矩阵A,如果作者j是文献i创作者,那么矩阵中Aij=1,否则为0。另一个矩阵是论文引用矩阵C,如果论文j被论文i所引用,那么矩阵中Cij=1,否则为0。根据2模网络和1模网络的转化方式,作者之间的合作矩阵可以通过A′×A获取,而作者之间的互引矩阵的计算方法则为A′×C×A,如图6-1所示。

通过上述转化过程,作者之间所有的合作关系和互引关系都可以在矩阵中计算出来。举例来说,某个文献P有4个作者,6对合作关系可以被识别出来;如果文献P引用了由另外两个作者创作的文献H,那么作者之间的8个互引关系就可以被识别出来。

进一步的,结合上面的计算过程,利用类似的方法在两个基本矩阵A和C的基础上可以分别得到作者共被引和作者文献耦合关系网络,但都需要中间矩阵进行转化。对于作者共被引矩阵,首先需要获取文献和被引作者的中间矩阵D;对于作者耦合矩阵,首先需要获得作者和被引文献的矩阵E,如图6-2所示。作者共被引矩阵就等于D′×D,作者文献耦合矩阵就等于E×E′。

图6-1 作者合作和互引网络的抽取(www.xing528.com)

图6-2 构建共被引和耦合的中间矩阵抽取

基于关键词的作者耦合矩阵无法仅仅通过两个基本矩阵A和C得到,需要有一个文献和关键词的对应矩阵T,显而易见作者和关键词的矩阵K就等于A′×T,那么基于关键词的作者耦合矩阵就等于K×K′。类似的,作者之间基于出版物的耦合网络需要有一个文献和出版物的对应矩阵P,显然,作者和出版物的对应矩阵J就等于A′×P,那么基于出版物的作者耦合矩阵就等于J×J′,如图6-3所示。

图6-3 构建关键词耦合和出版物耦合的中间矩阵抽取

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈