首页 理论教育 网络语义聚合对比:作者关联的重要性

网络语义聚合对比:作者关联的重要性

时间:2023-07-08 理论教育 版权反馈
【摘要】:从各种网络的聚合结果来看,总体上6种网络中所包含的语义主题具有许多的一致性,和基于引文网络聚合的结果相呼应,XML和信息检索、XML和数据库的研究是整个领域中最为重要也最为突出的群体,因此在所有的网络聚合结果中都十分突出,且聚合的规模最大,包含的作者数量也最多,各种网络的聚合结果都能最先发现这些群体。

网络语义聚合对比:作者关联的重要性

从各种网络的聚合结果来看,总体上6种网络中所包含的语义主题具有许多的一致性,和基于引文网络聚合的结果相呼应,XML和信息检索、XML和数据库的研究是整个领域中最为重要也最为突出的群体,因此在所有的网络聚合结果中都十分突出,且聚合的规模最大,包含的作者数量也最多,各种网络的聚合结果都能最先发现这些群体。但是即使是在信息检索同样的主题之下,也包含了不同的作者群体,某些作者群体的研究是从XML本身的性能出发提升检索效率,某些则是侧重于利用模式算法和详细规定的描述标准进行信息检索,某些研究则主要是对XML文档实现管理和操作中的信息检索。从更加微观的角度来看,这些研究在作者关联网络的语义聚合中被区分开来,有助于更加明确作者群体的语义分布。

从网络本身的特性上来看,各种网络聚合结果揭示出来的语义主题表现不一。结合作者关联网络的统计描述和语义相关性分析的结果,我们可以发现,由于作者之间的合作最接近于真实的社会关联,关联发生的约束性就很高,因此作者合作关联网络的稀疏程度最高。此外,由于作者之间即使研究相同的主题内容,也不能够确定两者之间一定会存在合作关联,且对于实际的资源获取过程而言,那些分散的处于不同来源中的非第一作者对于用户而言可能并不是很重要,但是由于其发表的成果数量较多,在网络中则往往会表现为比较重要的节点。因此作者之间的合作关联网络更加反映了真实的科学交流模式,而在科学研究结构的揭示上会略有不足,从用户的角度来看,往往也是找到了某个重要作者,也就获得了其合作者的信息,从与合作者相关的资源获取上来看,用户也只需要一个步骤就可以了,因此具有一定的便利性。

作者互引网络是对文献引用数据的一种累计,因此作者互引网络对于资源而言其集成化程度较高。从前文的分析结果来看,通过作者互引网络实施的聚合效果较为一般,从网络的角度来看,由于作者互引网络事实上包含了发文和被引两类信息,因此本质上反映了作者研究基础和研究成果两个方面的内容;从聚合中的语义主题内容来看,其分析出来的聚合在其他作者关联网络分析的结果中都有出现,且作者互引网络聚合所分析出来的聚合丰富性不够,在其他作者关联网络中出现的医学信息管理和XML在化学领域的应用等跨领域主题都没有出现,因此,可以认为作者互引网络聚合的语义主题揭示能力较差。

正如前文所言,作者共被引关联网络和作者文献耦合网络可以认为是对作者合作网络的一种特殊类型抽象所形成的网络。从产生的机理上来看,共被引表达了作者共同被他人认可的程度,而耦合则表达了作者共同认可他人的程度,这两种类型的作者关联网络本质上和科学交流的直接关联不大。利用这两种作者关联网络进行科学交流的研究并不合适,但是其机理都反映了研究内容的相似性程度,即来源于相同的研究基础,被相同的后续研究视作基础都可以说明作者之间的相似性程度。因此进行科学研究的结构分析是一个不错的选择,这也体现在两者之间聚合结果上。虽然分析获得的聚合数量不是很多,但是其覆盖面十分广,对于用户来说,特别是非主流研究的用户来说,提供了更多的获取资源的信息。而从科学结构的揭示上来看,其结果的丰富性程度也很高。在不同类型的作者关联网络语义相关性的对比中可以发现,这两种类型的网络的相关性程度也是最高,其结果较为相似。(www.xing528.com)

作者关键词耦合网络的聚合是几类聚合中一个比较特殊的类型,其耦合的形式是两个作者之间通过使用同样的关键词。从语义的角度来讲,作者的语义直接体现在创作过程中使用特定的词汇,在作者主题语义中,我们在作者和词之间增加了一个语义主题层,将原始的词汇层面集成映射到语义主题层面,然后再将语义主题映射到作者层面。但是在现实中,这个语义主题是并不存在的,在资源的实体上,只存在作者和词的对应关系,因此作为一种新的作者关联网络类型,具有重要的探索价值。然而这种形式的耦合也容易存在很多问题,最大的不利因素在于,即使是相同的词汇,在不同的环境中所表达的语义也存在差别,因此作者关键词耦合的使用过程中需要仔细甄别资源所属的学科特性,在自然科学和工程科学领域,作者关键词耦合网络的使用效果应该更好。同时,在使用过程中应该更加注意与语义分析结果的对照。同属于耦合类型的作者关联,作者关键词耦合和文献耦合、出版物耦合之间具有较高的相关度,但和作者合作、互引关联网络之间的差别较大。从本研究中的聚合结果来看,对作者关键词耦合网络的聚合结果能够区分出不同类型的作者群体研究内容上的细微差别之处,但从结果的覆盖面上来看,并不具有明显的优势。

根据ISI创始人文献计量学家加菲尔德的研究[24],某一学科数量极少的核心期刊中集中了该学科的大部分高质量文献,而这些集中的论文又能够反映期刊的学科归属。但从出版物所涉及的主题来看,绝大多数来源出版物都不会仅仅局限于同一个主题,特别是当同一个领域下的研究主题十分广泛时更是如此。因此,作者出版物耦合网络的聚合结果更多的是从现实性的角度区分出不同作者在科学知识发表途径和写作习惯上的差别,如果是进行较为粗略的语义主题探测和科学结构研究,这类网络的语义聚合可能适用,但同样会比较有限。然而,结合作者主题语义的分析结果,确实能够对聚合进行语义层面的更加细微的揭示。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈