首页 理论教育 实现聚合的深化过程

实现聚合的深化过程

时间:2023-07-08 理论教育 版权反馈
【摘要】:科学知识多元计量聚合的深度特性首先体现在聚合途径从基于元数据到基于计量关联再到基于语义的深化过程中。传统的聚合方式,无论是在元数据描述的基础上采取的利用字段检索将资源聚合起来,还是以计量方式构建出资源之间的基于知识关联的网络,将其中的机构分析出来实现资源的聚合,都是一种由表及里的过程。

实现聚合的深化过程

科学知识多元计量聚合的深度特性首先体现在聚合途径从基于元数据到基于计量关联再到基于语义的深化过程中。在科学知识聚合的方式中,最简单的聚合方式是通过元数据进行聚合。元数据是关于数据的数据,对于用户来说,元数据是最直观的展现给用户理解资源内容的主要途径;而在科学文献资源体系中,一方面,元数据是图书馆组织资源的重要方式,同时对大量的资源进行描述之后产生的元数据集在某种程度上也是资源的替代物之一。无论是资源的外部属性还是资源的内容属性,在目前的元数据中均有体现,资源系统通过语法和语义结构的规范化,使得机器能够理解这些描述资源的属性,同时通过建立链接机制,大量系统将具有共同属性特征的资源进行了关联,资源系统通过元数据的语义(针对内容特征的描述)和非语义(非内容特征的描述)实现了资源的初步聚合,并将之提供于用户检索,而用户通过资源检索系统类似于“字段限定”的功能够快速地实现资源的初步聚合。这是目前资源系统为用户提供资源的主要方式之一,属于浅层次的聚合。

基于计量关联的聚合是资源聚合的第二层面,传统的基于元数据的聚合是一种平面形式的聚合,虽然元数据中的语义项,例如分类号和主题标引具有自身的层次性和一定的关联性,但这种层次性和关联性相对简单;另一个明显的问题是,这种方式是先组式的组织,即预先建立一个层次化的体系,然后将资源纳入其中进行定位和描述。然而,任意一种组织方式都不可能涵盖目前所有的知识,同时也难以针对用户的个性化需求进行调整,而基于计量关联的聚合则提供了一个对资源进行后组式组织和描述,并将资源聚合给用户的途径。在信息计量学中,集中与离散等问题的研究为用户提供了依靠统计描述大致确定重要资源范围的依据,例如确定高产作者的范围然后进一步进行资源获取,随着相关分析方法的融合,网络分析、共现分析和可视化分析等可以进行更细粒度分析方法被进一步应用。基于引文的资源聚合方法目前已经被广泛应用于数字资源的聚合中,例如Web of Science系统的引文检索功能,并进一步在引文检索的基础上提供了引文拓展功能,可以从当前的文献向前追溯其参考文献,同时也可以向后跟踪施引文献;利用作者与作者之间形成的知识网络,例如合作网络、引用网络、共被引网络和耦合网络等,可以对作者进行聚合,进一步实现资源的聚合;利用词网络,可以发现较之标引的语义元数据更为细化的资源主题揭示,并根据用户的个性化需求对资源进行聚合,因此,从计量层面的聚合辅助实现了资源聚合在深度上的进一步拓展。此外,就计量学发展而言,在“五计学”即文献计量、科学计量、信息计量、网络计量和知识计量的体系中,知识计量将成为一个重要的发展方向,然而目前对于知识计量单元的研究仍旧是以文献计量和信息计量中的载体单元为主[21]。虽然当前的众多研究都强调知识计量是方法性学科,但是其方法体系大多是文献计量、科学计量和信息计量的综合,而没有新的内容。在计量层面的聚合,应该与语义技术相结合,从语义的角度对资源及其包含的信息和知识进行揭示与定量分析,这也是实现信息计量到知识计量深化的重要途径。(www.xing528.com)

基于语义的聚合是知识聚合的高级阶段。聚合的本质特征,是将资源所包含的科学知识重组为知识集合的过程。我们可以把资源的形成过程当做是许多主题、概念等知识信息的聚合过程,其最终的结果就是资源及其包含的特征项实体。传统的聚合方式,无论是在元数据描述的基础上采取的利用字段检索将资源聚合起来,还是以计量方式构建出资源之间的基于知识关联的网络,将其中的机构分析出来实现资源的聚合,都是一种由表及里的过程。而这种过程是多个主题语义概念聚合成资源实体的逆过程,其中有许多不确定的因素和难以准确化的步骤,元数据和计量两个角度的聚合实质上是一种粗粒度的资源聚合。而基于语义的聚合则是从主题语义信息聚合成资源实体的过程角度出发,由里到外地实施聚合,是一种从底层开始实施的聚合方式。它通过一系列的技术手段,例如从资源的组织开始就规范资源的揭示和描述方式,用更符合语义技术的资源描述格式标识资源,直接将内部的语义显性化,或者通过其他手段直接发现资源所包含的语义,直接对其中的语义实施聚合等。从深度的水平上来看,基于语义的聚合已经直接深入到知识的层面,是资源聚合的高级阶段。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈