基于引文的知识链接反映了知识创新与知识应用中的自然关联关系,以此为基础的链接构架具有针对性和实用性。如图9-13所示,基于引文的知识链接系统大致可以分为四层结构:第一层是资源/数据层,包括各类文献信息和引文信息、机构信息,以及各种数据库、数据仓库和其他文件系统;第二层是工具层,其作用是进行链接解析,包括各种词典、叙词表等知识组织工具,以及关联分析、序列模式分析等数据挖掘工具;第三层为链接层,作用是基于各种知识组织工具和规则来维护各知识单元之间的相互链接,同时根据用户需求生成知识地图等;第四层是服务层,进行知识检索、知识评价、知识重组等操作,将处理的结果以便于用户浏览和理解的方式(如各类可视化工具)提供给用户。
图9-13 基于引文的知识链接系统架构
①资源/数据层。知识链接系统数据库结构分为来源文献库、被引文献库、作者库、机构库、基金项目库、期刊载文表、期刊引文表等。各个数据库之间通过“来源文献唯一标识”来链接相关的记录;数据规范、优化检索等操作则通过规范字典、类目主题字典、机构规范字典、基金项目规范词表等关联字典来进行。其中,关联字典设有规范词、非规范词、关联项、文献记录号、词频等字段等,能将相同的错误全部修正一致,从而提高链接和统计效率,满足各类检索、统计、链接的需要[12]。为了提高引文数据的质量,需要将每条参考文献与库中相应文献进行自动比对,逐一核查参考文献数据的准确性和完整性。对于相同的文献记录,如对期刊,通过人工判读检查作者、题名、刊名、年卷期、起始页等项目是否正确和齐全,以提高引文数据的规范化程度,保证检索的关联度、查准率和链接率。(www.xing528.com)
②工具层。知识链接系统的核心部件是链接解析器(Link Resolver),另有多个知识库和基础性工具为链接解析器提供一系列规则。知识库包括描述各种链接对象元数据的解析规则,以及一些具体的实现算法,如决策分析、神经网络、统计分析、距离聚类、关联分析、可视化等。基础性工作是抽取文本中的知识元构建知识元库,形成一对一或一对多的指向来揭示关联知识间的知识链接[13]。为了有效管理链接工具和提高链接知识的准确性,有必要建立知识库管理系统、模型库管理系统和数据管理系统。作者及其单位、文献来源等信息是知识链接的要素。通过相关语义场计算,比较知识特征(形式特征与内容特征)与词典中的标引词汇的相符性,可以进行多实体关联分析及多视角的实体分析。为了适应于数字环境下异构资源系统的发展,RDF建立了表达语意和知识关系的模型,OpenURL确立了动态的、基于用户环境和身份的链接关系,XLink在支持多方向的扩展链接中,建立了多向的复杂链接关系,从而实现链源到链宿之间的相互链接[14]。
③链接层。链接层的核心是Web知识地图。Web知识地图可以作为知识和知识源之间的中介工具使用,用于描述知识、知识属性及其关系。知识链接系统与Web知识地图和知识源是一个紧密关联的整体,共同构成基于知识链接的知识服务体系。在用户提出知识需求时,系统通过Web知识地图进行知识发现、提供知识注册;在获取相关知识资源的信息的基础上,通过Web知识服务来利用知识资源。Web知识地图所描述的知识信息包含三个部分[15]。知识白页,包括知识资源的地址、链接方法和已知的知识标志;知识黄页,包括基于标准分类法的知识资源类别;知识绿页,包括关于知识源提供知识的内容信息。根据不同需求,这三个部分从不同的角度对知识源中的知识进行描述。同时,Web知识地图具有知识注册、知识过滤和筛选等功能,既实现对知识资源的注册,又过滤和筛选知识。
④用户/服务层。用户/服务层完成用户与系统的交互,接受用户提出的知识需求,如查找知识、共享知识或在线学习等,同时通过知识门户集成的各种服务反馈相应结果。知识链接系统所提供的典型的知识服务,有知识导航服务、知识检索服务、知识推送服务、知识重组服务和知识评价服务等。其中,知识导航服务是利用知识要素及其概念间的语义关系(知识分类体系和知识要素词表)为用户提供范畴分类信息,实现从学科知识的顶层逐层向下浏览;知识检索服务可以为用户提供已有的问题解决实例,重用已有的知识来解决新问题;知识推送服务按照用户知识兴趣或问题域,利用文本分类或文本特征相关方法进行知识推送;知识重组服务,在知识检索服务的基础上,通过获得与问题相匹配的知识,在相关知识客体中的知识要素和知识关联结构重组,为用户提供索引指南以及评价性或解释性的知识;知识评价服务支持用户从学科、地区、机构、人员、时间段等方面对引文资源、知识要素内容进行统计、聚类和趋势预测[16]。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。