首页 理论教育 知识链接功能实现:信息服务协同组织

知识链接功能实现:信息服务协同组织

时间:2023-07-29 理论教育 版权反馈
【摘要】:基于引文的知识链接系统,结合Web的超链接特性与引文索引的优势,利用知识关联的相关标准与工具,构建知识信息资源整合的逻辑平台,通过整合现有引文数据库中的数据,最终形成知识联网的链接服务平台基础。对特定指标的查询则更能够体现出知识链接系统的深入分析功能。⑥知识展示功能实现。为了更加直观地显示知识链接关系,在集成现有引文数据的基础上,可实现结果的可视化展示。

知识链接功能实现:信息服务协同组织

基于引文的知识链接系统,结合Web的超链接特性与引文索引的优势,利用知识关联的相关标准与工具,构建知识信息资源整合的逻辑平台,通过整合现有引文数据库中的数据,最终形成知识联网的链接服务平台基础。其中,引文数据库是知识链接的主要数据来源,为了获得高质量的引文数据,一方面要遵循全面、规范、准确的原则来加工数据,另一方面应整合现有的多个引文数据库,形成基于平台的引文数据库共用,以保证数据源的规范度和完整性。

基于引文的知识链接系统功能的实现包括:数据解析功能实现,知识关联功能实现,知识分析功能实现,知识评价功能实现,知识检索功能实现,知识链接展示功能实现。

①数据解析功能实现。为了提高数据知识解析的效率和质量,需要按照元数据标准进行数据选择和预处理,从而建立统一的数据视图。随后,按照抽取、转换、净化和加载4个步骤对引文数据进行逐条解析。抽取是指从源数据库中选择并提取所需要的字段;转换是将所有不同数据源的数据转换为统一的表达形式和名称;净化是指对所得数据进行纠错,以保证数据的正确;加载则是把经过净化的、符合规范的、正确的数据载入数据仓库中存储。

在解析过程中,需要利用规范表、机构要素表、类目主题表等数据表,对引文数据中的各个字段进行规范:归并相同的论文、机构来源,识别相同姓名的不同作者。因此,规范表、机构要素表要涵盖各种数据的表达和代码形式;机构要素表中还应厘清各类机构的隶属关系和名称变更等事项;对于相同姓名的不同作者,则需要结合类目主题表、作者机构等要素来加以判别。

②知识关联功能实现。经过数据解析之后,每一条数据都会被分配一个唯一的“来源文献唯一标识”。以此为基础,每一知识单元都可以通过引用、同被引、引文耦合、用户行为关联过滤、文本相似度等关联规则来建立与其他知识单元之间的关联关系,从而形成来源文献库与被引文献库和作者库中相关记录之间的链接,以满足各类检索、统计的需要。

利用特定的关联规则,应通过作者与所属机构、机构与其上下级机构、论文与所属主题、论文与同被引论文、论文与耦合文献等关系,建立关联链接。更进一步,可利用不同属性的共现,挖掘出更深层次的关联,如作者与关键词、机构与主题领域等;也可以通过对题名、关键词、摘要乃至全文进行共词分析来挖掘并建立文献主题结构关联;甚至还可以通过对文献进行共词分析和引文分析,实现两种方法的融合。

③知识分析功能实现。从不同角度建立了文献内外部特征之间的关联后,可以较为方便地开展各种统计分析。由于各种要素以及不同要素之间,如论文、论文作者、作者机构、学科主题、出版机构等,存在多种属性关系和内容共现关系,因此利用这些数据能够完成几乎所有的引文统计与分析,如引文结构统计、引用关系统计等。

例如对于期刊,常见的统计量有期刊载文量、期刊被引次数、被引半衰期、即年指标、影响因子、期刊自引率、核心作者、重点机构等;对于论文来说,可以对引文量、同被引论文、被引次数、历年被引量、耦合论文、主题领域等进行分析;对于作者,可以统计论文数量、作者单位、合著情况、总被引量、各种高被引指数(如H指数等)、主题分布等;对于机构,则可以分析高产作者、论文数量、被引情况、机构合作情况等。(www.xing528.com)

④知识评价功能实现。随着文献内外部各种特征分析的实现,通过评价功能可以支持各项知识服务。评价对象可以是特定作者、特定机构、特定期刊、特定学科或者是特定项目的成果,还可以是针对上述对象的综合评价。在综合评价中,不但需要考虑各项指标的重要程度,还要考虑各分项指标之间的相互联系;不但要考虑各项指标的优点和局限性,还要考虑其在不同学科之间的适用性。

在知识服务中,知识评价模型的构建是重要环节。以对科技期刊的评价为例,科技部制订了“中国科技期刊评价监测指标体系”,中国科学技术信息研究所和中国科学院自然科学期刊编辑研究会也各自建立了一套评价体系。综合多种体系的各项评价指标,结合实际评价数据就能够建立综合评价模型,来确定各指标的权重并对评价矩阵进行计算。

⑤知识检索功能实现。当用户提交知识需求时,可以利用元搜索引擎的查询调度机制和搜索引擎代理将检索指令转化成各个数据库能够接受的命令格式,自动查找相关论文的引文数据,继而对检索结果进行汇总、去重、排序。知识链接系统不但支持常规的检索入口,还支持引文检索并提供各种链接来获得相关文献。检索结果并不是关键词匹配的简单排列与堆积,而是以引文索引为主,多种文献内外部特征为辅的有机关联和综合。

基本的检索功能包括关联检索、专项检索和指标检索等[17]。所检索出的每条文献记录,除了提供作者、来源等常规信息之外,还注明该文的被引次数、参考文献、同被引文献、引文耦合和相关文献等项目的链接量。同时,在针对作者、期刊、来源等入口进行的专项检索中,可以同时提供相关的统计、分析信息,如在检索作者时提供该作者的被引情况、高被引指数(如H指数)、合著等。对特定指标的查询则更能够体现出知识链接系统的深入分析功能。

⑥知识展示功能实现。为了更加直观地显示知识链接关系,在集成现有引文数据的基础上,可实现结果的可视化展示。设计引文可视化系统的总体结构在于,使抽象的知识链接数据以可视化的形式表示出来,以揭示复杂的知识信息之间的逻辑关系,供用户进行浏览、分析。

在基于引文的知识链接网络中,可以将作者、论文等分别作为网络的节点,以此来构建时序网络图、耦合网络图等直观的引文分析图形。通过对信息的多维视图进行快速、一致性和交互性的存取,能够表现有实际意义的、任意两个分析单元值的共现关系。同时,除二维知识链接图形之外,还需要探索三维或更多维的可视化方法,以求在有限的图形中呈现更多的信息;另外,还应该在实现静态知识链接展示的基础上,探索更加便捷的动态性、交互性的展示方式。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈