科学知识多元计量聚合的最主要特点是借助计量的手段。早在2013年所举行的iConference会议中,就包含了名为“计算化科学计量”的小组论坛[42],同年度所召开的第14届信息计量学与科学计量学年会上,也开设了“文献计量学与信息检索的结合”研讨小组[43]。这些学术活动的举行表明,文献计量学/科学计量学研究群体和信息检索研究群体之间走得越来越近,同时也说明这两个学术群体都意识到发现文献计量技术和信息检索之间的“链”对于两个领域的发展均具有十分深刻的意义。本研究认为科学知识计量聚合正是衔接计量学和信息检索的桥梁,如图2-9所示。
正如上文提及的,传统的检索主要注重结果召回率和精度问题,但是对于用户,尤其是学术信息检索行为的用户而言,从早期的数字图书馆开始就一直面对许多十分复杂而又难以驾驭的问题,例如检索词和召回结果之间的不匹配,检索返回结果数量过多并且内容繁冗,基于文本匹配产生结果排序的缺陷等。解决这些问题主要有两种途径,其一是从最初的信息组织和信息描述开始就对信息内容进行更高层次的控制,如建立本体等。其二是从统计模型的角度和对应的角度着手,例如从洛特卡定律、布拉德福定律等文献计量学的基本定律出发,或进一步结合科学产出的网络结构和动力学机制进行研究[44]。学术行为的统计模型已经被越来越多地用于评价学科、发现科学前沿或分析科技政策的效果[45]。
图2-9 科学知识聚合的理论定位(www.xing528.com)
为了理解基于文献层面的知识计量聚合作为联系计量学和信息检索的桥梁的基本定位,可以做这样一个基本假设:信息检索以搜索知识内容为主要目的,它也可以被视为一种特殊的学术活动而纳入科学建模的基本视角。此外,作为数字资源集合的数字图书馆可以被视作科学系统的一种特定表现,在数字图书馆中的检索可视为与科学模型交互的一类特殊的实际应用。但这仅仅是一个基本的假设,如何将科学建模驱动的信息检索作为不同类型科学模型的测试基础,如何开发一个可以衔接计量学和信息检索的桥梁的应用,都需要进一步的研究。
从信息计量/科学计量和信息检索两个领域来看,两者的一个共同任务是在一个资源系统中适当地选择知识资源集以满足最终用户的需求,特别是对于新兴的领域和那些跨学科领域,通过适当的方法确定其知识的来源显得尤为重要,本质上而言,是试图从已经出现的研究发现其发展的脉络,从而勾勒出科学发展和知识传递的过程。Glänzel等在2009年发表的文章中曾讨论过如何利用文献计量学的方法来检索核心文献[46],他们的研究依托于主题划分,结合了文本内容分析、文献计量学和基于引文的相关技术;Bassecoulard[47]等和Boyack[48]也曾提出根据文章和期刊来进行领域分析。然而,由于科学知识流转移的不同渠道之间往往是相互联系的,因此,如何发现科学研究中不断变化的“硬边界”仍旧是一个非常复杂的问题。Glänzel等在2009年发表的文章中试图提出解决的方法,他们首先从文章之间的耦合和基于关键词的查询出发获取一定量的文献群,然后利用传统的信息检索的标准方法,如关键词检索和阈值,一步一步地从潜在的相关文献中逐步过滤出核心的文献集。但Glänzel认为,基于文献计量学的方法论框架内的领域分析与传统的信息检索之间存在明显的差异,这种差异性体现在多个方面。一般而言,基于文献计量学的检索方法,特别是评价方面,其主要目的是在经典的方法如布拉德福定律、加菲尔德引文集中定律、h指数等的基础上定义一个文献的参考集,从而证明这些标准化的指标或者定律的作用和准确性。在信息检索中应用计量学则不然,其首要目标是从用户的角度出发,通过结合检索的特定语境和更为广阔的检索空间,从而提升检索的效率。简而言之,就是帮助用户掌握信息空间的规模和结构,而不是强迫用户去定义一个精确的检索空间[49]。
因此,寻找两者共同的基础,或者在更广的范围上进一步深化计量分析和信息检索的交叉应用显得尤为重要。通过构建资源层面的科学知识计量聚合体系,结合传统计量学的方法,进一步在语义的层面上进行深化,构建知识多元计量聚合理论体系和技术框架,满足用户的知识需求,这也正是知识计量聚合研究的价值所在。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。