互联网的开放、共享等特征,使得网络学术信息质量检查或控制的重担由传统印本文献的信息“把门人”转向广大的信息终端用户。从用户的角度理解信息质量包括理解因特网的信息检索过程,Knight认为,从信息检索的过程聚焦信息质量是一个相对较新的研究领域[21]。Rieh通过对研究人员网络学术信息检索行为的观察,揭示出用户对网络学术信息的选择包括预判断和评估两个过程[22]。Brandgruwel提出,信息判断是在信息浏览和处理阶段完成的,前者被看做启发式扫描信息,后者是有深度的系统处理信息[23]。Petty和Cacioppo提出了用户信息处理的两种类型过程:系统和启发,系统处理是基于内容线索努力地进行信息分析,大多数情况下用户缺乏进行系统评估的动机和能力,转而借助信息和来源的外围线索进行启发式质量判断,从而降低智力负担[24]。Walthen提出用户的网络信息评价包含三个阶段:首先基于网站的外观和呈现(如颜色、图形、印刷错误等)、可用性和接口设计(导航性能等)以及信息组织评价网站的总体可信性;其次基于来源和信息特征评价网站的信息内容;最后,依赖用户的信息需要、认知需要、相关知识及与信息检索与处理过程的交互作用[25]。基于以上研究成果,本研究提出以下评价过程,如图6-1所示。
6.2.2.1 基于外围特征的预判断评价
基于外围特征的预判断评价是指评价主体通过评价客体内含知识外部特征的启发获取对其质量和价值的初步认知和预判断。当用户缺乏对信息对象进行内容详细评估的动机和相关知识与能力时,主要依靠信息对象的外围特征或线索进行启发式质量预判断,以减少智力负担[26][27]。它主要包括查询特征、来源特征、Web设计和外部支持四个方面,见表6-2。
图6-1 基于用户搜索的人文社会科学网络学术信息资源评价过程
(1)查询特征
指查询请求和文档间的概念关联。包括以下两个方面:
1)文档排序:信息检索形式上是对表示文献主题概念的标识词与表示检索者信息需求概念的检索词或其组合的相符性比较,查询系统根据文档中关键词的匹配位置、出现频次判断文档相关度,即文档中的字词、词组或短语与用户的检索请求越匹配,出现的次数越多、出现的位置越重要(如标题、摘要、段落标题、段落首句等),其相关度越高、在检索结果中排名越靠前。目前由于受计算机对语义理解的限制,检索结果的排序与用户需要或期望并不能十分吻合(即不一定能够给用户带来最佳检索结果),但它却给出了对最相关的超链接访问的可能的起点。Fink-Shamit在基于用户网络学术信息质量评价的实证研究中也指出搜索引擎排序有助于用户预测信息的相关性[28]。
表6-2 基于外围线索的预判断质量评价模型
2)检索匹配:如果检索词在网络文档的标题、摘要或URL等重要位置中出现1次或多次,说明网络文档与用户检索需求较匹配。过仕明把网页相关性(即检索词在网络标题、摘要或URL等重要位置中的出现或匹配)作为网页评价的三个重要因素之一[29]。
(2)Web设计
它指Web系统的功能和性能设计。包括以下5个方面:
1)访问公开:可通过超链接公开、免费地访问和获取其原文与内容,如政府网站、开放获取仓储等。Stoker、陈雅和郑建明都将可访问性与可获取性作为网络学术信息评价的要素或指标[30][31]。
2)界面美观:背景颜色搭配专业、排版布局设计美观,具有视觉吸引力等。Walthen认为用户首先基于网站或网页的外观和布局等外在特征对Web信息进行初始评价[32]。Web页面设计、排版和布局的专业性和美感给用户留下瞬间的页面印象和视觉效果(如有没有美感、看上去舒服不舒服、喜欢不喜欢等)。视觉吸引力高的页面布局整洁大方、视觉吸引力低的页面布局杂乱无序。Robins研究发现,高视觉设计水平的Web页面的可信性高于低视觉设计水平的Web页面[33]。胡磊认为当用户受到Web网页的高视觉吸引力的刺激时,会激发他们对Web网页上的学术信息做出积极的评价;而当Web网页的布局杂乱无序、颜色搭配失调等时,会激发他们对网络学术信息做出消极的评价[34]。
3)导航便利:指导航系统标识清晰、准确、一致、全面,便于使用等。由第2章文献综述可知,国内外理论界和实践界都将导航性能作为网络学术信息评价的指标。
4)信息安全:网站系统运行稳定、有预防信息失真的相关措施和技术等,如灾难恢复、异地备份、数字水印、DOI等措施和技术保护信息的完整性等。与导航性能一样,信息的安全性也被广泛作为网站评价的重要指标。
5)格式规范:有固定的结构和格式。如包含标题、摘要、关键词、正文、作者、编辑、责任者、出版日期、脚注、尾注、参考资源、外部链接、图形图表等元素,是网络学术信息质量受控的重要标志。张晓林认为:“期刊所执行的学术规范成为期刊对学术质量和科学诚信的控制力度的重要标志。”以此类推,本研究认为,网络学术信息的格式规范对其自身质量具有重要影响。
(3)来源特征
指信息来源网站或来源作者的知名度、专业性、权威性或声誉等。具体体现在以下5个方面:
1)URL域名:URL域名类型。如.gov、.edu、.org等政府或非营利组织域名较倾向发布公益性的科研、教育、文化等信息,具有较高的学术应用和参考价值。Rieh认为URL域名类型是影响网络学术信息资源来源质量的重要因素[35]。
2)来源声誉:来源网站及其创办者或责任者的资质和声望。如具有强大的官方背景、是知名的信息服务或出版机构、提供网站创办者或责任者的联系方式(如电话号码、通信地址、电子邮件等)、具有版权声明(如人民网的网站声明[36])、被第三方认证(如被ODP、Ipl2等权威目录数据库收录,进入图书馆等信息服务机构的网络信息资源目录,开放存取期刊被吸纳为开放存取学术出版委员会会员或成为开放存取期刊目录(DOAJ)成员或在UlrichsWeb期刊目录注册或被Web of Science、CSSCI等索引数据库采选等)。由第2章文献综述可知,来源声誉等是衡量网络学术信息资源权威性的重要指标。
3)责任主体:网页或网络文档责任人或责任机构的科研实力、专业程度等决定了其所输出的信息的质量。
4)质量控制:具有质量控制或审查的证据、痕迹等,如设有编委会、专职编辑、采用同行评审等对质量进行把关和控制。Harris将有无质量控制的证据作为网络信息评价的8条标准之一[37]。
5)平台推荐:网络文档被所在或所属网站推荐,如维基百科将维基百科编辑确定的、认为是维基百科最好的、被用作其他文章写作范本的专题词条用“”进行标识[38];科学网博客编辑将推荐的精选博文用“精选”进行标识[39];Research Blogging用图标“”注明博客文章讨论的内容是关于同行评议的研究结果[40];中国社会科学网专门设有“本网首发”和“推荐”栏目;学术论坛的“置顶”“加精”等。这些被推荐的信息一般被置于网站主页或首页(在URL中表现为一级目录或二级目录)进行宣传推广,相应地,其被认为是本系统、本平台质量较好的信息。
(4)外部支持
6.2.2.2 基于内容感知的详尽质量评价
感知即潜在因素的主观构建,虽不能直接被观察但却能以多种方式反映和呈现。基于内容感知的详尽质量评价是主体对客体内容和效用满意程度的综合评价,其过程包含了高度的复杂性和认知能力、代表了基本的信息过滤和价值判断,与信息对象、用户和任务情境等密切相关并交互作用。通过第2章的文献综述可以看出,从准确性、权威性、客观性、时效性和覆盖度5个方面对网络学术信息的内容进行评价得到了国内外较多学者和研究型图书馆的一致认同。Xie认为评价作为信息检索过程中的一个关键搜索活动、高度重视用户评估中的相关性标准[41],但主题相关是一个静态的概念,而新颖性则是一个动态的概念,它能够引起认知状态的改变。Rieh也指出,良好性(静态概念)和可用性(动态概念,包含新颖性)是信息质量的两个主要方面[42]。因此,本研究尝试从准确性、权威性、客观性、时效性、覆盖度、相关性和新颖性7个方面构建基于人文社会科学网络学术信息资源内容的用户感知质量评价模型,见表6-3。
表6-3 基于内容感知的详尽质量评价模型
续表
(1)准确性
准确性指信息真实、可靠和无误的程度。可从图文匹配、语法准确、内容可查、表达一致、资料真实5个方面进行考察。
①图文匹配:图文匹配指文献所在网页上的图形图像与文献的内容保持一致或相关,而不是广告宣传图片或导航按钮图像等。借助图形图表说明研究过程及研究结果是学术文献的一大特色,网页的图文相关或匹配度越高,越有可能是学术文献[43],特别是图形图像的清晰性及其与文献内容的一致性反映了文献的信息质量,是文献内容准确性的明显标志。(www.xing528.com)
②语法准确:没有语法、拼写、排版、链接等错误。如果网络文献信息包含明显的语法错误,读者会倾向认为该信息质量是低劣和不可靠的。语法正确的网络文献内容质量不一定高,但质量良好的网络文献一定会较少出现明显的语法或拼写错误等。
③内容可查:其内容与从专家咨询、印本文献等其他信息源一致或相同。网络信息由于发布的灵活及审查的欠严谨,其内容能与其他信息源进行比较和核对就尤其显得必要和重要,如果不同信息源的内容都一致,说明其较为准确和可信。Fink-Shamit在基于用户网络学术信息质量评价的实证研究中指出网络信息的可查证性是用户对网络学术信息评价的重要指标[44]。
④表达一致:语言表达不晦涩、不模糊,尤其是重要概念的表达前后一致、无歧义。Wang将表达的一致性作为表达信息质量的重要指标[45]。
⑤资料真实:论据资料符合既有理论、常识或事实等。论据的真实性决定了论点的真实性,因此,如果网络文献的论据资料保留有比较、甄别的痕迹,表明资料较为真实可靠、相应其结论较为准确。
(2)权威性
权威性指用户感知的信息内容的可靠性、专业性等。可从语言特征、专业程度、推理论证、价值立场、学术取向等方面进行考察。
①学术语言:写作语言科学严谨、专业规范且不通俗(大众化的流行语言)等。本研究认为,同一知识领域内的用户倾向于使用共同的专业术语,这一方面是因为他们所受的共通的教育和科研训练、共同面临的科学研究问题等使之倾向于使用类似的语言和叙述风格以及共同的专业术语表达特定的概念;另一方面是为了减少交流中的模糊性和歧义性,吸引同一领域内部成员的注意和认同[46]。Fink-Shamitr的实证研究表明写作语言呈现专业性、学术性风格的网络文档质量较为可靠和可信[47]。
②专业程度:网络文献中包含或出现的领域本体、领域主题词和领域热点词的频次、重要度分值等反映了网页在某个主题领域的专业程度[48]。
③逻辑一致:指网络文献的内聚性好、连贯性强,论点与论据之间、论据与论据之间相关或相容。Richmond将逻辑连贯性作为网络学术信息评价的10大原则之一[49]。
④论证充分:论证是指根据一个或一些命题的真实性,进而断定另一个命题真实性的思维过程[50],包括论题、论据和论证方式。论题是论证其真实性的命题,即要证明什么。论证方式是指论据与论题之间的联系方式,它要解决的问题是“如何证明”,即如何将论点、论据以合乎逻辑的方式组织起来,目的在于从逻辑上确定论题的真实性。一篇高质量、有价值的学术文献一般拥有合理的论证方式、充分的论证过程等[51]。
⑤价值立场:如前所述,人文社会科学具有较强的意识形态属性,因此,其网络学术信息的观点立场、价值标准必须符合马克思列宁主义、毛泽东思想、中国特色社会主义理论并遵守宪法和法律,不能违反或抹黑国家的路线、方针、政策等。
⑥学术取向:网络文献的写作秉承学术宗旨,以探索、交流和发现新思想、新知识为己任,不对既有的知识或研究成果进行机械地重复甚至抄袭或复制[52];符合领域知识发展范式、不为故意标新立异而做伪科学研究等。
(3)客观性
客观性指信息陈述没有被个人情感或其他偏见扭曲、失真的程度,具体体现在以下3个方面:
①考据考证:考据考证充分,内容翔实,作者观点有理论、事实或他人研究成果支持,并能公正地对待不同学者的观点[53]。
②不带宣传:不过度涉及商业利益、避免出现广告图片或超链接宣传等,如Lewandowski认为维基百科词条就存在偏见和鼓吹等信息质量问题[54]。
③不含偏见:不带有明显的特定倾向和偏见色彩,如厌恶或偏好、鼓吹或刻意说服等,尤其注意网站的创办目的和资金来源支持、是否代表资金资助方的利益或立场等。
(4)时效性
时效性是指信息的效用会随着时间的推移而逐渐降低,并且超过一定的时长范围或临界点便会失去相应的效用。
①及时性:信息是最新或最近的,如发布或更新及时等。Garvin曾指出过时信息是常见的信息质量问题[55]。
②实时性:学术研究不同于文学或艺术创作,旧的研究成果有可能被新的研究成果推翻或替代,如果发生了这种情况,再去查找或利用旧的信息对用户会造成浪费、负担甚至误导,因此,实时性是指当用户需要时能及时拥有的信息[56]。
(5)覆盖度
信息覆盖的学科、主题范围或程度,已成为国内外对网络学术信息进行评价的常用标准或指标。
①信息广度:对相关主题的指向和概括程度等。
②信息深度:对相关主题的专指和详细程度等。
(6)相关性
在用户信息检索和评价过程领域,相关性是指信息是否符合用户检索过程中的认知、交互以及任务、情境等层面的需求。在传统经典的信息质量模型中,相关性都归为情境信息质量维度[57]。Greisdorf确认相关性作为问题解决和决策制订过程,在这个过程中检索结果的主题性、针对性和有用性被考虑[58]。文献主题,是概括文献中关于某一事物的情报内容的概念。Schamber是面向用户的相关性研究中一位成果丰硕的学者,提出了“关于主题”“适当的”“有关的”“相关的”“可用的”等主要的用户相关性判据[59]。Cooper认为当一篇文章包含构成答案或是可推论出答案的最小前提组时,这篇文章即被判定为逻辑相关[60]。Wilson认为当文章中的信息能强化用户假设或推论时,应被视为证据相关[61]。因此,本研究认为,主题相关性是指用户基于搜索任务、认知能力和交互情境等从逻辑相关、证据相关等方面评估信息对象符合用户信息需求(或搜寻当前感兴趣的主题)的程度。
①逻辑相关:与用户信息需求相关,如帮助用户明确信息需求、为用户提供信息搜寻建议或线索、与用户当前感兴趣的主题及其所属领域吻合等。
②证据相关:与用户信息需求有关,如仅仅涉及部分主题信息、帮助强化用户的假设或推论、改变用户的信息需求状态、增进用户的知识等。
(7)新颖性
如前所述,主题性是一个静态的概念,新颖性是一个动态的概念,它能够引起用户认知状态的改变。心理学家认为新颖性是以前没有呈现或没有被观察到的不熟悉对用户造成的刺激程度,因此,新颖性信息搜寻行为受用户动机或自我驱动的影响且与用户对主题领域的熟悉程度相关(用户对相关主题领域越熟悉、拥有的知识量越多,新颖性越低)[62]。本研究将新颖性定义为检索的信息对用户新颖或不同于用户既有知识的程度。体现在以下3个方面:
①新奇性:用户感受到的新信息量或刺激程度。
②独特性:观点、方法或内容对用户独特、不可替代的程度。
③经验知识:用户对内容的了解或熟悉程度(反向指标)[63]。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。