(1)维基百科词条信息质量的相关特征
维基百科词条作为Web信息的一种,除具有Web信息所具有的开放性、时效性、不稳定性等特征之外,还具有自身独有的广泛性、综合性等特征。维基百科社区建立了相应的指导规范,总体上是坚持三个基本原则:观点中立、可查证和非原创。Chesney认为维基百科词条总体上提供了可靠和有用的信息,是指向相关背景性知识的有用工具[71]。类似于一般的百科全书,维基百科词条主要是提供了指向特定主题的研究起始点,它一方面将用户导向特定主题的信息资源,另一方面,维基百科词条也提供了对主题自身的综述。所以,维基百科词条的主要特征是提供对相关主题的概括性和指向性信息,强调内容覆盖范围和程度,而不追求具体的细节和创新。因此,在Web学术信息质量评价中常用的新颖性等指标便不适用于维基百科词条。
(2)维基百科词条信息质量的相关问题
明确信息质量问题(即信息质量变异情况),是对信息质量进一步的认识和理解,有助于把握其属性和特征,也是对其进行衡量和评价的前提和基础。只有从一般意义上把握信息质量存在的普遍问题和变异情况,并据此确定对其度量的维度和指标,才能建立全面、合理、适用的信息质量评价框架。Stvili等确认了信息质量问题的四个来源:映射、信息实体变化、基础的实体或条件变化、情境变化[72]。Garvin曾提出3种类型的信息质量问题:偏见信息、过时信息与修改信息[73]。Lewandowski和Spree认为维基百科词条信息存在三个主要方面的问题:内容和格式的准确性,偏见和鼓吹,信息的易变性[74]。Strong等认为质量归根结底是社会建构的,因此,为了对质量进行评估,必须存在能够比较的社会和文化的判断标准和规范[75],比如,根据字词典可以得知拼写错误等。这就意味着对于什么组成了好的质量存在一些社会法则和认同,而Strauss认为这总是通过协商获得的[76]。因此,本书基于维基百科词条讨论页面(记录了编辑者之间协商和争论的历史过程)的内容分析来提取维基百科词条在实践层面所反映的主要信息质量问题(选取Wikipedia的40个讨论页面,其中20个来自特色词条,20个来自随机选择词条),参考相关研究文献,将维基百科词条的信息质量问题按“2个背景视角×2个评估视角”的概念模型进行分类[77](见表6-18),为信息质量评价框架的构建奠定基础。
表6-18 维基百科词条信息质量问题
续表(www.xing528.com)
表6-18中,矩阵的列捕捉信息视角和用户视角的信息质量问题,而行则捕捉背景相关性与背景独立性的信息质量问题。解释和说明如下:
①信息视角/背景独立性象限说明信息本身的合理性问题。这些信息质量问题较少与用户和应用相关,对于什么组成了好的信息质量存在普遍的社会法则和认同,不因用户或情境的不同而改变,如不同用户在各种应用中都会按照统一的语言标准和规范判断有无拼写错误等。
②信息视角/背景相关性象限说明违反背景规则的信息质量问题,即信息符合规范或约束的合理性程度。
③用户视角/背景独立性象限说明信息用户在脱离具体任务、情景下所普遍感知的信息质量问题。体现了大多数用户(独立于具体情境、任务)对维基百科词条信息质量的共性感知和认同,具有较高的一致性或相似性。因此,存在一些共同的判断标准或质量纬度,用户借以能够对维基百科词条做出是否有用的价值判断。
④用户视角/背景相关性象限说明信息用户在具体情境或任务中对信息质量的个人感知。强调特定情境下的用户信息质量需求和要求,以做出信息是否可用、适用以及期望满足程度的个性化判断。受用户的主观影响较大,如用户的知识结构、兴趣爱好、信息使用动机、任务需求乃至性别差异等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。