首页 理论教育 信息质量理论-人文社会科学网络学术信息资源评价理论与方法研究

信息质量理论-人文社会科学网络学术信息资源评价理论与方法研究

时间:2023-07-29 理论教育 版权反馈
【摘要】:信息质量研究起源于计算机科学,麻省理工学院研究组早期针对商业数据信息质量的一系列研究在学术界产生了较大影响。表6-1信息质量评估模型2007年,Stvilia通过将信息质量问题来源与信息质量活动类型相关联,提出了一个通用信息质量概念框架模型,包含概念、关系、分类和方法学等多个方面。恶意的信息实体改变会导致信息质量退化。能够允许基于贡献者的声望间接评估和预测信息实体的质量。

信息质量理论-人文社会科学网络学术信息资源评价理论与方法研究

信息质量研究起源于计算机科学,麻省理工学院研究组早期针对商业数据信息质量的一系列研究在学术界产生了较大影响。1996年,Wand和Wang基于对数据质量的“本体”或“理论”研究,认为所有来自信息表达的偏差都会产生缺陷,并将缺陷区分为设计缺陷和操作缺陷,前者包括三种类型:不完全的表达、模糊的表达和意义缺失的表达,后者包括真实世界信息系统的映射错误[2]。1998年,Wang基于对信息用户的调查分析,将信息质量定义为“适合目的的信息”(该定义目前得到广泛认同),超越了信息准确性的信息质量传统认识,认为信息质量是一个多维的概念,信息准确性只是其中的一个维度,并进一步提出了一个包含4种类型、15种维度的信息质量模型:内在信息质量(准确性、客观性、可信性和声誉)、访问性信息质量(可访问性、安全性)、情境信息质量(相关性、价值增值性、及时性、完整性和数据量)、表达信息质量(可解释性、易理解性、表达的简洁性、表达的一致性)[3]。2002年,Lee针对信息用户和信息管理者提出一个信息质量测度模型,将信息质量类型分为产品和服务、测评视角分为规范和用户期望两个方面[4],如表6-1所示。

表6-1 信息质量评估模型

2007年,Stvilia通过将信息质量问题来源与信息质量活动类型相关联,提出了一个通用信息质量概念框架模型,包含概念、关系、分类和方法学等多个方面。

(1)概念

Stvilia同意麻省理工学院研究组“适合目的的信息”的信息质量定义,因为这包含个人和社会公众的“适合目的”的信息质量评估,代表了信息质量评价的特定情境和社会公域。信息质量维度被定义为信息质量概念的构成,对它的测量被定义为在合理的花费范围内沿着一个信息质量维度评价变异的能力;将信息质量问题定义为信息实体的信息质量不符合信息活动在一个或多个信息质量维度的信息质量要求。

(2)信息质量问题来源

包括映射、信息实体转换、转变为潜在状态和情境变化。映射相关的信息质量问题起源于陈述、事件与信息实体之间映射的不完整性、模糊性、不准确性、不一致性和冗余性等。一些映射问题如准确性、模糊性、冗余性和不一致性是独立于背景、能够被客观测度;其他一些问题如不完整性,是情境相关,需要获得相关情境的知识进行测度。情境包含2个主要的因素:文化语言、规范)和社会技术结构(包括经济关系和标准),任何情境变化,无论是时间的还是空间的,都能够改变对信息质量的理解和评估并导致信息质量问题。信息实体在初始情境中具有较好的质量,但一旦被移入不同的情境能够变成不好的质量。同样,情境的社会或文化成分能够随着时间改变,造成质量的需要和期望的变化,从而转化为信息质量评估的变动。改变能够发生在信息实体自身或者它所代表的真实世界对象,其可以是恶意的,倾向于使实体不可用或破坏相关活动,或者消除、缓和信息质量问题以及较好的将实体信息质量与社区共同理解的信息质量或特定活动要求的信息质量相结合。因此,信息质量改变的过程对信息实体可以是被动的或间接的,通过改变导致出现潜在的实体或情境(如文化、社会技术结构、领域知识等)。情境也能被积极地改变、影响信息实体的质量,新的信息来源能够被引进或者已经存在的信息被修改为加强或驳斥实体所代表的信息。恶意的信息实体改变会导致信息质量退化。因此,当存在故意破坏的威胁时,信息内容管理者必须移除或严格限制对信息的访问(如降低它的可访问性、保护它的完整性);信息也能够为满足特定用户的需要被压缩(减小完整性,如文摘等)。

(3)信息质量维度定义及分类

①内在信息质量:这个类别包括通过测量内在属性或在给定的文化中和一些参考标准相关的信息特征进行评估的信息质量维度,如拼写错误、符合表达格式或标准和信息的时效性。一般来说,内在信息质量属性持续存在并较少依赖于情境(只要参考文化不经常发生变动),因此,能被或多或少的客观测量。②相关或情境信息质量:这个类别的信息质量维度测量信息和它使用的情境一些方面的相关关系。如表达信息质量维度测量信息实体如何较好地反映在给定情境中的外在的状态,很明显,由于外在的状态或实体能够独立的发生变化,信息实体的关系或情境特征和实体本身无法保持一致。使用情境指活动场景,能够随着时间和空间变化。③声望信息质量:测量信息实体在文化或活动结构中的位置,经常由来源或中介记录决定。(www.xing528.com)

(4)度量

过程元数据能够提供有关信息实体的宝贵的知识,理想的状态下,过程元数据能够告诉我们是谁(Who)对信息实体做了什么(What),何时(When)、何地(Where)、怎么做(How)以及为什么(Why)。通过What部分提供的信息能够帮助评价单个事务或贡献的质量以及实体的结果质量。元数据的何时(When)、何地(Where)、怎么做(How)以及为什么(Why)部分提供了贡献的情境,有助于用较少的努力解释清楚。怎么做(How)以及为什么(Why)部分有助于知识的积累、交流和学习,包括信息质量相关的知识(规范、标准和最佳实践)。Who部分与贡献的质量评估和产品质量的结果相结合,有助于建立基于价值的排序。能够允许基于贡献者的声望间接评估和预测信息实体的质量。信息使用过程的成功或失败允许我们评估信息实体的质量,同时,关于信息实体质量的信息有助于评估过程质量——可能的成功或失败。

(5)信息质量问题影响的活动类型

①表达依赖:依靠一种信息实体如何较好地表达另一种信息实体或状况的活动。该活动依赖信息实体和它表达的真实世界状况或实体的映射质量,在任何内在和表达信息质量维度要求的和真实质量水平之间的差距能导致信息质量问题。

②去情境化(decontextualizing):使用产生初始的背景信息以外的活动。信息质量在不依赖于情境的活动中很大程度上被使用情境的空间变化影响,相应的,信息质量问题与相关性和信誉维度有关。

③稳定性依赖:信息和潜在的实体是如何稳定的依赖活动。它能够被信息实体的变化和潜在的信息实体变化影响,或许导致内在或表达信息质量发生变化,导致信息质量问题。

④来源依赖:信息的来源、中介和维持的元数据质量的活动,能够在所有的信息质量维度产生信息质量问题。

(6)信息质量测量集成方法

信息质量测量所做的并不为了测量,而是能够支持有效的决策制定。在不同层次、不同维度、不同情境所做的信息质量测量或许需要以易处理、可操作的方式集成和呈现以使基于信息质量可以进行选择或推理。信息质量测量集成是一个复杂的过程,该过程开始于用规模、精度和格式集成来调解信息质量测量模型、测度功能和测量表达,结束于根据信息实体的信息质量的价值结构和活动系统的限制进行测量集成。①开始于信息实体、活动系统情境、信息质量测度情境、文化规范、信息质量维度的逻辑分析决定信息质量对集成的要求。②包括信息实体和信息质量在信息质量产品、组织活动和行为中体现的用户或社区评估,信息质量测量的统计属性被生成,用户信息质量评估和统计学习技术被使用为提取用户或社区的信息质量测量价值结构[5]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈