2007年,Stvilia基于对信息质量评价框架的应用,建立了一个包含7个维度、19个指标的维基百科质量评价指标体系,包括权威性(匿名用户编辑次数、总编辑次数、注册用户编辑次数、唯一编辑人数、外部链接数、恢复编辑次数、通过共同编辑和特定文章连接的文章数)、完整性(文章字符数、内部链接数、内部断链数)、复杂性(可读性分数)、冗余/信息含量(图片数、唯一的编辑数/总编辑次数、信息噪音=1-阻止或停止后术语或标记向量大小/处理前的文献大小)、一致性(文章发布天数、管理员编辑次数/总编辑次数)、时效性、易变性(恢复时间的中位数)[84]。2008年,Rector依靠领域专家对历史文章从准确性、宽度和深度比较维基百科和百科全书,与其他百科全书95%~96%的正确率相比,维基百科的正确率是80%[85]。2009年,Nofrina从维基网站可信性评估的高参与用户和低参与用户中归纳了所关注的网站主要特征和判据,包括编辑及历史特征,注册用户、管理小组的评论和把关,参考文献,讨论区中评论,链向其他站点的超链接,最后修改日期等几个方面[86]。2010年,Gabriel归纳提出了稳定的维基百科信息质量评价指标(文本长度、引文密度、内部链接密度、外部链接密度、图片密度、章节密度)和争议的维基百科词条质量评价指标(词条平均修改次数、注册作者的平均修改次数、匿名使用者的平均修改次数、匿名使用者的比例)[87]。2011年,Arazy使用内在信息质量(准确性、客观性)、情境信息质量(完整性)、表象信息质量(表达性)3种类型的信息质量标准对维基百科词条信息质量进行评分一致性研究[88]。Yaari通过对Wikipedia一个群体体验用户的实验表明,Wikipedia信息的评估标准可以分为两类:可测度的和不可测度的。前者指能够自动计算的客观指标,如页面长度、链接数等;后者指需要用户进行主观判断的指标,如覆盖范围、写作风格等;表明用户对维基百科信息的评价既基于当前页面内容也基于它的演化、发展,并将之应用于当前页面和历史编辑页面;认为一般用来评估网络信息的作者和信息源声誉指标不适合评估Wikipedia信息,因为它的条目都是群体智慧的结晶,没有确定的作者,但信息量、内容满意度和外部链接频繁被提及,较少的编辑次数和编辑人数、较多的编辑次数和编辑人数都被作为高质量的信息提及[89]。国内的裘江南设计了一个维基百科页面信息质量自动分类模型[90]。丁敬达以理论研究和维基社区实践相结合的方式,构建了维基百科词条信息质量的启发式评价框架,包含了概念、关系、分类和方法学等[91]。
国内外维基百科词条质量评价详见表2-7。
表2-7 国内外维基百科词条质量评价
(www.xing528.com)
续表
续表
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。