第一节 基于纯语言信息的网络信息资源综合评价研究
网络信息资源(Internet Information Resource)是指在计算机技术、通信技术及媒体技术相互融合而形成的网络上可以找到的资源。通常网络信息资源包括三部分:一是纸本出版物的网络版;二是电子出版物的网络版;三是依托计算机网络环境,直接在网络环境中自由传递与存取的各种信息和技术资源。这些信息资源有以下特点[61]:信息数量大,呈爆炸式增长;信息多类型、多语种,且无严格的类型划分标准和分布规律;信息资源比较分散、广泛;信息发布自由,以及信息的用户群非常庞大、信息的传播范围非常广泛、信息质量参差不齐、信息更新速度快、信息检索和使用方便、各种正式出版信息与非正式出版信息交织在一起等。因此对网络信息资源进行实事求是和恰如其分的评价,是提高网络信息资源管理效率的重要途径。
目前网络信息资源通常有定性评价和定量评价。所谓定性评价,就是按一定的评价标准从主观角度对网络信息资源所做的优选与评估。一般采用问卷调查和专家评议等方式。根据相应的评价指标体系,建立评价标准及赋值标准,再让用户进行评定或专家打分,给出网络信息资源的评价结果,从而反映网络信息资源质量的高低。定性评价的优点是易于操作;缺点是评价结果受人为因素影响较大,因而评价结果往往不够精确。定量评价,就是利用数量的方法对调查统计数据进行分析,进而做出较为系统、客观的评判。定量评价的优点是信息比较全面及时,可以从技术指标上对网站进行评价,所得的评价结果比较客观;缺点是评价标准过于简单,同时某些指标可能受浏览器设置、网站免费服务、广告等因素的影响,因此所得结果不一定符合实际。总之定量评价法在一定程度上克服了定性评价的主观性和价值偏向,所以定量评价逐渐成为人们进行网络信息资源评价的一种手段。
在网络信息资源的评价过程中,人们在对确定网站评估指标时往往会给出定性的纯语言评估信息,如:优、良、中、差等语言形式。过去人们解决这类评价问题的方法通常采取近似取值的方式,比如规定90分以上为优,这种方法可能普遍存在丢失评价信息的缺陷,因而可能导致评价结果不够精确和可靠。因此对基于纯语言信息的网络信息资源定量化综合评价的研究具有重要的理论和实际意义,目前尚未见到此项研究的相关报道。徐泽水在《纯语言多属性决策方法研究》中探讨了纯语言多属性决策方法,文中定义了语言评估标度的运算法则,给出了一些基于语言评估标度的新算子,如纯语言加权算术平均(PLWAA)算子。本节在此基础上,探讨了纯语言加权算术平均算子在网络信息资源的评价中的应用。该方法具有计算简单的特点,同时能充分地保留已有的语言评价信息,实例分析证明该方法是行之有效的。
一、网络信息资源有效性评价指标体系
侯立宏[64]对网络信息资源评价指标体系和方法进行了综述。目前对于网络信息资源的评价尚处于探索发展阶段,因而呈现出仁者见仁、智者见智的格局。本节通过对文献侯立宏、朱庆华、金越、张咏、赵伟、张秀华和张晓青等人的研究成果的总结分析,得出一般网络信息资源评价体系主要包括信息资源的内容、信息的利用、设计及其他方面评价指标。具体如下:
(1)内容指标。内容指标包括:
①权威性:是否有著名专家、学者支持。
②准确性:内容是否准确,是否含有意识形态或其他倾向,是否有文字拼写或语法错误。
③新颖性:信息内容是否有创新性,信息在学科范围、形式、手段等方面与其他信息资源相比是否有独到、创新之处。
④时效性:网页内容是动态还是静态、更新速度与周期。
⑤具体内容:是独创还是翻版、是全部还是摘要、是自己站点还是链接。
⑥学科范围的广度和深度。广度是指资源主题范围覆盖哪些方面,资源是否集中在较窄的领域,它是否包括相关主题;深度是指提供的资源具体到何种层次。
⑦适用性:指网络信息资源是否和用户的实际需要相符合,网络信息用户的满意程度如何等等。
(2)信息利用指标。信息利用指标包括:
①传输速度:是否满足要求。
②检索功能:是否提供查询引擎、逻辑组配功能等。
③可获得性:信息资源服务器是否可靠地被链接,是否经常因为过分拥挤而提供不了服务,用户等待时间是否过长等。
④稳定性:网站所在的地址是否稳定且易记,是否出现空链、死链现象,资源是否可被稳定地访问。
(3)设计指标。设计指标包括:
①交互性:是否提供多种交互界面、联系方式,是否经常主动与用户联系,提供获得各类相关信息等。
②用户界面:信息资源是否便于用户使用,是否具有用户服务支持系统。
③多媒体设计:是否提供文字、声音和图像等多样化的媒体设计,使表现的网络信息资源、图文、声并茂,更直接、自然,易于理解。
④版面结构:版面是否清晰、方便使用。
(4)其他指标。其他指标包括:
①安全性:指网络信息资源在有效范围内保持稳定不变的特性。
②费用:指网络系统正常运行以及用户利用网络信息资源所需的开支、链接网络信息资源服务器的费用等。
二、纯语言加权算术平均(PLWAA)算子
考虑到评价者在进行定性测度时需要适当的语言评估标度,设事先给定的语言评估标度集为S={s1,s2,…,sl},一般S中的术语个数l为奇数。例如语言评价标度S={s1,s2,s3,s4,s5}={很差,差,一般,良,优},这里l=5。
为了避免丢失评价信息和便于计算,在原有标度S={s1,s2,…,sl}的基础上定义一个拓展标度槇S={s1,s2,…,sk},其中k是一个充分大的自然数。若i∈{1,…,l},则称si为“本原标度术语”;若i∈{l+1,…,k},则称si为“拓展标度术语”。(www.xing528.com)
语言评价标度集一般满足下列性质[63]:
(1)(有序性)若i>j,则si>sj;
(2)(存在负算子),即neg(si)=sj,使得j=l+1-i;
(3)(存在最大算子),若si≥sj,则max(si,sj)=si;
(4)(存在最小算子),若si≤sj,则min(si,sj)=sj。
下面定义语言评价标度的运算法则:
定义7.1.1 设则:
(1)语言评价标度加法运算定义为
(2)语言评价标度乘法运算定义为
定义7.1.2 设映射
W=(W1,W2,…,Wn)为纯语言加权向量,即Wi∈,若
PLWAAW(s1,s2,…,sn)=其中si∈
,i=1,2,…,n为纯语言数据,则称映射PLWAA为n维纯语言加权算术平均算子。
对于纯语言评价问题,设有m个评价方案,n个指标,评价方案集合A={A1,A2,…,Am},指标集合I={I1,I2,…,In}。设方案Ai对指标Ij的指标值为xij,其中xij∈S为语言评价标度,因此称矩阵为“纯语言评价矩阵”。
基于PLWAA算子,本节提出一种纯语言信息下的网络信息资源的评价方法。步骤如下:
第一步:评价者给出m个方案在n个指标集合下的网络信息资源纯语言评价矩阵X=(xij)m×n。
第二步:评价者给出n个指标集合下的纯语言加权向量W=(W1,W2,…,Wn)。
第三步:按定义7.1.2中的纯语言加权算术平均算子PLWAA计算每个方案的纯语言综合评价值。
第四步:根据计算的方案的纯语言综合评价值按标度集的有序性质进行方案排序。
三、基于纯语言信息的网络信息资源综合评价的实例分析
现对8个网站的信息资源进行评价。假设用4个评价指标,即内容指标、信息利用指标、设计指标、费用和安全指标来反映8个网站信息资源。专家给出4个指标的纯语言加权向量W=(W1,W2,W3,W4)=(s5,s4,s2,s3),采用5个纯语言标度,即s1=很差,s2=差,s3=一般,s4=良,s5=优。这8个网站在4个评价指标下的纯语言评价矩阵见“表7.1.1”。
表7.1.1 专家给出网络信息资源纯语言评价矩阵及其纯语言加权向量
按定义7.1.2中的纯语言加权算术平均算子PLWAA计算每个方案的纯语言综合评价值VA1:VA1=PLWAAW(s2,s3,s5,s3)
同理可以计算其他7个方案的纯语言综合评价值:
VA2=s56,VA3=s58,VA4=s24,VA5=s44 VA6=s50,VA7=s46,VA8=s37
按方案的纯语言综合评价值和拓展后标度集的有序性质进行方案排序得:
A3>A2>A6>A7>A5>A8>A1>A4
其中“>”表示优于。因为网站A3的纯语言综合评价值最大,所以网站A3是最优的。
本节在纯语言加权算术平均算子PLWAA的概念和纯语言运算法则的基础上,提出了基于纯语言信息的网络信息资源综合评价的方法,从而解决了网络信息资源采用纯语言信息可以做定量化的综合评价问题,因而本节的研究对网络信息资源做精确化的综合评价具有重要的理论和现实意义。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。