数字信息资源的出现对传统意义上的信息资源配置提出了新的要求与挑战。数字信息资源配置的主要任务就是利用现有的技术手段,以最小的成本优化配置数字信息资源,充分挖掘其潜在价值、配置效益与社会福利的最大化。由于在既有技术、资源条件下,数字信息资源的总效用趋向一个最大极限值,在配置过程中,数字信息资源在被用户使用与共享后,其总效用会出现损耗,直至趋于零值。数字信息资源总效用衰减至零时,也意味该资源对用户而言已不具备使用价值。由于数字信息资源在配置过程中效用损耗与使用价值涨落具有明显的周期性与阶段性,因此从资源配置的角度,数字信息资源的生命周期包括规划、开发、发布、利用、维护、评估、更新、迁移等阶段,本节着重探讨规划、开发、利用与评价这四个主要阶段。
(1)数字信息资源规划
在数字化环境下,信息资源的共享的形式与内容出现了多样化、复杂化的趋势,对信息资源配置的效率与公平提出了更高要求。由于数字信息资源创建的自由性与随意性,使得缺乏统一标准、结构各异但数量繁多的数据库构成了数字信息资源的源系统。而各个数据库由于在标准化体系上存在差异,从而形成众多相对独立的“信息孤岛”,妨碍了数字信息资源的有效共享与配置。因此,通过数字信息资源规划,实现数据库系统集成与资源共建共享是数字信息资源配置的先导性与基础性工作。规划是资源配置视角下数字信息资源生命周期的初始阶段。
数字信息资源规划理论可溯源至20世纪80年代初由美国学者詹姆斯·马丁(James Martin)提出的“信息工程方法论”。信息工程方法论的核心思想包括:所有信息系统的开发成功的关键首先在于顶层设计,管理高层必须全程掌握系统规划;信息系统的规划应当建立在用户需求分析基础上,信息系统从规划到实施都应有信息用户的参与;规划工作的核心是数据,要以数据为中心整合与集成信息资源。[12]1986年,高复先教授在国内首先提出信息资源规划的概念,认为信息资源规划是在总体数据规划的过程中进行数据管理标准化工作。通过数据标准化工作进一步完善总体数据规划,从而使总体数据规划成果能在集成化的信息系统建设中发挥作用。[13]虽然信息资源规划概念与理论是否适用于数字信息资源规划尚值得商榷,但作为一种方法论与工具,对于数字信息资源规划仍具有指导意义。
根据信息工程方法论与信息资源规划相关理论,数字信息资源规划的主要内容包括:数字信息资源标准化规划、数字信息资源集成和以资源为中心的系统设计。[14]数字信息资源标准化规划的主要目标是建立资源配置的基础标准,基础标准决定着数字信息资源配置的质量与效率。根据信息资源规划已有的理论、方法与实践,这些基本标准包括元数据标准、数字资源分类编码标准、人机界面标准、概念数据库标准与逻辑数据库标准。具体而言,元数据标准是指通过对元数据这一信息最小单位的标准化规范、识别编码,将用户所需的数字信息资源按照一定规则进行定义识别出所有的元数据,并由所有系统共同使用。数字资源分类编码标准则是按照数字信息资源的属性与特征对资源进行聚类与序化,并按照一定的标准体系与规则对资源赋以能够被人与计算机识别的编码。人机界面标准是对数字信息资源输入与输出系统的格式、数据流形式、显示模式的规范,以帮助终端用户对数字信息资源加以理解。概念数据库标准对数字信息资源全系统内所有主题数据库的界定,是对主题数据库的属性、特征与内容的描述。而逻辑数据库标准是通过一组标准化的数据结构,即基本表(base table)对概念数据库的细分,并将数字信息资源全系统内所有主题数据库分解出的基本表结构加以规范。通过上述“五项标准”的建立与执行,可以构建起数字信息资源配置各环节的标准化体系,实现资源的共建共享。数字信息资源集成主要包括系统层、资源层、应用层三个层面的集成。[15]系统层集成是对数字信息资源基础设施如资源载体、传播媒介、软硬件配置的集成,目标是消除数字信息资源系统间的异构性,实现系统间的无缝对接;资源层集成将类型不一、来源不同、格式各异的数字信息资源进行规范与聚类,实现逻辑上与形态上的一致与聚集,以利于资源的共享;应用层的集成是指根据用户需求,将某一功能的资源系统的应用与另一资源系统的应用进行集成,如数字信息资源采集系统与数字信息资源聚类系统的集成。数字信息资源集成能够有效利用数字信息资源全系统的运作效率,是数字信息资源规划的重要环节。以资源为中心的系统设计,根据信息工程的基本原理,信息系统的开发应以数据为中心而不以处理为中心,信息系统设计的目标是规范与控制数据流。而在数字化环境中,信息系统设计要根据用户的信息需求构建标准一致、资源共享的主题数据库,实现对开放式分布的数字信息资源与系统进行集成。同时,利用系统建模技术与工具,将面向资源的各种数据模型应用于规划,用于分析和评估数据流与数据库结构,使系统保持良好的动态扩容性,以利于各种数字信息资源的整合。以资源为中心的系统设计通过主题数据库的构建、系统建模避免了信息系统的分散开发,提升了信息系统的集成,改善了数字信息资源配置的数据环境,是数字信息资源规划的关键环节。
综上所述,数字信息资源规划的目标就是通过数据标准体系构建与标准化管理,实现系统集成和资源共享,以消除由于数据、系统与用户终端异构性而形成的“信息孤岛”,从而优化数字信息资源配置。数字信息资源规划是对资源本身、系统以及用户需求的全面规划,涉及数字信息资源配置的各个阶段,并决定着资源配置的效率与效用,因此数字信息资源配置是数字信息资源生命周期的首要环节。
(2)数字信息资源开发
数字信息资源是资源配置的基础性环节,所谓开发就是围绕用户的信息需求,将存储载体与传播媒介中的数字信息资源进行搜索、挖掘、重组与加工,并通过聚类、标引和建立导航,实现用户对于数字信息资源获取和利用。数字信息资源开发的主要方式是:数字信息资源基础设施建设,数字信息资源的开发与利用都是基于计算机硬件设施、数字通信网络以及各种用户终端等基础设施之上,基础设施的建设为资源数据库之间的信息交换与传输提供了通链路,实现数字信息资源创建者、持有者与用户彼此间的互联共享,从而为数字信息资源开发提供平台。数字信息资源集成建设。数字信息资源包括网站主页、数据库、数字化音视频文件、电子报刊以及各种数字化文献等,数字信息资源集成建设就是在基础设施上,按照一定规则标准对于各种资源进行中间技术处理,使其能够集成在统一的系统中,提高数字信息资源的利用效率。数字信息资源的深度挖掘是指对数字信息资源的结构挖掘、内容挖掘与用户行为挖掘。结构挖掘是挖掘数字信息资源节点间的链接结构关系,通过资源节点链接关联度的分析,对资源节点的分布进行归类与导航,有助于引导用户更快捷检索到相关资源;内容挖掘是对数据库、资源网络以及用户终端中的数字信息资源内容及其描述信息中获取潜在、有价值的知识,并通过揭示资源之间的关系,提升数字信息资源利用的相关性与专深性。用户行为挖掘,是指对用户利用信息资源的行为挖掘,从资源访问记录、Agent服务器日志、用户会话与交易信息、cookie信息等数据中,挖掘出潜在用户并抽取出有关用户兴趣、习惯以及忠诚度等行为模式的信息,为数字信息资源的个性化推荐、主动推送与智能代理等用户定制化服务创造了条件。
(3)数字信息资源的利用
数字信息资源的利用是指通过各种数字信息资源应用、检索和展示技术为用户提供有序化、规范化的数字信息资源服务,并为用户管理决策与问题求解提供信息保障的过程。数字信息资源利用主要方式有以下几种:①提供信息检索服务。根据用户需求,建立专业数据库系统,并通过数字信息资源索引工具,对源数据库、网站以及有用信息进行自动跟踪与排序,并通过人机交互界面向用户展示,以便为用户的数字资源检索决策提供参考。②提供数字信息资源导航。即根据一定的规则与策略,以学科领域、科研机构、专家学者以及专业数据库等导航单元,对导航单元的URL(包括http、gopher、ftp等)进行搜集、评估与组织,并自动生成摘要报告,揭示资源特征并序化推荐,以帮助用户准确获取数字信息资源。数字信息资源推送服务,即资源服务机构与用户签订委托协议,通过特定发布渠道,根据用户的要求定时、定量地把用户需要的资源自动推送到用户终端上。推送服务顺应数字信息资源动态性、时效性与针对性的特点,通过对用户信息行为的挖掘,建立个性化数字信息资源库,依托智能搜索引擎、信息筛选、信息代理等推送服务技术,从而能够准确、主动地向用户提供所需的个性化数字信息资源。③数字信息资源增值服务。通过构建镜像资源,建设虚拟馆藏,收费资源代理等方式对数字信息资源进行深度挖掘与加工,根据用户个性化需求不断提高数字信息资源服务的质与量,从而增强资源利用效用,实现数字信息资源的增值。数字信息资源增值服务包括效用增值与经济增值两个方面:效用增值是指对原始数字信息资源进行再加工,如浓缩、整序、重组,实现利用效用上的增值;经济增值则是通过数字信息资源的有偿营销,或是资源利用后产生的社会效益与经济效益的增加,实现数字信息资源的经济价值的增加。[16]利用是数字信息资源生命周期最重要的环节也是资源配置的目的。
(4)数字信息资源评价(www.xing528.com)
数字信息资源评价就是依据科学评价的基本原理,构建合理的评价指标与指标体系,运用多种有效的评价方法与工具对数字信息资源的内容、质量与价值进行评估与选择。由于数字信息资源创建的开放性与自由性,使得数字信息资源的发布与传播具有非受控、结构多样、无序化和可无限利用等特点。用户在通过计算机与通信网络获取海量数字信息资源的同时,也面临着信息过载与信息污染的问题,而丰富的资源来源也导致了数字信息资源质量异化的现象。因此,通过数字信息资源评估,建立完善的评估指标体系与运用科学有效的评估方法,是确保信息用户能够及时获取高质量的资源,提高信息用户的信息福利水平的关键。在另一方面,用户的信息福利水平反映了资源共享的公平性与均衡性,而数字信息资源共享是数字信息资源配置的出发点和归宿点,因此基于资源配置的视角数字信息资源评价可以被认为是数字信息资源生命周期的最终环节。
通过相关的文献调研发现,学界对于数字信息资源评价研究最早始于1991年理士曼(Betsy Richmond)对于网络信息资源评价“10C”原则的提出。此后,围绕数字信息资源评价,学界展开了一系列的研究,产生了大量学术成果。总体而言,对于数字信息资源评价研究可以分为定性评价、定量评价与综合评价。[17]
数字信息资源的定性评价是指按照一定的评价标准和指标体系从主观角度对数字信息资源的优选与评估。定性评价一般是根据用户的要求与评价目的,通过主观思辨分析相关的评价标准并构建指标体系,然后通过统计调查、专家问卷或头脑风暴等方法对资源的评价标准进行评定排序,最终结合评价体系给出资源的评价结果。例如,理士曼提出的网络信息资源评价的“10C”原则,即内容(content)、置信度(credibility)、批判性(critical)、版权(copyright)、引用(citation)、连续性(continuity)、审查(censorship)、连接性(connectivity)、可比性(comparability)和范围(context)。又如,美国南加州大学哈里斯(Robert Harris)教授针对网络信息资源真实性提出的评价“CARS检验体系”(CARS Checklist),即:置信度(credibility)、准确性(accuracy)、合理性(reasonableness)和支持度(support)。而我国学者张咏将网络信息资源评价分为三个层次,即第一个层次为基本要求指标,适用于所有资源评价的通用指标;第二个层次为主题领域要求指标,适用于特定主题领域;第三个层次为用户专题要求指标,适用于特定专题资源评价。并构建了相应的指标体系。[18]这些都属于对数字信息资源的定性评价。由于定性评价受到主观因素影响较大,因此在实际操作中存在评价指标设置可信度与可测度的问题,对于同一数字信息资源多次评价的结果往往差异较大,评价结果缺乏说服力。
数字信息资源的定量评价是指根据数量分析方法,从客观量化的角度对数字信息资源进行优选与评价。由于定量分析依托数字信息资源系统中计算机、通信网络与数据库自动生成的机读数据,并按照科学、客观与系统的数量分析方法,因此可以弥补定性分析存在主观偏差的不足,评估结果可信度较高。目前,对于数字信息资源的定量分析方法应用较多的是网络计量学方法。网络计量学是指“采用数学、统计学等各种定量方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以便揭示其数量特征和内在规律的一门新兴分支学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科,也是信息计量学的一个新的发展方向和重要的研究领域”。[19]网络计量学方法不是单一的网络信息资源统计分析方法,其已经在数据采集与数据分析两个方面发展出了一系列专门方法,如链接分析法、网站双引聚类分析法、网络影响因子、网络信息流量计量方法等方法。以链接分析法为例,该方法运用网络数据库、数学分析软件等工具,利用数学(主要是统计学和拓扑学)和情报学方法,对通过网络链接数字信息资源进行分析,并揭示其数量特征和内在规律,并用以解决各方面问题的一种研究方法。Google搜索引擎所采用的page rank算法就是利用链接分析评价网络上的数字信息资源,并按资源的评价顺序提交结果报告,供用户选择参考。
数字信息资源的综合评价,就是定性分析与定量分析两者有机结合起来,将定性分析的逻辑推理与定量分析的客观规范灵活运用,从而综合完整的评价数字信息资源。数字信息资源综合评价的主要方法有层次分析法、线性回归分析方法、模糊综合评价法、数据包络分析方法等。
层次分析法是20世纪70年代初美国运筹学家萨蒂(T.L.Saaty)提出来的,是一种定量分析与定性分析相结合的多目标决策分析方法,该方法应用网络系统理论和多目标综合评价方法,将决策总体分解成目标层、主准则层、分准则层,在分层的基础之上,将描述评价对象的多项指标信息加以汇集,进而从整体上认识评价对象的优劣,是一种有效地将那些复杂、模糊不清的相互关系转化为定量分析的方法。我国学者邱燕燕曾运用层次分析法构建网络信息资源评价指标体系,并证明层次分析不失为信息资源评价的好方法。[20]
线性回归分析方法,线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法之一,运用十分广泛。分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。张东华、索传军采用统计中的线性回归方法构建了量化的数字信息资源评价模型,并基于用户问卷调查结果对评估参数进行计算,初步验证了评估模型的合理性。[21]
模糊综合评价是一种运用模糊数学原理分析和评价具有“模糊性”的事物的系统分析方法,能够解决传统方法难以解决的“模糊性”评价与决策问题,这种方法考核的对象可以是方案、产品或是各类人员。模糊综合评价的数学原理,以数字信息资源评估为例来说明,首先考虑到影响数字资源评估量的确定是模糊的,也就是在确定了数字资源的评估指标体系之后对各因素指标标准首先不做定量处理,而是由评估专家对各因素指标标准进行模糊选择,然后统计出专家群体对评估因素指标体系的选择结果,再按照所建立的数学模型进行最后计算。模糊评估法的过程就是先从定性的模糊选择入手,然后通过模糊变换原理进行运算取得结果。[22]
数据包络分析(Data Envelopmnt Analysis,DEA)方法是在相对效率概念基础上发展起来的一种系统分析方法,由著名科学家查恩斯(A.Charnes)和库珀(W.W.Cooper)以及罗兹(E.Rhodes)于1978年提出。数据包络分析是一种非参数的统计分析方法,按照多指标投入和多指标产出,对多个同类型对象即决策单元进行有效性评价。数据包络分析方法可以通过若干个有代表性的数字信息资源系统作为决策单元,调研其投入、产出情况,构建数据包络分析模型,确定各决策单元是否资源配置有效。[23]
对于数字信息资源的评价是全面、系统的工作,任何一种评价方法都有其特点与局限,较之单一定性分析与定量分析,综合分析能够结合两种方法的优长,在客观、科学的基础上克服了主观偏向对于评价的影响,因此十分适用于多维度、复杂化的数字信息资源评价。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。