科学数据是最基本、最活跃的科技资源,既是科技创新活动的重要产出,也是新一轮创新活动和经济社会发展的重要基础和工具,对科技进步与创新、经济增长、社会发展以及国家安全都发挥着重要的作用。科学数据较其他科技资源而言特征显著,如可无损复制和传播,具有时效性、分散性、多结构性、再创造性等,不同数据之间往往是零散分布,需要相互关联才能充分体现其价值。随着数据库技术、计算机技术、网络通信技术等现代信息技术的快速发展,科学数据的采集、管理和使用一体化向相对分离方向转移,数据的传播、共享日益受到重视;科学数据的管理不再只是保存与保管,增值加工、关联发布与数据服务受到越来越多的关注。
国内外机构从不同视角对科学数据内涵的理解侧重点不一。例如,美国航空航天局在对美国政府资助的科学数据进行管理时,指出数据应该包括观测数据、元数据、数据产品、信息、算法,包括相关的源代码、文档、模型、图片和研究结果。美国自然科学基金委员会在其出版的报告中将数据描述为那些以数字化形式存储的数据资源,包括文本、数值、图片、音视频、软件、算法、公式、注解、模型等(NSF,2005)。也有研究者认为科学数据包括两种相关的类型:一类是开放的政府数据;另一类是在大学或研究机构通过政府资助的研究项目中的科研活动所产生的数据(KG Jeffery et al,2014)。我国也有学者认为科学数据资源通常可以分为两大类型:一类是行业部门按照统一的规范标准长期采集和管理并用于科学研究的数据(业务数据);另一类是国家各类科技计划项目在研究过程和结果中产生的,以及为支持科学研究而通过观测、监测、试验等站点采集的科学数据(研究型数据),这两类数据都是科学数据共享中必须进行筛选整合集成,并为科技创新提供支撑服务的数据资源(孙九林,王卷乐,2009)。
本章所涉及的科学数据资源主要包括自然科学技术领域中的数值数据、空间数据、图形数据、文本数据、统计数据、多媒体数据等。其内容可以概括为:
(1)通过长期观测、试验所获取的描述事物、现象分布格局与变化过程数据;(www.xing528.com)
(2)通过科学考察、调查所获取的描述事物、现象的情景数据;
(3)通过实验、测试分析所获取的描述物体(含生命体)特征的数据;
(4)科技应用、研究活动中所产生和积累的具有科学价值的数据和相关信息。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。