科学数据标准的制定和应用是科学数据共享的重要保障,科学数据的采集、存储、整合、使用的水平和效率有赖于其标准化和信息化程度,并贯穿科学数据的全生命周期管理,包括制定科学数据标准规范,规范科学数据采集、加工、汇交、存储和共享各个环节的管理,以及分级分类进行质量控制、保藏与共享等多个方面。
3.3.2.1 科学数据的规范化与质量控制
我国各学科领域普遍重视科学数据的标准化,在实际科学研究过程中已实现标准化处理的科学数据占比也越来越多。例如,地震领域科学数据建设与管理以本行业制定的数据标准为基础,对原始科学数据须从数据采集、数据处理、数据交换、数据汇交等全过程进行严控质量控制,高质量、高标准的科学数据占比在不断提高。气象领域建立了自己的标准化网站,并形成了包括气象国际标准、国家标准、行业标准等近1000项。截至2015年底,在国家科技基础条件平台中,农业、林业、工程、人口与健康、物理化学和地球系统等领域遵循的各级各类科学数据标准和规范已超过200项,并且数量呈逐年增长态势。
在科学数据标准化程度不断提高的同时,科学数据的质量控制手段也在不断改进和丰富,并形成共性与特性相结合的多手段质量控制体系。许多领域在科学数据资源整合过程中,已经建立了适应于本学科领域的数据质量控制体系。例如,国家气象科学数据共享服务平台针对实时资料组织开展了台站级、省级、国家级三级实时资料质量控制体系建设,启动了自动气象站实时观测资料的质量控制技术研究,建立了全国自动气象站实时资料质量控制系统。国家地球系统科学数据共享服务平台在科学数据资源建设方面由“三位一体”到“四位一体”又到“六位一体”发展,即实现数据实体、元数据、数据文档、数据缩略图、数据样例和数据类型标签等的规范化。质量控制手段的加强和规范化水平的提高使各领域的科学数据质量明显提高。
3.3.2.2 科学数据管理的信息化水平
科学数据管理的信息化程度反映了科学数据资源积累和处理的技术能力,当前我国近90%的重大科研基础设施已经实现了科研数据的自动化采集,70%以上实现了自动录入网络传输。部分科研设施开发了专用传输系统,如大亚湾反应堆中微子实验根据实际需求,实验组内自主开发了科学实验数据传输系统(SPADE),满足大亚湾实验数据采集、传输、分发的自动化运行,并通过网络进行传输。中国遥感卫星地面站经过30年的不断发展,已形成了完整的卫星数据接收、传输、存档、处理、分发体系,即以北京总部的运行管理与数据处理中心、密云站、喀什站、三亚站、昆明站为数据接收网的运行格局,数据接收系统、数据传输系统、数据处理系统、数据管理系统、数据检索与技术服务系统协同运行,成为我国对地观测领域的核心基础设施之一。2015年,地面站成功实现了我国空间科学首发星——暗物质粒子探测卫星的数据接收。(www.xing528.com)
另一方面,随着数据挖掘技术的快速发展,科学数据分析和挖掘能力得到很大限度的提高,各领域科学数据呈现出新的活力。如在医药领域,在新药研究开发过程中,应用数据挖掘技术寻找先导化合物,指导中药的研究和开发,缩短了中药研究开发的周期。
3.3.2.3 科学数据的整合管理与评价
目前,通过专门的国家科学资源管理机构,对现有科学数据资源所涉及的农业、林业、地震、气象、地球系统以及人口与健康等多个学科领域进行整合管理。截至2015年底,科学数据类基础条件平台建设累计整合和管理科学数据超过700 TB,已在六个领域支持建成了科学数据共享平台,包括100余家参建单位,分布在全国31个省份,为科技创新和经济社会发展提供大量数据服务,已成为相关领域科学数据共享的重要机构。科学数据类基础条件平台依托各资源优势单位,积极部署科学数据建设与管理工作,持续加强科学数据规范化建设与整理,同时积极开展面向科技创新和经济社会发展需求的科技资源服务。
2015年科技部、财政部共同印发开展国家科技基础条件平台绩效考核与评估工作的通知,对科学数据平台的年度运行服务与科技资源管理情况进行评估评价,对科学数据管理特别是对重大科技创新活动的支撑保障能力提出了更高的要求。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。