1)科学数据的分级分类管理
不同学科领域的科学数据在生命周期的管理阶段中有诸多差异,例如有些数据重在实验观测和归档管理,有些领域的数据则重在后期分析处理和甄别筛选。因此,要根据各学科领域数据的特点,梳理适当的数据分类体系,例如按数据获取方式观测类、实验类、考察类、调查类等数据的分类管理,按照科学数据密级进行分类管理等,建立分级分类管理框架,完成科学数据有序存储和归档。同时需要针对不同类型学科领域科学数据的特点,着力加强其薄弱环节的管理,促进数据资源的高效采集和获取、分析和处理、共享和服务。
2)以信息化技术为支撑的科学数据管理和运行
全面提升科学数据管理和运行过程中的软硬件技术支撑能力,是增强从庞杂的数据集合中获取知识和信息的重要保障,也是提高科学数据治理能力的重要基础。在软件方面,目前是我国在科学数据管理和运行支撑能力的短板,发达国家早已把软件系统与科学数据管理、实验设备建设放在同等重要的位置上,而在我国尚未得到足够重视。如面向多学科交叉研究的大科学装置平台在实验中产生大量科学数据,始终难以管理、集成和共享,迫切需要应建立高效的、以信息化技术为支撑的数据采集、归档、管理、共享服务的技术体系。在硬件保障方面,需要进一步提升我国科学数据高效率低成本的存储能力,准确可靠的大规模数据传输能力,快速高效的数据运算能力,以及可靠安全的容灾备份能力。(www.xing528.com)
3)科学数据信息挖掘技术和知识获取
对海量异构科学数据进行综合分析和深入挖掘,是大数据时代数据密集型科学研究的主要特点和重要基础。世界各国和知名科研机构在抢占数据资源的同时,都在积极探索和研发科学数据资源和信息挖掘技术和方法。在科技发展的历程中,我国首次与世界主要发达国家站在大数据时代的同一起跑线上,要充分认识到数据挖掘的重要意义,加大科学数据分析挖掘技术方法研究,特别是围绕重大需求,以“互联网+”为契机和手段,促进多类型科学数据资源融合,综合运用关联、聚类等分析方法,提升科学数据利用效率和水平。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。