3.2.3.1 数据的分级分类
数据分级分类对于严谨高效的数据管理非常重要。科学数据的分类就是根据其不同的学科、观测手段、自身属性等特征加以区分和类聚,并将区分的结果按照一定的次序进行归类。科学数据的分级则主要根据科学数据的社会属性,包括其投资主体、价值特性和应用领域来划分,目的主要是指导科学数据共享的健康有序开展。
1)科学数据的分类
(1)依据数据的学科体系分类,可以分为一级学科、二级学科、三级学科等。
(2)依据数据获取方式分类,可分为观测数据、探测数据、实验数据、研究数据等。
(3)依据数据载体分类,可以分为纸质数据、磁带数据、光盘数据、网络数据等。
2)科学数据的分级方法
(1)依据数据的保密级别和重要程度,一般可以分为绝密、机密、保密、内部、公开五级,如气象数据分级是指按照国家和中国气象局保密规定,对气象数据的共享和提供利用划分保密等级。气象数据在对外提供服务工作中分为绝密、机密、保密、内部、公开五级。
(2)依据数据被处理的级别,以Landsat遥感数据为例,依据其是否经过辐射校正、几何校正、集合校正,以及利用DEM纠正地势起伏差造成的视差又分为1到4共4个级别。
(3)根据数据价值特征,可以分为原始数据、初级加工数据、精细加工数据等。
(4)根据付费方式,可分为有偿、无偿两类。其中,无偿方式是指酌情收取必要的复制和交付资料所需的成本费外,不再收取任何数据采集和存档所花的费用;有偿方式是指除收取资料复制和交付成本费外,酌情收取必需的资料加工处理费用。(www.xing528.com)
3.2.3.2 数据的描述
数据的描述主要是指对数据集详细内容的说明,以便用户更好地使用数据。描述内容包括:数据的名称(中/英)、数据单位、值域、版本、格式、空间范围、时间范围、数据质量评价、数据生产背景、处理方法、处理步骤、安全限制等级、数据维护信息(更新频率、更新机制)、元数据信息等。
(1)名称。数据集的中文名称是赋予数据集的单个或者多个中文字词的指称,是唯一的,应尽量采用各领域已有名称或行业习惯用语,以方便数据集的使用。数据集中文名称要求用词精准,能够准确传达要表明的含义。
(2)格式。数据格式是从业务角度规定的数据格式需求,包括所允许的最大和/或最小字符长度,数据值的表示格式等。
(3)值域。数据值域是根据相应属性中所规定的数据格式而决定的数据的允许值的集合。
(4)单位。数值型数据取值的计量单位应该依据各学科领域的行业标准或国家标准进行。
(5)版本。版本是指在一个数据平台内的一系列逐渐完善的数据规范中,某个数据集发布的标识。
(6)覆盖范围。覆盖范围包括时间和空间范围。空间范围包括:经纬度等地理界线,也可以说明数据集所覆盖的空间区域范围,如省市名称等。时间范围包括:起始时间、结束时间和时间频度等。
(7)数据质量。数据质量包括数据质量总体评价信息、数据集的产生背景、处理方法和处理步骤等具体信息。
(8)标识。科学数据标识用于唯一标识科学数据资源的一组字符,用于科学数据资源的编目、注册、发布、查询、维护和管理。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。