“数据”的含义很广,不仅指1011、8084这样一些传统意义上的数据,还指“dataology”“上海市数据科学重点实验室”“2013/09/06”等符号、字符、日期形式的数据,也包括文本、声音、图像、照片和视频等类型的数据,而微博、微信、购物记录、住宿记录、乘飞机记录、银行消费记录、政府文件等也都是数据。
数据是指能够输入到网络空间中的任何东西,是指网络空间中唯一存在的,是可度量的、可处理的、可观测的,并占有空间的。直观上,可以对数据进行如下分类:
1)依据数据表示的含义来划分
从数据表示的含义来分,数据可以分为两类:一类是表示现实事物的数据,称为现实数据;另一类则不表示现实事物,只在网络空间中存在,称为非现实数据[1]。
(1)现实数据主要包括:
①感知数据——通过感知设备(如温度传感器、天文望远镜)感知现实世界获得的数据,包括感知生命的数据。这类数据是现实世界的直接反映。
②行为数据——人类科学研究、劳动生产、生活行为等所产生的数据。这类数据是人类行为的直接反映。
(2)非现实数据种类繁多,目前还不能很好地进行分类,举例如下:
①计算机病毒——能够自我复制和传播的计算机程序,只在数据界中存在,而在自然界没有映射。
②网络游戏——包括与自然界对应的场景映射到数据界中,也有只在数据界中的游戏场景设置。
③垃圾数据——没有任何含义的数据。
2)依据数据的权属来划分(www.xing528.com)
数据权属还没有法律的界定,从情理上看,数据非天然,数据理应属于数据的生产者。但实际情况往往比较复杂,从目前数据的生产和数据被占有的情况来看,数据可以分成如下类别:
(1)私有数据:指个人或组织自己生产、自己保管、非公开的数据,这类数据权属清晰。
(2)多方生产的数据:大部分数据是由很多方共同生产的,如电商平台、银行、电信、医院等的数据都是多方生产的。电商平台的数据是由购物者、网店卖家、支付系统、物流系统、平台等共同生产,这些数据的权属没有界定。电商数据目前基本上是电商平台占有并获取利益,购物者和卖家没有主张权利。但是,如果医院的数据被医院占有并谋取利益,民众就会强烈反对。因此,这类数据的权属有待法律界进行法律界定,以避免数据的灰色地带和数据黑产。
(3)政府数据:主要指政务数据、政府财政投资生产的数据,以及国有企业数据。这部分数据权属属于政府。
(4)公网数据:主要是指发布在公共网站上的数据,这些数据能够通过搜索引擎访问到。如果按照目前的物权法和知识产权法,这类数据权属属于数据的原创者,也是不能随便下载使用。但是,在公共网络上下载数据是普遍的行为,应该受到法律的保护。因此,这类数据的权属也同样有待法律界进行法律界定。
3)依据数据的组织形式来划分
从数据的组织形式来看,数据主要有下列一些组织形式:
(1)专用格式数据:有相当多的数据是由专用数字化设备产生的数据,如医学影像数据(X线片、MR、CT等)、遥感数据。还有一些是GIS、多媒体等数据。这些数据的处理需要专门的设备或专门的软件。
(2)通用格式数据:在信息化早期,大多数数据库是存储在通用数据库中的,由通用的数据库管理系统来管理。这些数据库结构清楚,处理方便。
(3)互联网数据:互联网上的数据门类和格式繁多,还包括很多垃圾数据、病毒数据,关键是找到有用的数据。由于互联网数据的形成,使得整个网络空间中的数据更加显现出自然界的一些特征。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。