研究大数据的先驱麦肯锡给出这样的定义,大数据是一种规模在获取、存储、管理、分析等方面都大大超出了常规数据库软件工具能力范围的数据集合。具有海量的数据规模、快速的数据流转、多样的数据类型与价值密度低的四大特征。[1]学者维克托·迈尔–舍恩伯格则认为,大数据关注的是所有数据而不是随机样本,它并不注重精确性,而是注重多样与混杂性,它放弃对因果关系的追求,取而代之的是对相关关系的关注。[2]
我们所处的时代是一个人人有终端、物物可传感、处处可上网、时时在链接的时代。从科学研究到电子商务、从医疗卫生到社交娱乐,数据信息都呈爆发式增长。互联网公司已被海量数据包围,谷歌公司每天处理的数据是美国国家图书馆所有纸质藏书所含数据量的上千倍;脸书上人们在网站上点击“喜欢”按钮或写评论的次数,每天都超过30亿次;截至2012年,Twitter上的信息发布量,每天都会超过4亿条。[3]
人们自己生成并分享了与自己相关的大量信息;同时,也有大量的信息在信息主体没有参与甚至不知情的情况下,通过他人及相关机构生成。我们的搜索历史、位置信息、网页浏览习惯、阅读习惯,休闲爱好、信用信息[4]等,被采集与使用的程度都远远超过我们的想象。互联网公司以前所未有的方式储存、分析用户的个人数据,而它们采集、分析数据的能力也与日俱增。[5](www.xing528.com)
大数据给我们的生活、工作与思维带来了急剧变革。移动互联的发展、手持设备的兴起、智能终端的普及、新型传感的应用都快速渗透到了地球上的每个角落。随着信息技术的发展,新的创新形式——大数据,呈现的是一种信息处理的能力。它能在极短的时间里筛选、分类、访问大量的数据信息。过程涉及数据挖掘、提取、储存、预测分析与对分析结果的应用等。
数据信息中潜藏的价值刺激了各路竞争者对数据的挖掘。大数据成为一种新的经济资产,如同货币或黄金。当今的技术可以进行前所未有的数据匹配,反匿名化操作,数据挖掘,这些都归因于广泛存在的数字档案与信息技术的发展。我们向互联网企业提交个人信息换取便利,我们向国家敞开胸怀以获得保护,我们把数据信息储存在云端,我们将个人的点滴生活在社交网络上分享。而个人信息的收集方式、使用目的及影响后果日趋失控,个人信息的保护被前所未有地放置于洪荒之地,面临严峻威胁。当大数据的技术成为一种革命力量席卷全球时,我们需清醒地认识到个人信息保护面临的严峻威胁。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。