首页 理论教育 理解大数据的三个特征及其隐患

理解大数据的三个特征及其隐患

时间:2023-06-13 理论教育 版权反馈
【摘要】:国际知名的大数据权威专家麦尔荀伯格研究的结果认为,大数据的分析具有三个特征:全样而非抽样、效率而非精确、相关而非因果。对于大数据,简单的理解就是:你对任何事情或任何情况了解越多,你就可能更可靠地预测将来会发生什么。大数据给了我们前所未有的洞察力和机会,但也引发了一些担忧和问题:首先是数据隐私问题。谁掌握数据资料以及资料分析方法,谁就将在这个大数据时代胜出。

理解大数据的三个特征及其隐患

美国高德纳咨询公司(Gartner)对于“大数据”(Big data)给出了这样的定义:“大数据是一种信息资产,它需要新的处理模式来操作,才能具有更强的决策力、洞察力和流程优化能力,从而来适应海量、高增长率和多样化的数据。”

麦肯锡全球研究对“大数据”(Big data)的定义是:一种规模非常大的数据集合,大到在获取、存储、管理、分析方面远远超出了传统数据库软件工具的能力范围,它具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

简单来说,大数据就是海量、庞大而丰富的资料,这些资料规模非常巨大,以至于无法通过现在的主流软件工具、在一定的时间内实现采集、管理、分类,最后整理成为对人们有用的资讯。

2011年,麦肯锡全球研究院发布的《大数据:下一个创新、竞争和生产力的前沿》研究报告最早提出“大数据”这个词汇。后来,在高德纳咨询公司技术炒作曲线和2012年维克托·舍恩伯格《大数据时代:生活、工作与思维的大变革》的宣传推广下,大数据的概念开始风靡全球。

科学电脑技术尚未普及的早期,要分析大量的资料是非常困难的,但电脑科技和网络科技的快速发展,以及存储资讯成本的降低,使得这些存储的资讯能够被轻易按照一定的条件搜索出来,使资料搜集与分析变得简单可行,大数据也逐渐变得简单。

大数据的科学研究之路其实是颠覆人工智慧之路,过去人们试图让电脑理解人类发出的指令,但经过多年的研究,发现电脑理解力远不及想象中的那样好,最后只有放弃,就利用电脑不会累的特性来做大量资料的分析和匹配运算。

国际知名的大数据权威专家麦尔荀伯格研究的结果认为,大数据的分析具有三个特征:全样而非抽样、效率而非精确、相关而非因果。这样的结论更颠覆了传统的统计思维。因为传统统计方法需要抽取样本,来推估未知母体参数的真实值。然而,在分析样本的过程中,为推算最合适的母体参数值,估计量通常必须满足不偏性、一致性及有效性。

对于大数据,简单的理解就是:你对任何事情或任何情况了解越多,你就可能更可靠地预测将来会发生什么。通过比较更多的数据点,以前被隐藏的关系将开始显现,这些关系有望包含我们如何开始改变的见解。

该过程基于我们可以收集的数据建立模型,然后运行模拟,每次调整数据点的值,并监视它如何影响我们的结果。这个过程是自动化的——今天先进的分析技术将运行数以百万计的这些模拟,调整所有可能的变量,直到找到有助于解决问题的模式或洞察力。(www.xing528.com)

谷歌有一个“谷歌流感趋势”的研究,它通过分析搜索关键字的相关资料来判断全美及各地区的流感情况。它曾经对某些地区做出过准确判断:流感已经进入“紧张”级别,发出警告要人们少出门,避免染病。

大数据给了我们前所未有的洞察力和机会,但也引发了一些担忧和问题:

首先是数据隐私问题。

大量的数据包含了许多个人隐私信息,这是我们有权保持隐私的权利,如何保护我们的隐私,如何保证我们的隐私不被泄露,也是越来越多的人在关注的问题。

其次是数据安全问题。

即使我们同意某人由于特定目的拥有我们的数据,但是我们无法保证他们能保持数据的安全。

农业社会人们以土地为核心资源,工业时代转为能源,资讯社会则将变更为数据资料。谁掌握数据资料以及资料分析方法,谁就将在这个大数据时代胜出。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈