【摘要】:大数据是当前网络空间数据资源及其开发利用的一种表现。严格地说,到目前为止,还没有一个明确的大数据定义,各领域按照自己的理解来研究和发展大数据。大数据的4V定义[3,4]涵盖了所有技术型定义,也是影响最广泛的,但在具体理解和具体问题面前,还是引起了很多争论。例如,常常会争论一个数据集是不是大数据?因此,价值和时效是大数据的核心内涵[5]。
大数据是当前网络空间数据资源及其开发利用的一种表现。严格地说,到目前为止,还没有一个明确的大数据定义,各领域按照自己的理解来研究和发展大数据。大数据的4V定义[3,4]涵盖了所有技术型定义,也是影响最广泛的,但在具体理解和具体问题面前,还是引起了很多争论。例如,常常会争论一个数据集是不是大数据?即够不够大,是否达到了PB(拍字节,1PB=1015 BYTE)级别。显然,这只是问题的表面。问题的核心是:一个数据集是否有价值、是否值得去开发、能否挖掘出价值;能否在希望的时间内挖掘出价值。因此,价值和时效是大数据的核心内涵[5]。
信息技术(information technology, IT)企业已经开始在大数据领域战略布局,发布各种形式的大数据产品,形成围绕大数据、利用大数据的新产品形态、新业务模式。大数据价值在金融、商业、交通、社交、医疗健康等许多领域已经得到了越来越多的有效验证,大数据应用也革命性地改变了所涉及产业的形态。人们已经认识到数据是一种重要的资源,价值巨大,但在开发利用数据资源的过程中遇到了技术问题,需要研究新技术和新方法。(www.xing528.com)
从大数据与相关技术的关联关系上来看,互联网、物联网、云计算等技术的发展为大数据提供了基础。互联网、物联网提供了大量数据来源;云计算的分布式存储和计算能力提供了技术支撑;而大数据的核心是数据处理。其中传统的数据处理技术经过演进依然有效,新兴技术还在不断探索和发展中。数据挖掘技术成为高效利用数据、发现价值的核心技术。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。