【摘要】:大数据是一个涵盖多种技术的概念,简单地说,就是从各种类型的数据中,快速获得价值的能力。IBM将“大数据”理念定义为4个V,即数量、多样性、速度及价值密度。
麦肯锡在研究报告中指出,数据已经渗入到每个行业和各个领域当中,人们逐渐重视对海量数据的运用,因为互联网、移动互联网、物联网和云计算的快速普及,使得当前数据的增长比历史上任何时期都要快。
大数据是一个涵盖多种技术的概念,简单地说,就是从各种类型的数据中,快速获得价值的能力。
IBM将“大数据”理念定义为4个V,即数量(Volume)、多样性(Variety)、速度(Velocity)及价值密度(Value)。
数量(Volume):是指数据量的巨大。
多样性(Variety):主要包括结构化数据、半结构化数据和非结构化数据。
(1)结构化数据:主要存在于关系数据库中。(www.xing528.com)
(2)半结构化数据:包括电子邮件、文字处理文件以及大量发布在网络上的新闻等。
(3)非结构化数据:广泛存在于社交网络、HTML、报表、物联网、电子商务之中。随着移动计算和传感器等新技术的发展,超过80%的数据属于非结构化数据。
速度(Velocity):实时获取需要的信息。
价值密度(Value):对于大数据来说,数据的价值密度低,以视频为例,在连续不间断的监控过程中,有用的数据仅仅只有一两秒。通过算法完成数据价值的“提取”,是以沙里淘金的过程。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。