大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce那样的框架来向数十、数百或甚至数千的计算机分配工作。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。大数据呈现出“4V1O”的特征。
1.1.7.1 数据量大(Volume)
是大数据的首要特征,包括采集、存储和计算的数据量非常大。大数据的起始计量单位至少是100TB。通过各种设备产生的海量数据,其数据规模极为庞大,远大于目前互联网上的信息流量,PB级别将是常态。
1.1.7.2 多样化(Variety)
表示大数据种类和来源多样化,具体表现为网络日志、音频、视频、图片、地理位置信息等多类型的数据,多样化对数据的处理能力提出了更高的要求,编码方式、数据格式、应用特征等多个方面都存在差异性,多信息源并发形成大量的异构数据。
1.1.7.3 数据价值密度化(Value)
表示大数据价值密度相对较低,需要很多的过程才能挖掘出来。随着互联网和物联网的广泛应用,信息感知无处不在,信息量大,但价值密度较低。如何结合业务逻辑并通过强大的机器算法挖掘数据价值,是大数据时代最需要解决的问题。(www.xing528.com)
1.1.7.4 速度快,时效高(Velocity)
随着互联网的发展,数据的增长速度非常快,处理速度也较快,时效性要求也更高。例如,搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法要求实时完成推荐,这些都是大数据区别于传统数据挖掘的显著特征。
1.1.7.5 数据是在线的(On-Line)
表示数据必须随时能调用和计算。这是大数据区别于传统数据的最大特征。现在谈到的大数据不仅大,更重要的是数据是在线的,这是互联网高速发展的特点和趋势。例如好大夫在线,患者的数据和医生的数据都是实时在线的,这样的数据才有意义。如果把他们放在磁盘中或者是离线的,显然这些数据远远不及在线的商业价值大。
总之,无所遁形的大数据时代已经到来,了解大数据的基本特征,并快速渗透到每个职能领域,如何借助大数据持续创新发展,使企业成功转型,具有非凡的意义。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。