首页 理论教育 大数据概念与应用-大学计算机应用

大数据概念与应用-大学计算机应用

时间:2023-10-17 理论教育 版权反馈
【摘要】:即大数据是一个体量特别大,数据类别特别多的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。大数据的特征如下:数据量大:数据体量巨大,起始单位是PB级的。现实世界所产生的大数据虽然大,有价值的数据所占比例很小,价值密度低。商业价值高,只要合理利用数据并对其进行准确的分析,将会为用户带来很高的价值回报。

大数据概念与应用-大学计算机应用

维基百科对大数据的定义如下:大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。即大数据是一个体量特别大,数据类别特别多的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。

大数据的特征(4V)如下:

(1)数据量大(Volume):数据体量巨大,起始单位是PB级的。

数据存储的最小的基本单位是bit,按从小到大的顺序,这些计量单位可排列为:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。

按照进率1024(2的十次方)来计算:

1Byte=8bit 1KB=1 024Byte 1MB=1 024KB 1GB=1 024MB(www.xing528.com)

1TB=1 024GB 1PB=1 024TB 1EB=1 024PB 1ZB=1 024EB 1YB=1 024ZB

1BB=1 024YB 1NB=1 024BB 1DB=1 024NB

(2)数据类型多(Variety):结构化数据仅占约20%,非结构化数据约占80%,包括日志、音频、视频、图片、地理位置、邮件等数据类型。

(3)处理速度快,时效性要求高(Velocity):大数据的产生非常迅速,主要通过互联网传输。大数据对处理速度有非常高的要求,大数据往往需要在秒级时间范围内从各种类型的数据中获得高价值的信息,这一点和传统的数据挖掘技术有着本质的不同。

(4)价值(Value):是大数据的核心特征。现实世界所产生的大数据虽然大,有价值的数据所占比例很小,价值密度低。如一个小区中安装的摄像头,其采集的录像信息99.99%都是无价值的。商业价值高,只要合理利用数据并对其进行准确的分析,将会为用户带来很高的价值回报。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈