首页 理论教育 如何考虑数据量级?

如何考虑数据量级?

时间:2023-06-25 理论教育 版权反馈
【摘要】:大数据在哪里才有用武之地[1]大数据伴随着数据的真实性。因此,大数据能够使数据在一定程度上具有普遍的代表意义,使数据具有预测未来趋势的功能,丰富数据的层次,使之多元化、多维化。大小之辨大数据中可以穿插细节方面的数据,所谓粗中有细。所以,在选用大数据的同时,可以结合一些较小范围内的对象进行细节方面的调查。大≠泛、空、假大数据并不在“大”,而在于“有用且大”,这里的重要性已经在前面提及。

如何考虑数据量级?

(1)大数据在哪里才有用武之地[1]

大数据伴随着数据的真实性。在说明大数据用武之地之前,让我们先了解大数据的4V特点:volume(大量)、velocity(高速)、variety(多样)、value(价值)。通过这四个方面,我们能够比较立体地体会什么是所谓的“大数据”,并借此更好地理解数据统计中的真实性如何实现。

volume(大量)指的是数据量的大小决定所考虑的数据的价值和潜在的信息。

velocity(高速)指获得数据的速度及数据所具有的时效性。可见,数据的“大”与“快”是紧密相连的,数据需要具备大数据的特征,同时也要保证时效性。

variety(多样)指数据类型的多样性。要保证数据类型的多样性,就要保证数据来源的多样性。这样才能保证可视化的结果比较全面、客观且多样。

value(价值)指大数据之间的链接。数据本身没有意义,只有当数据与其他事物链接之后,才能体现其意义与价值所在。

因此,大数据能够使数据在一定程度上具有普遍的代表意义,使数据具有预测未来趋势的功能,丰富数据的层次,使之多元化、多维化。(www.xing528.com)

了解了4V特征之后,我们继续考虑,大数据在哪种情况下有用武之地。

(2)大小之辨

大数据中可以穿插细节方面的数据,所谓粗中有细。因为大数据自身具有一定弊端,无法很好地反映细节。大数据是较为模糊的,虽然能够客观地反映普遍性,却不能很好地反映其特殊性。所以,在选用大数据的同时,可以结合一些较小范围内的对象进行细节方面的调查。大中有小,粗中有细,才能够更加全面地反映客观事物的本来面目。同时,一切以自身的需求出发,根据自身的需求——需要表现的内容,来决定大数据与细节数据的比重分配。

(3)大≠泛、空、假

大数据并不在“大”,而在于“有用且大”,这里的重要性已经在前面提及。很多产生于庞大日志文件库的大数据,在没有明确其对应的分析对象前,我们根本无从下手,无异于是一堆废铜烂铁。大数据不应当是空洞的数据,同样需要坚实的业务场景做支撑,应当言之有物。对象的价值含量、挖掘深度远比数字本身来得重要。举个例子:对于淘宝之类的互联网购物平台而言,用户进行窗口浏览时所留下的庞大数据对于销量数据而言毫无用处,是不折不扣的空数据、假数据、垃圾数据;但换个场景,我们基于这些数据,结合用户实际消费记录,可以完成“猜你喜欢”等大数据模型,在这个模型中,这些数据记录了用户的每一次犹豫和最终选择的关系,浏览数据便是宝贵的财富

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈