数据可视化分为数据与可视化两部分。读者在阅读可视化作品时,可能会错误地认为,好看的图表才是可视化的精髓。实际上,数据可视化的核心是数据。
本章简单介绍数据的采集、清洗、挖掘方式,并通过若干实战案例,帮助读者迅速理解数据对于数据可视化的重要性。
虽然本书以数据可视化命名,但是我们依然要重申一个概念:数据可视化的核心是数据而非可视化。
这并非是说可视化无用,而是说明一个简单的道理:如果我们无法理清数据本身在说明什么问题,那么再花哨、好看、精致的可视化作品都是无用的。数据可视化是基于作者对于数据的理解,进行再次阐述,让读者能够更好地理解数据本身的一种工具作用。
如果你在企事业单位、政府机关或是咨询公司从事数据处理工作,你会发现,市面上所风行的可视化设计并不实用。公司中所使用的BI报表界面并不能达到设计网站上所展示的设计作品的效果:大公司所使用的Tableau,Fine report等成熟的可视化分析软件在展示效果上不如E-chart,D3等源代码开发工具。这是因为真正的从事数据软件开发的程序员着重的是系统分析、数据分析及业务分析、而非可视化设计。只有对业务场景与数据本身有了较深刻的理解,所完成的可视化分析系统才是有价值的。(www.xing528.com)
这个现象也从侧面说明为何目前数据可视化的概念已相当普及,可视化设计师层出不穷,然而可视化依然被归类为新兴产业板块,毕竟数据与视觉设计是两个完全不同的专业方向。
那数据究竟是什么?
数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合,是可识别的、抽象的符号。
超出数字的概念,数据可以是图片、影像、文字信息。在计算机环境下,一切能被结构化或非结构化的单位都可统称为数据。以下从数据的采集、清洗、分析、探索等板块对数据进行基础性的介绍。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。